這個世界生成與消耗的token正在激增,。AI的價值開始從芯片流向包括云服務與模型調用的AI基礎設施,但是進一步流向應用,依然是雷聲大雨點小。
進入2025年的最后一個季度,AI巨頭每個月消耗的token數量,已經來到了千萬億(Quadrillion)的量級。這一數字很快還會繼續倍增、以數量級增加。網頁上的內容,AI生的已經開始超過人類發布的。
月初,谷歌AI Studio負責人Logan Kilpatrick披露,公司最近一個月消耗了1300萬億tokens。OpenAI也在宣傳旗下API每分鐘調用了60億tokens,按該業務占公司收入25%折算,整個公司也達到了每月消耗1080萬億tokens水平。上周,字節跳動稱,過去一個月的日均token調用超過30萬億,相當于每個月900萬億,動態來看,相當于躋身“千萬億俱樂部”。
![]()
如此龐大的token消耗量,真正爆發,也就幾個月的時間。與這段時間相對應的,是多模態與智能體相關產品的滲透。它們都太吃token了。如果說,用戶與AI進行一次對話,消耗的token數量為1個單位,那么,生成一段10秒鐘的視頻,消耗的token差不多是前者的3000倍,如果是深度研究,那么更是消耗了單次對話的百萬倍之巨。
![]()
無論是視頻生成,還是智能體應用,都將繼續引領行業的token消耗。OpenAI想把自己的獨立應用Sora打造成短視頻的TikTok,開啟新的貨幣化路徑;奧特曼甚至想學馬斯克,后者的Grok在X上通過“擦邊”,吸引了不少流量;OpenAI甚至開始推出成人內容,可能想起了互聯網早期是如何打開流量局面的。谷歌上周匆忙發布了Veo 3.1,它的Shorts已經加入了AI。字節跳動則通過豆包海外版Cici,悄然搶占拉美與東南亞市場。所有這些,都成為消納token的新出口。
如果視頻生成試圖牢牢占據消費者心智與時間,那么智能體想蠶食的就是軟件世界。就在這半個月內,OpenAI、Google、Anthropic三家大模型企業,都在智能體領域有所動作。在開發者日,OpenAI提出了AgentKit等一系列工具。幾天后,谷歌發布了Gemini CLI Extensions,打造智能體的Gemini生態。又過了一周,Anthropic新推出更輕量級的Claude Skills,將智能體功能“封裝”在“文件夾系統” 里,方便低門檻地嵌入工作流。
消耗token數量,已經成為一家企業AI含量的評估指標之一。已經至少30家企業,在OpenAI的平臺上,調用了超過1萬億的tokens;此外,還有70家企業消耗了1千億以上。
按去年的標準,萬億token這一數量級,可以嚇人一跳。如果一次簡單對話,平均輸入輸出1000個tokens,那么,單個用戶足夠對話10億次;如果主要是輸出,每秒鐘吐出100個token,單個用戶需要盯著屏幕300多年。但是,按照最近的標準,萬億tokens也就夠產出1000份深度研究報告,一家咨詢機構的研究員們想拿它做點早期調研工作,很快就花完了。如果按GPT-5的API價格計費,這差不多花費百萬美元左右。
B2B服務正在積極買單。穿透到它們所服務的終端用戶,OpenAI這些萬億token消耗量的大客戶們,往往擁有龐大的用戶規模與高頻的調用需求;它們往往非常害怕錯過,被時代所拋棄,愿意花錢試一試。事實上,它們也往往不依賴單一模型。
在OpenAI公布出來的名單中,開發者工具占比最高。代碼審查的CodeRabbit、AI軟件工程師的Cognition、AI終端的Warp,以及IDE和開發工具的JetBrains等等,都消耗了海量token,肯定遠超萬億級別。其次就是鼓吹AI-First的傳統SaaS服務,包括Salesforce、HubSpot與Zendesk等。大模型帶來了垂直深度的企業服務市場,法律AI助手的Harvey,醫療AI文檔的Abridge等AI原生應用也由此誕生。
但是,問題在于收益,尤其是具備用戶黏性的經常性收益。以光速獲得的收益,也許也會以光速失去。買家的熱情可能是情緒性的。部分AI企業對外宣傳的年度經常性收益(ARR),很可能是一次性的實驗性收益。智能體服務更深地嵌入到客戶系統與工作流中,需要花費大量時間與精力,也是維持用戶粘性的摩擦成本。
最典型的之一,就是曾經的“氛圍編碼”(Vibe Coding),紅極一時。但人們在嘗試、付費之后開始流失。僅用8個月就成為AI獨角獸的Lovable,已經開始回歸12周前的熱度。RolystAI與Datainsta創始人認為,過去的“氛圍編碼”明星都在“死去”;除了Base44,因為它還在燒錢打廣告。
谷歌開發者智能高級總監Nicole Forsgren認為,代碼行數是衡量生產力的糟糕的指標,AI生成代碼加速并不意味著項目開發加速。美國METR研究所分析開發者的實際工作產出時,發現使用AI的開發者完成任務的速度,竟比不使用AI時慢了20%。
![]()
關鍵在于用了這些token都干什么了,能帶來什么收益。消耗的token越多,意味著花費的成本越高。要想token經濟學成立,而且不是在芯片廠商與AI基礎設施廠商之間空轉,要打通token經濟學最后一環,提升并兌現這些token的價值。
目前,行業做的并不好。投資者兼作家Azeem Azhar估算,2025年與人工智能相關的數據中心年度支出約為4000億美元,而同期人工智能收入約600億美元。入不敷出,比互聯網早期的光纖基建的泡沫時期還嚴重,后者資本支出僅為收入的4倍。
這也包括那些拿到了OpenAI萬億token消耗獎章的公司。它們當中有不少上市公司,包括語言學習應用Duolingo,設計軟件Figma,企業服務HubSpot與Salesforce,在今年的AI泡沫浪潮中,市值不升反降。Duolingo是最積極擁抱AI的企業之一,從2021年開始就與OpenAI達成合作,也是OpenAI官網公布的首批GPT-4用例企業。但是,它大幅減少人工內容,引發了社區爭議;它的部分功能的本身,也可以逐步被大模型所取代。事實上,按照常識,愿意如此公開的,往往已是AI應用的佼佼者,更多的企業收益或許更低。
而那些未上市的AI獨角獸企業,估值仍在膨脹。企業搜索聊天機器人Glean,去年年度經常性收入約1億美元,今年年中融資后估值72億美元;AI搜索平臺Perplexity的ARR約1.5億美元,當前估值約200億美元。FT報道說,還有不少年經常性收入約為 500 萬美元的初創企業正在尋求 5 億美元以上的估值;這令當年的SaaS熱潮也相形見絀。
它們許多在工作中并不好用,沒有兌現最值錢的那部分價值。有的可以部分增強人類的工作,但完全不是它所宣傳的那樣能替代員工。
行業對AI促進基礎科研與完成經濟價值任務,充滿了過度的期待。OpenAI一位高管在推文中宣稱 GPT-5 “解決”了多個長期未解的數學難題,但事實證明,這些問題其實已有解,只是未被收錄或廣為人知,GPT-5做的,不過是檢索到了這些文獻檢索,而非創新證明。這遭到了哈薩比斯 (Demis Hassabis)、楊立昆(Yann LeCun)等競爭對手的嘲諷。
這當然并不意味著,AI最終無法如最狂熱的支持者所宣稱的那樣,變成一場新的技術革命。但“最終”可能意味著漫長的等待。要實現token經濟,打通最后一環,仍然需要解決很多技術問題與產品問題。
業內的大佬們正在冷靜下來。年中的時候,蘋果指出了大模型思考的幻象(The Illusion of Thinking),但由于,AI追趕遲緩了,還被質疑酸葡萄心理。但最近,強化學習之父 Richard Sutton的發言真的震撼到業界。他認為大模型根本沒有學到“”,智能應該從“運行時”的經驗中生長出來。此言一出,那些奉“苦澀的教訓”為“圣經”的人們,不得不重新各自解讀。
大神卡帕西是的一位。上周,他也對智能體、強化學習與AGI潑了一盆冷水。在他看來,傳統的強化學習,信號效率極低,反饋又極其嘈雜,短期內不再看好,未來需要幾次重要的算法更新;他還認為,智能體的能力還沒跟上,工具卻已經做得過頭,沒有現實地匹配當前能力和行業需求。即使樂觀地看,我們離所謂的AGI也還要10年。
OpenAI研究副總裁Jerry Tworek則打了個圓場,認為自己正在做的事情離AGI可能不遠,但對另一部分人來說可能并不如是。團隊正在完善預訓練方法,也在對強化學習作大量研究。OpenAI內部正在讓模型工作更長時間,但還沒找到合適的產品形態,來部署這種
黃仁勛把數據中心稱為生產token的AI工廠,英偉達負責以越來越低的成本生產token。所有軟硬件協同創新,都是為了以更少的GPU時間和更低的電力消耗產出更多的toke,但是,這些token能創造什么經濟價值呢?
如果說2025年是AI基礎設施真正爆發的一年,那么,2026年需要成為追逐token價值的一年。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.