從訓練到推理,AI的核心度量正在從算力投入(FLOPS,每秒浮點運算次數(shù))轉(zhuǎn)向有效產(chǎn)出(tokens)。
2024年,未盡研究的報告《AI改變能源》,估算了2030年中國所需要的智能算力總量,以及相對應的電力需求總量,采用的正是FLOPS的指標;2026年,最新報告《首屆AI世界杯》,估算了賽事期間全球AI推理規(guī)模及觀眾使用情況時,采用的則是tokens的指標——這是FIFA近年來統(tǒng)計歷屆世界杯的收視(人頭數(shù))、流媒體流量(比特數(shù))之后,首次用token來刻畫這一宏大的人類科技應用場景。
2024/08/07 完整閱讀 > 2026/03/08 完整閱讀 >
算力基礎設施正在復刻電力基礎設施的統(tǒng)計邏輯。FLOPS對應著“裝機量”,tokens對應著消耗量——它衡量著數(shù)據(jù)中心的實際負載。在智能經(jīng)濟時代,圍繞token的使用強度、終端用戶結(jié)構(gòu)與邊際成本展開的統(tǒng)計與分析,將像用電量之于工業(yè)經(jīng)濟一樣,成為理解智能經(jīng)濟運行的關(guān)鍵指標,也展示出中國宏觀經(jīng)濟日益高質(zhì)量的一面。
企業(yè)是公布token消耗量的先行者,未盡研究在國內(nèi)較早跟蹤并分析主要AI企業(yè)token數(shù)據(jù)。谷歌曾披露,在2024年4月,公司當月消耗了約9.7萬億tokens。這也是科技巨頭最早公開披露token消耗量的官方記錄之一。此后,谷歌與字節(jié)跳動均會不定期公開這一指標,以揭示AI應用落地的速度與程度。與FLOPS類似,token并不是的完美指標。但它仍是當下衡量AI巨頭市場地位不可或缺的維度。
對token消耗量的重視,正在向組織內(nèi)部延伸,也定義著一些企業(yè)關(guān)鍵的戰(zhàn)略方向。部分硅谷企業(yè)正在將員工的每日token消耗量(TDP)視為運營考核指標。今年,阿里巴巴將旗下AI業(yè)務重組至阿里token事業(yè)群(ATH),要圍繞創(chuàng)造token、輸送token、應用token大做文章,這樣一來,token將成為其基礎運營指標。不知將來它是否會加入谷歌與字節(jié)的行列,在電話會議中對當季token的消耗與產(chǎn)出披露一二。
官方統(tǒng)計也在迅速跟進智能經(jīng)濟快速發(fā)展的現(xiàn)實。這一次中國跑到了美國前面。盡管token尚未進入中國官方統(tǒng)計文件,但已開始在重要政策場合被頻繁引用。
昨日,在中國發(fā)展高層論壇2026年年會上,國家數(shù)據(jù)局局長劉烈宏關(guān)于“智能經(jīng)濟新形態(tài)”的演講,就提到:2024年年初,中國日均token調(diào)用量為1000億;至2025年底,躍升至100萬億;今年3月,已突破140萬億,兩年增長超千倍。在今天的國新辦新聞發(fā)布會上,劉烈宏局長再次引用了這個數(shù)據(jù),并明確其中文名為“詞元”——這個詞的確發(fā)生于對自然語言中的單詞進行切分,盡管后來也進入圖像、視頻、聲音等其他模態(tài)。
在官方定義中,token是大模型處理信息的最小單元,具有可計量、可定價、可交易的潛在屬性。圍繞token的調(diào)用、分發(fā)與結(jié)算,一套新的價值體系正在形成。它不僅是智能時代的“用量指標”,也可能成為連接技術(shù)供給與商業(yè)需求的“結(jié)算單位”,為AI商業(yè)模式提供可量化的基礎。
然而,與電力不同,token的統(tǒng)計遠未標準化,其測算本身仍充滿不確定性。一方面token產(chǎn)出取決于算力供給能力,另一方面也取決于算力需求的增長速度。兩年前,中國短暫經(jīng)歷過智算中心的“閑置”。芯片乃至整個基礎設施的性能、模型的算法,以及應用場景對高吞吐還是低延遲等工作負荷的選擇,不同技術(shù)路徑與業(yè)務形態(tài),都會顯著改變token的生成與消耗結(jié)構(gòu)。
3月19日,在華為中國合作伙伴大會2026上,華為高級副總裁李鵬就稱,中國日均token消耗量已躍升至180萬億。略高于國家數(shù)據(jù)局披露的數(shù)據(jù),但仍處于同一數(shù)量級。類似的差異,反映的是口徑與方法尚未統(tǒng)一。
再早一個月,在“AI 2028危機”報告刷屏的時候,我們也曾估算,在春節(jié)期間,全球日均token消耗已經(jīng)超過了300萬億。結(jié)合中國與美國在全球AI競爭中的領導地位,我們的估算,與前兩家基本靠譜。
2026/02/24 完整閱讀 >
未盡研究的估算邏輯是,當前階段,由于算力緊缺,token增長實際上主要由算力供給約束,是一個賣方市場。既然如此,不如多聽聽英偉達CEO黃仁勛是怎么說的。
算力緊缺的證據(jù)相當充足。美國的科技巨頭、云巨頭和新云企業(yè)(neocloud),對AI基礎設施的大規(guī)模投資,從2025年才真正開始。中國科技公司亦是如此。在此之前,AI應用的滲透率也較低,這意味著供給與需求的波動,都會動輒數(shù)量級地放大token消耗量。這也是過去兩年中國token調(diào)用量能夠“千倍增長”。
這一供給約束,在企業(yè)層面表現(xiàn)得尤為明顯。AI應用日益走向代理化(Agentic)與多模態(tài),今年以來編碼及工作智能體迅速滲透知識經(jīng)濟、OpenClaw掀起個人智能體熱潮、視頻生成借助春節(jié)等場景在中國迅速普及,不斷創(chuàng)造新增需求,算力資源的分配高度緊張,處于拆東墻,補西墻的階段。Anthropic所有套餐(消費者版、專業(yè)版、企業(yè)版、API 版)都存在使用量限制和費率上限。騰訊的策略則是“減少了對外出售,以保證自用算力充足”
![]()
算力供給緊張,將持續(xù)相當一段時間。它是系統(tǒng)性的難題。在全球范圍內(nèi),包括AI芯片與HBM,它們的先進制造及先進封裝產(chǎn)能都面臨長期不足;在美國,緊缺更表現(xiàn)為電力基礎設施的供給不足。分析師Dylan Patel認為,很快AI產(chǎn)業(yè)的瓶頸將轉(zhuǎn)移至下游半導體制造設備,尤其是EUV光刻機產(chǎn)能。
既然當前的token增長,本質(zhì)上不是用戶需求的釋放,而是算力供給的釋放,那么,在這一體系中,英偉達所代表的算力供給側(cè),就居于統(tǒng)計的核心位置。沒有人比黃仁勛更懂token與AI工廠。他開始圍繞設計高效產(chǎn)出token的工廠,聯(lián)合了200多家合作伙伴,是最接近較全面掌握token經(jīng)濟的人。
在今年CES的主旨演講中,黃仁勛提到,每年在推理階段生成的產(chǎn)生的token數(shù)量會增長5倍。他在GTC 2026上還說,下一代的VR NVL72,可以提供比GB NVL72高35倍的tokens產(chǎn)出。
![]()
這兩個數(shù)據(jù)其實并不矛盾。因為VR NVL72無法在發(fā)布之后,一夜之間完成部署。AI芯片的出貨,本身就需要經(jīng)歷一段時間的產(chǎn)能爬坡。截止到2026年一季度,也就是當下,按出貨量計,Blackwell系列也尚未完全超過Hopper系列。更何況,電不到位,通電的數(shù)據(jù)中心建筑(Warm Shell)不到位,GPU買的再多,也只能躺著吃灰。微軟CEO納德拉就承認,公司犯過這樣的錯誤。
至此,讓我們簡單推算一下。去年10月,谷歌公布日均消耗43萬億tokens。當時,谷歌模型在OpenRouter市場占比25%。那么,當時全球相當于日均消耗170萬億tokens。加上更多因素,我們也就因此可以保守估算出,今年世界杯舉辦的6月至7月期間(共計39天),全球日均tokens消耗量超過535萬億。
不過,隨著英偉達逐步失去它在算力市場的壟斷地位,也包括中國加快形成自主完整的AI算力生態(tài),以及AI從供給約束逐步轉(zhuǎn)向需求驅(qū)動,統(tǒng)一的token計量標準將變得愈發(fā)重要,這是智能經(jīng)濟市場真正形成的標志。
伴隨著一些地方政府通過“養(yǎng)龍蝦”政策表現(xiàn)出來的AI+的熱情,以及國家對建設智能體經(jīng)濟與社會的重要里程碑的確立,預計地方政府也將很快公布自己的token消耗統(tǒng)計數(shù)據(jù),在北京、上海、杭州、深圳等為代表的城市之間,形成你追我趕的態(tài)勢。
附:
我們的估算方法及數(shù)據(jù)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.