![]()
![]()
Token是AI云的重要組成部分,但將其等同于AI云本身,或作為唯一衡量標準,仍為時過早且不夠科學。它無法全面呈現中國數字化市場的復雜性和多樣性
文|吳俊宇
編輯 | 謝麗容
隨著云計算從以CPU(中央處理器)為核心的通用計算,逐步走向以GPU(圖形處理器)為代表的智能計算,AI云正在成為中國乃至全球云市場的共識。
在這一過程中,MaaS(模型即服務)平臺正在成為繞不開的一環。因為,通過MaaS調用模型、消耗 Token(詞元),已經是企業使用AI云的一種重要形式。
過去一年,圍繞Token的調用量、增速、規模乃至排名,討論明顯升溫(詳見《》)。近一年,國內外云廠商(包括亞馬遜AWS、微軟Azure、谷歌云GCP,阿里云、百度智能云、火山引擎)都在不同時間、不同程度地披露了自己的Token消耗相關情況。
Token甚至像流量一樣,成為重要統計指標。國家數據局2025年8月數據顯示,2024年初中國日均Token消耗量1000億。截至2025年6月底,中國日均Token消耗量突破30萬億。一年半時間增長了300多倍,這反映了中國AI應用規模的快速增長。
換句話說,當下的AI云市場,Token正成為部分從業者眼中的“北極星指標”。所謂“北極星指標”,可理解為“核心指標”,指企業內能代表最終成功,指引所有團隊努力方向的指標。它像北極星一樣,為整個組織提供清晰、統一的戰略指引。
之所以會出現這種狀態,一個重要原因是,Token是當前最直觀、最容易量化,也最容易比較的指標之一。它有極高的敘事效率——既方便市場傳播,也容易被資本和客戶理解。
這個觀點得到了多位行業人士的認同。一位中國云廠商架構師對我們表示,商業世界往往更偏好簡單、清晰的單一指標。2025年6月,一位國際市場調研機構分析師在一場小規模討論提到,AI云市場發展初期,Token調用量相對容易衡量。但他同時認為,長期來看營收規模才是更重要的指標。
當一個指標被當作“北極星”,它是否也可能遮蔽其他重要事實?答案是肯定的。
其一,無論是在中國還是美國,當前各大云廠商的Token收入,在整體云收入中的占比仍然較低。至少在目前,Token市場的規模,尚不足以單獨支撐起云市場的整體增長。
其二,現有的Token統計存在盲區。市場調研機構披露的Token消耗量,大多基于公共云MaaS平臺的API(應用程序接口)調用數據。但由于技術和部署方式的限制,它很難全面覆蓋所有應用場景。這意味著,發生在GPU云租賃、私有化部署,以及制造、汽車、機器人等設備端的AI算力使用,往往并未被完整計入。這可能會低估AI的真實使用規模。
其三,在企業真實IT采購邏輯中,Token更多是使用之后的結果,而非核心采購決策依據。企業決策往往圍繞AI是否能夠進入業務流程、能否降低成本等問題展開。Token消耗量,通常不會在采購階段被單獨列為核心指標。
簡單理解,Token是AI云的重要組成部分,但將其等同于AI云本身,或作為唯一衡量標準,仍為時過早且不夠科學。它無法全面呈現中國數字化市場的復雜性和多樣性。
![]()
Token市場規模到底有多大?
通過MaaS平臺使用Token,這代表了相當一部分前沿開發者、AI創新企業的前沿需求。無論是中國、美國云廠商,都對這部分市場保持著戰略關注。
包括亞馬遜AWS、阿里云等在內的全球云廠商,都在積極探索如何擴大MaaS業務規模。
亞馬遜AWS管理層2025年10月財報電話會議披露,長遠來看,Bedrock(亞馬遜AWS的MaaS平臺)收入貢獻將與EC2(亞馬遜AWS的CPU和GPU計算實例業務,總營收占比超過30%)不相上下。但亞馬遜AWS管理層未披露,Bedrock收入的詳細統計口徑,以及上述目標的具體實現時間。
我們了解到,阿里云在2025年11月末啟動了“百煉戰役”,目標是短期內將百煉(阿里云的MaaS平臺)Token調用規模提升三倍以上。阿里云還為之成立了專門的銷售組織。在字節跳動旗下的火山引擎,Token收入已是銷售團隊KPI考核核心指標之一。
2025年12月末,阿里云智能集團資深副總裁、公共云事業部總裁劉偉光在一場小規模溝通中對我們表示,他認同亞馬遜AWS對MaaS收入長期增長的判斷。他的看法是,當模型能力持續增強、Agent(智能體)逐步成熟,并覆蓋大量IT能力有限的長尾企業后,MaaS收入在云廠商整體收入的占比,有可能達到30%甚至更高。但他同時強調,目前行業仍處于早期階段,過早給出明確的市場規模或占比,并不具備現實意義。
多份市場調研數據表明,目前Token市場增速很快,但在AI云市場規模仍然有限。短期內,它尚不足以單獨支撐起中國云市場大盤的整體增長。
國際市場調研機構Omdia 2025年9月數據顯示,2024年中國AI云市場規模約29億美元,其中AI IaaS(基礎設施)23億美元,占比79%;AI PaaS(平臺軟件)5.6億美元,占比24%;AI MaaS收入規模0.3億美元,占比1%。
Omdia預測,2025年中國AI云市場規模將增長至72億美元,2030年將增長至268億美元。2030年AI MaaS市場規模將達到25億美元。按照這一預測,AI MaaS 2030年在AI云市場占比約為9%。
![]()
我們了解到的情況是,2024年中國主要云廠商Token收入總和不超過10億元。2025年各個云廠商Token收入增長均大幅增長。目前Token收入高的云廠商超過10億元,但Token收入低的云廠商約為數億元。在一些規模相對較小的云廠商收入結構中,Token收入可能達到10%左右。但在頭部云廠商收入結構中,Token收入占比僅為1%左右。
圍繞Token收入未來的增長空間,行業內部也存在不同測算。Omdia預測相對保守,市場上也存在一些更樂觀的預測口徑。
中國某ICT硬件企業的一位資深戰略規劃人士2025年7月曾對一些中國云廠商未來可能的Token收入進行了敏感性測試(一種根據商業模型,綜合外部市場條件變化進行市場動態分析的方法)。
他對我們表示,如果Token價格依舊維持當前水平,他測試的結果顯示,某中國云廠商Token調用收入未來1年-2年可能增長至40億-70億元。但他同時強調,這一測算高度依賴模型能力、應用滲透率及Token定價的變化,并不等同于行業整體判斷。
按照這種增長預判,Token收入在部分云廠商的營收大盤占比會更大,可能會成為部分新興云廠商的主要營收增長來源。但它在短期內(未來1年-3年)仍無法構成中國AI云市場大盤的核心增長來源。
某國內頭部云廠商的一位高管和國內某大模型平臺業務負責人在2025年12月在兩場不同的對話中,分別對我們表達了同一個觀點:AI云市場仍處于早期發展,如果過于強調Token市場的規模乃至排名,容易用短期指標替代對長期增長結構的判斷。
上述中國大模型平臺業務負責人提到,他所在的云廠商并未參與Token相關爭論。在他看來,中國云廠商關于Token敘事的差異,并非AI云技術路線的根本分歧,而是客戶結構與歷史業務基礎不同而導致的差異。
他進一步解釋,阿里云強調多形態并存(GPU云租賃+MaaS調用+私有化部署)并非保守,這是因為它誕生16年形成了龐大多樣的客戶結構(互聯網、金融、制造、公共部門、中小企業、AI創業企業和前沿開發者等),它需要尊重所有客戶需求。火山引擎更強調Token是因為,豆包App等公司內部業務Token消耗占比高,云業務的核心客戶以前沿開發者、AI創業公司為主。Token消耗增長快,這是“后來者”容易講清增長敘事的一條路。
![]()
Token統計中存在哪些盲區?
AI云仍在發展早期。一個高度復雜、仍在快速演進的技術體系中,單一指標一旦被賦予過多意義,往往也容易遮蔽一些更難被量化卻更關鍵的事實。
目前,使用AI算力的形式非常多樣——通過公共云租賃GPU部署模型、采購GPU服務器進行模型私有化部署后進行后訓練或強化學習、MaaS平臺調用Token、端側算力部署模型等都是主流方案。
![]()
不同類型的企業通常傾向于采用不同的方案。比如,大型互聯網公司通常習慣租用GPU云服務。政企行業(如金融、能源、制造等行業)和公共部門主要是采購GPU硬件進行私有化部署,AI創業公司和前沿開發者則是傾向于選擇MaaS平臺調用Token。在汽車、機器人、行業設備場景中,往往又是通過本地或邊緣環境使用算力。
此外,每一家企業的AI算力使用形態,都不是單一的。據我們了解,阿里云70%的企業客戶,租用GPU云服務的同時,也通過MaaS平臺調用Token。深度使用AI的企業,通常是多形態并存。
某零售企業的數字化策略負責人對我們表示,他們在AI應用PMF(產品市場匹配)驗證階段,優先通過MaaS平臺調用模型進行可行性測試,因為Token計費方式更靈活、試錯成本更低。當AI應用進入大規模部署階段后,傾向于租用GPU實例,因為長期成本結構更可控。
此外,某國內云廠商的一位資深架構師也對我們表示,他走訪客戶發現,一些制造企業既采購GPU硬件進行私有化部署,也使用MaaS平臺。其中,數據敏感型的業務使用本地算力,非敏感業務通過MaaS平臺使用Token。他認為,Token計費靈活,這客觀上加速了制造企業的上云進程。
我們通過綜合調研了解到,某社交媒體、某支付平臺每年云支出(含計算、存儲、網絡、數據庫、MaaS等公共云產品)高達數十億乃至百億元。這類頭部互聯網企業,2025年直接通過MaaS平臺使用Token的費用,在整體云支出中的占比為極低的個位數。
一位頭部社交媒體相關人士2025年11月曾對我們表示,他所在企業的云支出仍以計算、存儲、網絡、數據庫為主。AI算力相關投入以GPU云租賃、自建推理與訓練集群等方式為主,MaaS產生的Token消耗少之又少。
另一個重要事實是,中國市場可被統計到的Token消耗,主要集中在娛樂、對話等To C(面向消費者)的移動互聯網場景。這類應用更容易通過MaaS調用模型,更容易在早期形成可觀的Token規模。但更廣闊的To B(面向企業級)領域,目前仍在AI應用早期,未來增長潛力更大。
綜上所述,真實Token使用場景,遠比統計口徑更復雜、多樣。由于技術所限,不同機構很難全面掌握所有場景的Token使用情況。如果只看單一的統計數據,很容易得出彼此矛盾的結論。
國際市場調研機構IDC 2025年數據顯示,截至2025上半年,阿里云在中國大模型公有云服務(即Token市場)占比為27.0%,位居第二。阿里云在這里似乎是被低估的。
OpenRouter是全球大模型API聚合平臺,集成了全球主流模型,它反映了全球前沿開發者和AI創新企業的使用習慣。OpenRouter數據顯示,2025年阿里Qwen系列模型全球Token消耗量長期位居全球第六,占比約為4%-7%。這在國內位居前列,超過IDC統計中的其他廠商。阿里云在這里似乎排名又更高。
這種“矛盾”的成因是,阿里的通義千問、通義萬相等都是開源模型。IDC無法統計到開源模型被使用的情況。OpenRouter主要覆蓋通過聚合平臺發生的調用Token,又難以統計云廠商自有MaaS平臺內部、企業私有化部署、端側推理以及真實總量。
![]()
因此,無論采用哪種單一統計口徑,都無法反映市場真實全貌。這些方式,都會低估中國AI落地的真實情況。
國際市場調研機構Gartner在《2026年十大戰略技術趨勢》給了一個更全面的解釋——2028年60%以上的企業級AI模型將采用特定領域模型(DSLM)(根據特定數據集訓練的AI模型,準確性、合規性更高),它們可能同時通過云、本地、設備、MaaS部署。
某中國云廠一位資深人士對我們總結稱,前沿開發者、AI創新企業、企業PMF驗證階段習慣通過MaaS平臺調用API使用Token,這部分數據最容易統計。公共云租賃GPU部署更適合互聯網或其他大型公司大規模部署階段的需求。通過私有化或本地部署(On-premise)算力,則符合金融、政府等數據合規要求的機構。端側算力,適合于汽車、機器人等低延時場景需求。后三種Token消耗都難以被統計。
在他看來,嚴格定義廣義Token消耗量,要把MaaS平臺、公共云GPU推理集群產生Token、私有化模型部署產生Token,設備端模型產生的Token全部統計在內。
![]()
![]()
Token是企業IT采購重點嗎?
在討論Token的規模、增速與統計口徑之前,一個更基礎、卻常被忽略的問題是:大型企業在采購AI云服務時,究竟是如何做決策的?
在多數企業的真實IT采購邏輯中,Token更多是AI應用投入運行后的成本指標,而非采購決策階段被單獨衡量的核心依據。因為,從企業CIO(首席信息官)、CTO(首席技術官)的視角來看,Token消耗量并不能直接和業務價值掛鉤,更多是和成本掛鉤。
Token本質上是模型調用的技術計量單位,它類似CPU使用率、GPU小時數。因此,無論是在互聯網企業、制造業,還是金融、能源與公共部門,它們在引入AI能力時,真正衡量的首要業務價值是——能否提高收入,能否降低成本,能否縮短流程周期。
多位企業IT負責人曾對我們表示,CIO、CTO考量中的真實AI落地流程大致分成兩階段。
第一階段是,Agent能否擺脫獨立外掛,進入業務流程并與之深度融合。經過概念驗證階段的小規模試用后,Agent如何真正長期、穩定地參與業務運行。這要求模型能力,系統穩定性、延遲、可靠性,以及與既有IT架構的兼容性,都達到可控水平。在這一階段,企業更關心“能不能用”“敢不敢用”,而不是“用了多少Token”。
在第二階段,成本與效率逐漸浮出水面。只有當Agent已經被部署進具體業務場景,開始持續運行之后,他們會開始考量成本問題。其中包括云成本,還包括人力、外包、系統維護以及流程摩擦所帶來的隱性成本。在企業的成本核算與優化體系中,模型調用頻次、Token消耗量以及由此帶來的算力成本是云賬單的一部分。在這樣的決策邏輯下,Token的角色更接近于運營指標,而非采購指標。
一位中國大型企業集團數字化部門技術人士對我們表示,他們最關注的,不是模型調用消耗了多少Token,而是Token帶來了多少算力成本。因為AI應用的Token成本難以預測,不像過去是買斷制、訂閱制軟件相對固定。
簡而言之,Token消耗量更偏供給方(云廠商)視角,而非需求方(進行數字化轉型的企業)視角。因為,企業感知AI價值的方式,更多體現在Agent等AI應用上——Agent才是承載業務邏輯,吞吐Token,直接參與業務流程的基本單元。
部分大型企業智能化轉型中,甚至在用Agent定義“北極星指標”,如一崗一助手、一人一分身。它更關注Agent滲透率,AI業務滲透率等更加全面的指標。
Token很重要,但更重要的是,如何讓Token在真實業務場景中,通過Agent轉化為可衡量、可持續的業務價值。否則,這甚至可能會導致“負向激勵”。
一位中國云廠商資深人士提到,如果過分以Token收入增長作為目標,可能會導致在實際工程中,更強、更成熟的模型往往能夠以更少的Token完成同樣的任務,而模型能力不足、系統尚未優化時,Token消耗反而可能更高。
上述中國云廠商大模型業務負責人2025年12月曾對我們表達了這樣一個觀點——中國數字化市場的需求、層次是復雜多樣的。云廠商要從客戶視角出發,而不是自己想賣什么,進而期望客戶用什么。
Token對前沿開發者、AI創新企業的需求很重要,但他同時認為,中國數字化市場的真實結構是,頭部互聯網企業,金融、能源、交通等行業的央國企,制造、零售等領域的大型民營企業仍是中國IT支出的主力軍。這是中國數字化轉型的深水區。因此,應該尊重這部分客戶的現實選擇。
企業使用AI,最終目的還是用AI逐步替代、吞并、重構幾項企業成本——人力成本、傳統軟件成本、部分外包與流程成本、舊IT架構中的低效環節。真正決定AI云長期增長空間的,是AI是否能夠穩定進入更多業務流程,持續優化業務運營,改變企業IT結構。
在2025年12月末的這場溝通中,劉偉光的看法是,云計算到今天并沒有改變本質,那就是為應用服務。只是承載的類型從傳統應用擴展到了大模型或AI應用。重要的是,云計算技術棧要與時俱進。AI云不是簡單的AI+云,而是云計算IaaS、PaaS、MaaS平臺、Agent平臺全棧深度融合。這樣才能讓企業客戶高效部署AI應用。
“這十多年,中國云市場是全球競爭最激烈的,各種概念層出不窮,價格戰也屢見不鮮。但如果用更長的周期去看未來,技術能力和技術布局的前瞻性永遠是市場的勝負手,這終將被時間驗證。”劉偉光說。
如果把目光放到中國企業未來5年-10年的數字化轉型,AI云的競爭重點是系統工程能力——讓更多企業客戶能夠門檻更低、更好地使用AI,才是關鍵所在。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.