![]()
OpenClaw(原名:Clawdbot)爆火,將阿里、字節的MaaS訂單暗戰拉到了明面上。
這個開源AI Agent項目,由于能按用戶需求流暢處理復雜指令和多模態任務,用戶月訪問量兩周內飆至263萬,環比增速達10000%,單日Token調用量暴增數百倍,服務器幾度宕機。
就連王慧文(美團聯合創始人)也廣發英雄帖,稱哪個團隊要做OpenClaw相關領域創業,需要融資的歡迎聯系他。明擺著要為OpenClaw創業者投資、組局。阿里云、火山引擎、百度智能云更是在48小時內接連發聲,爭先宣布全面上線或優化支持OpenClaw部署。
開發者蜂擁而至,導致云廠商的免費Token不夠用,“云廠商送的幾十萬Token幾輪對話就燒完了,一天開發燒上億Token也不為過。”開發者宋叢表示。
云大廠圍繞“爆款”應用展開的爭奪,背后是Agent爆發帶來的算力與MaaS(模型即服務,大模型公有云調用)訂單,這才是云廠商們最激烈的戰場。
阿里的態度值得關注。根據The Information報道,阿里CEO吳泳銘在去年11月與阿里云高管開會時明確表示,MaaS是公司(長期成功)的首要任務。
而在MaaS市場,去年字節火山引擎的Token調用量位居國內第一,“占中國公有云大模型市場份額46%”也成了火山過去一年主打的機場廣告。
根據我們了解,火山引擎正在積極擴充銷售團隊,而云銷售最新的KPI也已明確將MaaS作為了首要任務,預計火山引擎機場廣告的預算是2025年的2-3倍。截至發稿前,字節對此方面暫無回應。
談到機場廣告,新年已到,阿里、火山、字節都要更換廣告詞,其中百度 云的機場廣告將在今年由“連續6年中國AI公有云服務市場份額領先”改為 “中國云廠商大模型市場項目數量&金額中標王 ”的相關表述。實際上這隱含著央國企客戶是百度云的舒適區。
當Agent自主性越來越強,Token消耗呈指數級增長,各大廠又爭又搶并不奇怪。根據IDC數據顯示,2025年上半年中國MaaS市場規模同比增長421.2%,成為云計算賽道中增長最快的細分領域。OpenClaw的爆火只是一個開始,未來無數Agent應用將催生萬億級的Token經濟。
站在2026年Q1的關口,中國云市場的MaaS市場迎來分野:阿里在爭奪每一寸新增份額,火山要守住自己打下的Token第一高地,百度的戰略則有了偏重。
不過,正如月之暗面創始人楊植麟1月在AGI-Next峰會上所談,在K2模型中,月之暗面嘗試以線性注意力等新架構,盡可能提升Token efficiency(Token效率)——在Agent與長上下文逐漸成為主流后,用更少的Token完成更復雜的任務,正成為一條繞不開的技術路徑。
“對于需要調用最先進模型的場景,目前火山的重要客戶調用量最多的實際并不是豆包大模型。而對于做2C市場的中小客戶來說,豆包大模型更經常被調用。”一位云業務從業者告訴我們。
這意味著大廠爭MaaS訂單,Token消耗量不再是唯一衡量標準,也并不能和模型能力的優劣劃等號。
所謂“Token效率”,即當一個OpenClaw式的應用消耗萬億Token時,云廠商能否提供最低的推理延遲、最高的API穩定性,以及最透明的成本結構。這也成為了AI云競爭的新命題。
01
Token經濟學
實際上,Token和MaaS市場的第一個發現者并不是字節。
百度在2023年3月先發布文心大模型,啟動了文心一言的正式邀測。彼時OpenAI要等兩年后才引爆AIGC,國內MaaS市場尚未被更多人知曉。
2023年Q4季度,百度公布文心大模型日均調用量為5000萬次,2024年8月,文心大模型的日均API調用量和日均處理的Token數為國內最高,超6億次,日均處理Token文本超1萬億。
到了2024年12月,百度最后公布的數據是,文心大模型的日均API調用次數為16.5億次(非Token日均調用量)。
2020年6月才正式上線的火山引擎,彼時在IDC等機構統計時并無單獨份額。
Token消耗量主要統計通過公共云MaaS平臺API調用模型的消耗量,但企業使用AI的方式多樣,包括云上后訓練和微調、下載開源模型本地或私有云部署、以及車端智駕、機器人端側推理等場景。這些場景產生的算力消耗同樣龐大,但未被納入公開報告的統計口徑,導致數據存在盲區。
IDC直到2023年才首次設立中國MaaS細分市場追蹤,不過IDC僅僅發布了2023年全年MaaS市場規模約為2.25億元,而且Token消耗量也并非公有云的統計口徑。在IDC的報告中,統計的是云廠商對外提供的大模型API/托管/微調服務,不包含自有業務和算力租賃。
隨著大模型帶起“算力”熱,英偉達的盤子越做越大,Token持續增長,阿里、字節和百度都看到了MaaS市場的潛力。國內無論是阿里云還是百度云,捆綁GPU做“算力”生意,賣租賃機器時長才是市場主流。
算力租賃也被業界稱為AI淘金熱中的 "賣水"生意,無論哪個大模型勝出,都需要海量算力作為燃料。
![]()
與此同時阿里把重心先放到模型開源上,希望通過模型開源構建起廣泛的開發者基本盤。根據我們不完全統計,僅2023-2024年,阿里模型開源就有7大批次,累計開源了超400個模型及變體(包含不同尺寸、模態、微調版)。
作為阿里云業務的領舵人,劉偉光是堅定的“公共云派”,在他的邏輯里MaaS不是孤立存在的,它必須長在公共云這棵大樹上。
由于算力成本過大,阿里、百度這兩家擁有獨立芯片業務的大廠,都試圖通過底層芯片自研來對沖算力成本。但此后百度內部資源逐漸開始向“文心助手”等C端工具收縮,試圖保住搜索基本盤,而非在利潤尚不明朗的公有云MaaS市場上硬碰硬。
黃仁勛在去年的GTC大會上把計算機比做一個運行AI的工廠,把大模型比作“電力”,Agent(智能體)就是家電或者工廠里的生產線,Token是一度度電。
當我們將所有不同類型的信息“Token化”后,云廠商需要做的事情就是提供更低價、更穩定、更高效的Token,成為新時代的“電網”。在企業場景下,各家MaaS平臺上的Token調用也是AI業務實際需求的呈現。
這個過程中,火山引擎在MaaS市場的增速一騎絕塵。去年12月,火山引擎總裁譚待宣布豆包大模型日均調用量突破50萬億Token,占中國公有云大模型市場份額的46%。而今年火山引擎與春晚的獨家合作,預計也將讓其峰值推至新的上限。
02
為什么是火山?
火山引擎的成功,本質上是豆包APP的成功。
譚待在接受晚點的采訪時曾提到,很多企業客戶是拿著跟豆包App的聊天Case找過來的,詢問能否在企業場景實現同等效果 。
在過去一年,字節通過極其強大的C端產品力,先制造了一個“Token黑洞”。一位火山引擎人士曾表示,字節跳動內部應用的Token消耗量正在急劇增長,抖音、豆包、剪映、即夢等應用正在上線更多AI功能,AI生成文字、圖片、視頻的需求也越來越大。字節的內部AI需求領先外部市場約“四五個月”。
火山引擎智能算法負責人、火山方舟負責人吳迪則在采訪中預測,2027年僅豆包大模型每日的Token消耗量將超過100萬億,相比2024年至少將增長100倍。
OpenClaw證明,一個成功的AI應用能瞬間點燃海量的MaaS需求。豆包APP作為2026年國民級的AI應用,巨大的自有流量為火山引擎提供了“實驗場”,每一次C端算法的優化,都能補給B端MaaS API的性能提升。
譚待對這個邏輯的解釋是:“大規模的真實應用是打磨模型的基石。海量調用產生的反饋能持續推動模型在性能、響應速度和成本上的優化”。
守住短視頻、社交、營銷等“高Token消耗型”行業,用C端的極致場景打磨B端能力,譚待為火山打下了“高并發、極致性價比”的心智。
除了豆包產品力在C端上優勢反哺,火山引擎也比其他幾家頭部云廠商布局AI更早。作為技術出身的業務負責人,譚待沒有像阿里那樣搶占全行業的增量,很早他就判斷,Agent的上限遠高于App時代,這是云平臺更大的機會。
![]()
圖/火山引擎機場廣告
在云業務上聚焦AI,讓火山引擎獲得早發優勢。開發者楊慧超在去年將自己的“易標AI”逐步遷移至火山方舟。這個用AI寫標書的項目,是典型的高Token消耗場景,一份標書動輒幾十萬甚至上百萬字,調用量巨大。
之所以選擇遷移,并非單純出于價格考慮,而是穩定性與并發能力。
“在標書項目的測試場景中,50個并發請求往往要等待5–10分鐘才能返回結果。有些模型廠商的新模型只給企業2–3個并發額度,根本撐不起業務。”楊慧超說。相比之下,豆包新模型在并發與額度上的開放度更高,加上早期提供免費額度,對重度調用場景更友好。
即便阿里推出了百煉平臺,楊慧超仍沒有遷移的打算。“用慣了火山,遷移本身就是成本。”他說。對于這類2B項目而言,接口穩定性、并發上限與長期可用性,比短期價格波動更重要。
在他看來,Token價格并不是創業初期最核心的壓力。“贈送的500萬 Token很快就會消耗完,但早期真正‘碾壓級’的成本是人力、網絡、安全和運維。”只有當模型能力出現代際躍遷,或者成本結構發生根本性變化,遷移才有意義。
“除非千問的能力強到明顯碾壓其他模型,或者完全免費,我才會考慮遷移。”楊慧超補充道。
03
MaaS成了新風向標
對于阿里云而言,2026年的關鍵詞是“奪回失去的陣地”。
在此前的MaaS混戰中,阿里云的重心一開始聚焦在開源生態,在直接的Token調用量少了爆發。但在吳泳銘接手后,2026年的Q1,阿里云展現出了前所未有的進攻性。
吳泳銘在內部交流中明確提出:“云+Al+芯片”是未來阿里科技戰略最重要的三角支撐 。他認為,軟硬件高度一體化的AI模型,將是下一代云公司的必備武器 。未來十年云計算最大的增量和變量都將由 AI驅動。
像阿里去年推出業務線上重大發布一樣,提出新概念,將上述三角命名為“通云哥”——通義大模型+阿里云+平頭哥(自研的真武810E芯片)。
很明顯,阿里試圖把模型能力、算力底座與云平臺整合為一個不可拆分的整體,不再只是賣模型,也不只是賣云,而是以軟硬一體的方式,期望在2026年奪回MaaS市場的話語權。
從國家電網到小鵬汽車,客戶在調用通義大模型時,背后實際運行的是不只是阿里云,還包括阿里的自研芯片。2026年1月,阿里云智能集團資深副總裁、公共云事業部總裁劉偉光也表示,“阿里云的目標是拿下2026年中國AI云市場增量的80%。”
他提到,“MaaS增長潛力很大,但關鍵是打贏AI云新增的全量市場”,要建立軟硬一體的AI云全棧能力,推動企業用更低成本調用更強的AI模型。
阿里云仍然是通吃邏輯,不僅要爭奪模型調用市場,還要通過算力捆綁、解決方案打包,拿下整個增量市場。
對于云廠商們來說,算力“三大件”(計算、存儲、網絡)的傳統增長已趨于平穩,MaaS雖然目前在云收入中占比尚小,但卻是未來增速最快的領域。
火山已經通過字節系APP形成的巨量Token吞吐,在Agent初創生態里形成了自己的心智高地。豆包的億級流量是火山引擎最好的廣告。
但火山在芯片基建上落力不足,在 Token 調用量第一的title之外,火山需要回答的是,當 Token 消耗開始講效率,火山要講什么新故事。
如Clawdbot一般的Agent訂單最終會流向哪里,不僅取決于誰能讓Token的價格降低,也取決于誰能讓自家的模型成為開發者的首選工具。
或許正如譚待所說,這場大模型馬拉松才跑了500米 。“最終的勝者并非起跑時聲量最高的選手,而是那些能持續夯實從底層算力、模型算法到上層應用架構的全棧能力,并真正理解與賦能千行百業的企業。”
*文中宋叢為化名
撰寫|馬舒葉
編輯|八尺
「白鯨實驗室」原創文章
轉載、交流、合作請添加微信:liujiaquan2025
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.