最近路過北京首都機場的人,都會被一幕微妙的場景擊中:阿里云、火山引擎、百度云的大幅廣告并排而立,在機場偌大的空間內正面交鋒。更有意思的是,它們的口號清一色都在強調“第一”或者“領先”。
![]()
再到杭州蕭山機場,最搶眼的已不是登機口的航班信息,而是鋪天蓋地的火山引擎廣告。幾乎所有航站樓的通道,都被貼上了一片醒目的藍色。阿里在杭州深耕十余年,如今卻在自家門口,被字節用“AI 云”的巨幅海報狠狠蓋了一層。
![]()
機場廣告本該是注意力的生意,如今卻成了中國云廠商混戰的戰鼓。誰能買下更亮的燈箱,誰就先在公眾心智里貼上“AI 云第一”的標簽。但在廣告之外,真正的戰場在機房和財報里:GPU 的價格戰、調用量的沖高、資本開支的狂飆、戰略分化的拉鋸。
2025 年上半年,AI 把所有云廠商推上了興奮劑般的節奏:GPU 訂單暴漲、調用量沖頂、財報集體超預期。然而表象的繁榮背后,是血拼的折扣、割裂的戰略。中國云計算行業正經歷一次“變陣期”,而所有懸念都匯成一個問題。
誰才是中國 AI 云第一?
這個問題,得從互聯網上流傳最廣的“兩張圖”說起。它們分別代表三個不同的評價維度,也恰好對應三位主角的強項。
先看調用量。如果把大模型推理看作一條高速路,調用量就是上路的“車流”。IDC 報告顯示,2025 年上半年中國公有云大模型調用總量約536.7 萬億 Tokens,其中火山引擎占49.2%,阿里云約27%。憑借低價策略與先期資源優勢,火山引擎在“流量入口”上占據領先。
![]()
圖片來源:IDC
再看營收與全棧能力。這一維度關心的不是“跑了多少趟”,而是“整車賺了多少錢、車隊有多大”。Omdia 給出的結論是:阿里云在中國 AI 云市場(僅考慮企業客戶)份額35.8%,超過第 2 至第 4 名之和;加之未來三年3800 億元的云與 AI 基建投入,阿里云是在資本規模與全棧能力上最接近國際一線(AWS、微軟、谷歌)的國內廠商。
![]()
圖片來源:Omdia
為什么同一條賽道,會得出不同的第一?
最關鍵的差別在于口徑。調用量可以理解為“流量口徑”,主要衡量推理 API 的使用頻次和吞吐能力,受 Token 單價、免費額度、促銷策略和模型壓縮效率等因素影響;而市場份額則是“營收口徑”,計算的是 IaaS、PaaS 與 MaaS 的整體收入,以及長期合約和項目交付。
從優點來看,調用量口徑直觀、靈敏,能夠反映模型的活躍度和生態熱度。但公有云調用量的局限在于,它無法覆蓋私有化和“一體機”部署。阿里云在云棲大會上就曾回應,許多客戶會選擇在阿里云或自建基礎設施上直接部署通義千問、通義萬相,這部分并未納入 API 調用統計,因此真實使用規模往往高于公開數據所呈現的水平。
相比之下,營收口徑也并非萬能。傳統 IaaS 收入口徑更側重計算、存儲和網絡等通用資源,其規模容易受到價格戰和資源擴張的拉動,從而放大算力和帶寬層面的競爭,卻難以準確衡量廠商在 AI 技術與應用上的實力。IDC 在另一份報告在統計市場份額時,用計算機視覺、對話式 AI、智能語音、自然語言處理和機器學習平臺等與 AI 直接相關的領域作為觀察窗口,提供了一個新的獨特視角。
![]()
圖片來源:IDC
不同廠商采用不同的口徑,背后其實是產品結構、客戶結構的不同。
產品結構上,火山引擎更偏MaaS 推理 + 輕交付,主打法是低門檻、即插即用與極致性價比,疊加先期囤的推理卡,最適合迅速把調用量做“爆”;但這種結構對營收/毛利的貢獻更像“薄片”,量起得快、客單不一定厚。阿里云是典型的全棧大拼盤,靠一體化方案綁定大客戶,客單厚、續費長、周邊服務多,營收份額自然占優。百度走的是工程重、行業深的路線,把文心體系嵌進政務/金融/交通/教育等垂直場景,單體項目金額大、門檻高,但短期未必形成“好看”的公有云調用曲線。
客戶結構上,火山的主力是開發者、中小企業與互聯網應用方,“高頻低價、拉新快、流失也快”,調用曲線最容易被拉高;阿里云更集中于大型企業與跨行業集團,采購的是“算力 + 數據 + 平臺 + 服務”的整套,常見多年期合同,ARPU 與續費率把營收曲線壓得穩。
總結來說,火山引擎拿的是入口與流量的第一,阿里云坐的是營收與全棧的第一,百度守的是工程與深度的第一。真正意義上的“AI 云第一”,要看未來三到五年誰能把三條曲線疊到同一個拐點:調用規模繼續放大、資本底座持續加厚、行業粘性不斷上升。當這三件事同時成立,“唯一的第一”才會出現。
下半場:AI 云的未來戰局
上半年的混戰已經表明,真正的比拼不再是單點算力或單個模型,而是“算力—模型—應用”能否被焊死在一起,形成全鏈路閉環。未來三到五年的勝負,不再取決于短期的增長爆表,而是誰能把云從“加一點 AI”真正升級為“新一代電力系統”。掌握發電(算力供給)、輸電(模型與平臺)、負載(應用與生態)的整體能力,才算站穩賽道。
接下來,有幾個方向決定戰局。
資本閾值持續抬高:比的不是“誰花得多”,而是“誰花得值”
阿里提出三年 3800 億元 AI 基建,信號不在金額本身,而在資產結構與折舊周期:自有/租賃數據中心、專用電力與網絡、定制化加速器與冷卻系統,會把云廠的資產負債表“重化”。短期利潤承壓幾乎是必然,但只要“資本→可用算力”的轉化效率高,重資產會反而形成長期壁壘。真正的比較單位不應是“億元”,而是每億元能換來多少“可調度 TFLOPS/月”、PUE/WUE 能耗指標能做到多低、上架到可售 SKU 的周轉時間有多短,以及這些算力能否被高毛利產品(數據庫、數據智能、企業安全與行業解決方案)長期“掛靠”。
更深一層的變數在供給鏈與能源:高端 GPU 供給不確定、綠電配額與電價波動、機房選址的水資源與排熱條件,都會改變同一筆 CAPEX 的“含金量”。因此判斷一家廠商資本優勢是否可持續,至少看四個比值:CAPEX→上架算力的月轉化率、單位算力的全生命周期成本(含電力/維護/折舊)、高毛利產品對算力收入的“帶掛率”、以及合同期內的負載率(避免“閑置算力”成為沉沒成本)。做不到這四點,“大投”很容易變成“大負擔”。
推理入口之爭:Token 是“虛火”,留存與提價權才是“真火”
2025 年上半年公有云調用量被測到約 536.7 萬億 Tokens,這個“門面”決定了誰更被開發者看見,但它天然偏向價格與促銷。入口的真正價值取決于三件事:一是能否把短頻快的API調用升級為有狀態的工作流(檢索、工具調用、多人協作、長時記憶),從“瞬時流量”變成“持續水位”;二是能否把公有云端點延伸到私有化/專有域與本地一體機,讓企業數據與治理框架長期駐留;三是能否在新交互形態(語音/視頻流、Agent 級自動化、端云協同)中拿到低時延與高穩定的體驗優勢。這三件事決定了入口能否轉化為更高 ARPU 與更低流失”。
全棧自研 vs 平臺聚合:一邊是“性能/成本/控制權”,一邊是“速度/廣度/彈性”
平臺聚合(如 Azure 的多模型接入)帶來的是“快”與“廣”:生態豐富、上新迅速、產品線不必處處自研;代價是對上游模型供應的依賴加深,議價權、成本與路線可預期性會波動。全棧自研(典型如谷歌的 TPU+模型協同、國內的芯片/算力/模型/平臺耦合)強調的是“深”:通過軟硬協同把性能/時延/單位成本壓到行業極限,并把關鍵路徑牢牢掌控在內;代價是組織復雜度、研發門檻與 CAPEX 壓力的急劇上升。
未來更可能出現“折中最優”:關鍵路徑自研 + 非關鍵路徑合作。也就是在推理調度、編譯優化、緩存體系、隱私計算、數據治理等“性能與合規決定成敗”的環節堅持自研;而在通用模型供給上保持開放路由與多模型編排,既保證體驗,又避免單一供應依賴。評估這兩種路線優劣,不妨盯三個可驗指標:同等質量下的單位推理成本/千 Tokens、跨模型路由的成功率與總時延、以及自研鏈路的版本演進速度(能否季度級別持續降本提效)。誰能把這三個數同時做優,且不犧牲生態廣度,誰就能把“技術優勢”兌換成“業務抗周期”。
一個更偏執但現實的判斷是:未來三到五年,中國 AI 云格局不會“勝者通吃”,但勝者通道一定極窄。要跨過的門檻有四道:持續千億級資本投入并能轉化為算力,百萬級集群與云操作系統的調度能力,頂級大模型與多模型的工程化效率,以及芯片與上游供給的可控性。誰能在這四道門檻上全部過關,誰才有資格成為 AI 時代真正的“電力公司”。
https://mp.weixin.qq.com/s/-x4NQLe6w_psM92mRVWH-A
https://mp.weixin.qq.com/s/YhxeAgWbg0Bj9NMEIv8lSw
https://www.sohu.com/a/933400503_211762
https://my.idc.com/getdoc.jsp?containerId=prCHC53747325
歡迎掃碼加群參與討論
我們相信認知能夠跨越階層,
致力于為年輕人提供高質量的科技和財經內容。
稿件經采用可獲邀進入Z Finance內部社群,優秀者將成為簽約作者,00后更有機會成為Z Finance的早期共創成員。
我們正在招募新一期的實習生
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.