![]()
“AI Infra 就是云計算本身。”
文丨賀乾明
100 多年前,電力首次進入工廠,許多工廠主做了一個看似合理的決定:保留復雜的蒸汽機傳動軸和皮帶系統,只用電動機替換蒸汽機。結果令他們大失所望:動力更強了,生產效率幾乎沒有同步提升。
接下來的 20 年,他們才逐步意識到,電力帶來的真正變革不只是簡單替代動力源,而是把它嵌入到不同的業務單元中,用不同類型的電機驅動鉆頭、傳送帶等,生產力才迎來爆發。
這是阿里云希望給企業深入應用 AI 提供的能力。他們認為,AI 時代客戶要的不只是單一的模型或云的能力,而是更低成本使用更強模型時,有更靈活的綜合體驗。AI 云應該像當年的電力真正提高工業生產力時那樣,提供多層次的服務,全面嵌入到企業的業務流程中。
這一判斷有業務數據支撐:在阿里云上調用大模型 API ( MaaS 服務)的客戶中,有七成也同時在使用其 GPU 算力服務。
阿里云智能集團資深副總裁、公共云事業部總裁劉偉光說,第一批深度使用 AI 的客戶,會把場景分成不同檔次:不只是簡單調用大模型 API,還會用內部數據精調或者后訓練基礎模型,或者自己從頭訓練一個模型。
在劉偉光看來,AI 給云計算行業帶來的變化才剛剛開始,整個云計算體系架構都要為 AI 重構,“MaaS 增長潛力很大,但關鍵是打贏 AI 云新增的全量市場”,要建立軟硬一體的 AI 云全棧能力,推動企業用更低成本調用更強的 AI 模型,解決不同層次、不同場景問題,“這才是競爭中的勝負手”。
146 個 行業客戶深度調研:Token 質量比數量重要
“如果今天所有的 AI 應用每天只能免費用 100 次,你會用它做什么?”
這是劉偉光 2025 年走訪了 146 個客戶后反復思考的問題。 他的結論非常直接:沒有人會把它浪費在寫段子或閑聊上,一定會做最重要的東西——對工作最有幫助的決策、對家庭生活最關鍵的建議。
在他看來,這是企業使用大模型與個人用戶的本質區別。個人用戶可能為了娛樂消耗 Token,但追求效率的企業,每一次 Token 的交換都有成本。他們不僅要為 Token 付費,業務線上的人力、時間也是投入。
很難想象一個年輕的工程師面對設備故障時,還需要多輪對話才能得到解決方案,需要更快的響應、能讓他迅速解決問題的指南。同樣,基金公司的交易員用 AI 輔助捕捉交易信號時,也很難容忍模型動輒陷入沉思,然后給出長篇大論,再問一句 “是否需要我幫你整理得更完善”。
傳統行業的企業正在用不同的方式,盡可能避開 AI 的短板、提升效率。比如汽車診斷公司,用 30 年積累的產業檢測報告做出來遠程幫助汽修的大模型,才用到診斷報告中;基金公司會用沉淀 20 多年的數據和交易的行為跟模型結合,把各種形式的非結構化數據(如文字、語音、圖像等)轉化為可供投資參考的標準化信息。
企業也希望充分挖掘 AI 的潛力。中國兩家農牧業巨頭公司都在用千問做相同的事情,他們不僅嘗試用 VL(視覺大模型)識別豬的數量,還用它來識別豬的異常行為,檢測豬的健康與活性,或者是開發獸醫大模型解決專業人才短缺問題。還有頭部照明公司接入千問后,不再局限簡單的開關燈或者調控色溫,還用 AI 理解用戶模糊的指令,用更流暢的對話打造更聰明的端側語言模型,讓人與光的交互更自然。
而企業一旦找到合適的方式把 AI 嵌入業務流程中,就會是嚴肅和連貫的。在線招聘行業中的每一家公司,幾乎都在引入 AI 簡歷篩選、智能化面試、自動生成面試記錄。當招聘專員習慣用 AI 輔助工作后,就會形成新的工作流,每天都會使用,不會受到個人喜好影響。
“個人消費者使用 AI 的情況會有波動,但企業級市場只會不斷增長。” 劉偉光說,而且使用的廣度和深度會不斷加強,很多場景還沒有解鎖,“如果 AI 能把車損定損給改了,那絕對是一種 ‘革命’。”
2024 年云棲大會上,阿里巴巴集團 CEO 吳泳銘在演講中稱,生成式 AI 最大的想象力,絕不是在手機屏幕上做一兩個新的超級 App,而是接管數字世界,改變物理世界。
過去一年中國 AI 企業市場的發展證實了他的判斷。AI 已不只在手機里面作為應用程序,而是出現在更多的載體中,包括眼鏡、耳機、學習機、玩具、健身器材、汽車、機器人等全品類硬件設備中。
這種不同層次、不同場景的需求,當下無法用單一的模型 API 服務滿足。在美國市場,原本已經給企業提供工具的 SaaS 行業,大模型調用量規模持續上漲,提供了一種相對標準化的方案。而在 SaaS 行業未能發展起來的中國市場,傳統行業偏向定制服務解決特定場景問題,往往需要后訓練或者微調大模型。云計算公司提供這樣的服務,在一定程度上為企業提供了類似 SaaS 的服務。
“現在所有 MaaS 服務加一起,在中國云計算市場、甚至 AI 云市場占比都不高。MaaS 的空間當然非常大,但不是今天。” 劉偉光說,只統計公有云市場大模型 API 的調用量,無法代表 AI 云全貌。真實的 Token 消耗量,要把 MaaS 平臺 API 調用、公共云 GPU 推理集群產生 Token、私有化模型部署產生 Token,設備端模型產生的 Token 等全部統計在內。
“冰川下的 Token 消耗非常大,卻無法統計。而且企業用 AI 還處于轉型早期, 90% 以上的企業還沒有真正行動起來,未來肯定是百倍的增長。”
但可以觀察的是,只要基礎模型的性能持續提升,云廠商深入到技術棧的每一層提供服務,改進推理能力、節省成本,就可以帶動更多行業的更多客戶用 AI 解決問題。
做 AI 時代的基礎設施,承接不同層次的需求
英偉達 CEO 黃仁勛曾拋出一個著名的論斷:GPU 集群就是 “Token 工廠”,輸入的是能量,輸出的是 Token。這是典型的芯片公司視角,把 AI 生產過程簡化為了物理層面的能量轉換。
對于云廠商來說,如果只是從事算力轉售業務,現在很難提供可用的 AI 服務。他們必須用系統工程能力,盡可能提升現有算力效率,針對不同行業、不同層次的企業提供模型服務。
這也是阿里云的選擇:做 AI 時代的基礎設施。用劉偉光的比喻來說,阿里云正在搭建的是一套現代化的自來水廠,而不只是水(大模型 API)的搬運工,還要維護水源地(開源模型)、搭建凈化車間(數據清洗與模型訓練平臺)、鋪設輸水管網(高性能網絡),以及處理污水(安全治理)等。
在這套體系中,阿里云能夠提供當前不同類型的 “用水” 需求:
MaaS(直供水服務): 就像家庭擰開水龍頭就能用水,企業或者開發者不用關心底層復雜的管網,直接調用 API,開箱即用,按需付費。這是最輕量的接入方式。
PaaS(工業用水服務): 類似于工廠需要特定的水源,企業可以獲得基礎模型,直接用 “開源模型” 在阿里云平臺上微調或者自己后訓練,然后部署到合適的環境中。
IaaS(水處理基礎設施): 像是將經過初步凈化、萃取后的水源,輸送給飲料廠或啤酒廠,企業可以用阿里云提供的算力和基礎軟件,用來訓練獨家配方的 “飲料”,比如自動駕駛模型、各種垂類大模型等等。
阿里云已經有了初步成績。根據市場調研機構 Omdia 數據,2025 年上半年,中國 AI 云整體市場(AI IaaS+PaaS+MaaS)規模達 223 億元,阿里云占比 35.8 %,超過第二到第四名總和。
搭建這套全面的基礎設施,不僅需要高昂的投入,還要有戰略決心。2025 年 2 月,阿里宣布未來三年將投入超過 3800 億元,用于建設云和 AI 硬件基礎設施,總額超過去十年總和。僅僅是 2025 年前三個季度,阿里用于建設 AI 數據中心等的資本開支就兌現了 950 億元。
在基礎模型層面,阿里持續投入訓練不同尺寸、不同類型、不同模態的基礎模型,并投入資源把它們做到第一梯隊。比如視覺生成模型萬相 2.6 性能媲美 OpenAI 的 Sora 2;Qwen-Image-Layered 是業界首個能實現圖像分層精準編輯的模型;Qwen3-Max 的性位居全球模型性能榜單前列。
阿里選擇把這些模型開源,提供給各行各業的團隊或企業使用,其中 Qwen 的衍生模型數量超過 18 萬,規模位居全球第一。
作為基礎設施,阿里云上長出來的不只有阿里自研的模型,月之暗面也在阿里云上訓練 Kimi 系列模型,以及許多智駕團隊也用阿里云訓練模型。
與此同時,阿里云也提供了一整套體系能力,支撐 AI 時代新誕生的產品迅速發展,除了阿里體系的千問 App,還有螞蟻集團的靈光、阿福,以及月之暗面的 Kimi 應用、MiniMax 的海螺等。
盡管當前各行各業應用 AI 還處于早期階段,但定位基礎設施的阿里云,也在探索更新的產品形態,為接下來的 AI 應用爆發做好準備。最典型的例子就是阿里正在開發千問 App 的 Agent 版本。它不只局限于用戶提問,還能夠調用淘寶比價、使用高德導航,甚至阿里所有的服務都有可能成為它的插件。
最終這些在阿里內部業務和行業頭部公司驗證過的能力,都會沉淀在阿里云中,成為對外提供服務的產品。讓客戶具備長期、可持續地產生和使用智能的能力,而不是把客戶鎖定在某一種計量方式里。
AI 加速推動客戶上云
AI 正在給云廠商帶來了新的增長動力。無論是 AWS、微軟 Azure、Google Cloud 還是阿里云,規模都在迅速增長。
但提供動力的不只是 GPU 用量或者大模型 API 的調用。阿里云團隊觀察到, 在阿里云上使用這些服務的客戶群體,他們在計算、存儲、網絡以及大數據等產品上用量的增長,高于整個大盤的增長。
“AI 會加速推動客戶上云。” 劉偉光說,客戶為了用好 AI,不得不將數據全面上云。企業想要讓一個 Agent 產生價值,基礎模型只是一個方面,高質量的業務數據同樣重要。
微軟 Azure 的增長邏輯類似,出售 OpenAI 的基礎模型的 API 服務只是其中一個方面,更充足的動力來自企業為了在業務中應用更強的模型,把分散在本地與各系統中的內容與數據,遷移到了更方便模型調用的云產品中。
為高并發 Web/HTTP 請求設計的傳統云計算架構,難以高效支撐這樣的需求。甲骨文重新獲得增長動力,很大一部分因素就來自于部署 RDMA(遠程直接內存訪問)高性能網絡和自治數據庫,適應了大模型訓練、推理的需求。
這直接改變了公共云計算服務在中國市場的前景。此前多年,中國云計算公司并不像 AWS 等海外云平臺那樣,公共云客戶遍布各行各業,囊括美國證券交易所、大型石油公司、銀行業巨頭等,做大規模就能擁有利潤。
在中國云計算市場,平臺依賴的電力、帶寬等基礎設施成本并不受企業自身控制;部分傳統企業出于數據安全、合規或歷史慣性等原因,仍傾向于自建數據中心。
“阿里云的基礎云架構,為 AI 重做了一遍。” 劉偉光說,AI Infra 并不是一個特定的垂直方向,就是云計算本身,不僅需要規模化、安全和穩定,更需要云上的跨服務流轉能力,比如新型的向量數據庫、高效的大數據清洗平臺、靈活的開發框架,滿足企業不同層次、不同場景使用 AI 的配套軟件體系。
在阿里云看來, AI 時代云計算平臺的競爭力在于 “軟硬一體化” 的體系能力:硬件不只是芯片,而是圍繞 GPU 算力構建的整個高性能底層架構;軟件則是對模型的理解、優化和調度能力。
“阿里云的目標是拿下 2026 年中國 AI 云市場增量的 80%。” 劉偉光說,但是下一年增量的 10% 都會大于上一年的全量。所以過去取得了什么成績并不重要,變化才剛剛開始。
題圖來源:The Current War
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.