在2025云棲大會上,阿里云明確將自己定位為“全棧人工智能服務商”,這已超越外界對阿里巴巴的既有印象,也可能重新定義整個阿里巴巴。
它不只是,讓央視意外曝光的PPU也只是冰山一角。在過去幾年互聯網巨頭普遍沉默的時期,外界有意無意地忽視了阿里巴巴從模型到算力到網絡的AI全技術棧的深層演進。阿里巴巴重新闡述宏偉的未來愿景,比DeepSeek的橫空出世,更能持續深遠地揭示國內AI生態大氣候轉向。
三大展館是阿里云戰略意圖的縮影。計算館、人工智能+館、前沿應用館,分別對應AI的基礎設施、大模型與應用。但這只是對當前格局的靜態呈現。若以阿里巴巴集團 CEO ,所謂“全棧人工智能服務商”,實則是向全球AI應用,提供覆蓋AI超級云與AI操作系統的完整服務體系。
AI的重心已經從訓練轉向推理,需要創造價值,兌現價值。這意味著一方面要降低解決每個問題的token成本,另一方面要讓同樣的token能夠承載更高價值。這正是“token經濟學”的要義。而實現這兩點的前提,就是對整個技術棧擁有足夠的掌控力。
今年的云棲大會,云集了11萬人,也驚動了硅谷。這一周,英偉達的黃仁勛與方舟投資的木頭姐,都提到了谷歌已經建成這樣的全棧技術。前者認為谷歌是獨一無二的,尤其是在AI定制芯片領域;后者則稱谷歌已經“太成熟了”,她尋找的是有潛力打破甚至挑戰既定格局的對象。黃仁勛提到了阿里10年10倍的基建大計,木頭姐四年來首次重新建倉阿里巴巴。
下一代操作系統
阿里巴巴在開源模型領域的領先地位正不斷強化。今年以來,Qwen 家族幾乎以“每周一更”的節奏迭代,成為中國乃至全球開發者和初創企業的默認起點。在云棲大會上,阿里一次性發布7款Qwen系列模型,并同步更新Wan系列。
如今,Qwen生態已涵蓋300多款模型、17萬個衍生版本,累計下載量突破6億次,超過美國其他開源模型的總和。阿里正把AI應用生態牢牢鎖定在自家軌道上,也為其打造“下一代計算機”奠定潛在用戶基礎。
![]()
降低token單位成本的路徑有多種。微軟近期一篇關于人工智能推理能耗的論文總結了三條:提升芯片效率、改進模型算法、優化工作負載。其中,模型算法改進的案例,幾乎都來自中國開源社區,阿里巴巴受到重點關注。最新發布的Qwen3-Next架構,總參數80B,卻只需激活3B,即可媲美旗艦版Qwen3-235B性能,效率大幅提升。
提升token價值需要產業縱深。沿著擴展定律持續推進大模型性能,仍是廠商們的核心戰略。在此次發布的 Qwen3-Max 中,預訓練數據量達到 36T tokens、總參數突破萬億,具備強大的編程能力與Agent工具調用能力,性能躋身全球前三。
阿里巴巴對Qwen系列的未來充滿野心。它將全模態進全模態出,參數量擴展至10萬億級別,數據量擴展至百萬億級別,上下文擴展至千萬乃至上億長度。
![]()
越來越多的模型性能的提升,來自部署與使用過程中生成的數據。部署帶來分布,分布生成數據,數據改善性能,良好的性能又反過來強化分布。這也是為什么OpenAI越來越希望擁有自己的應用程序,并同時轉型為算力租賃的云服務商。只有掌握了應用與算力分發,它才能在反饋驅動的循環中占據優勢。
與之相對,開源和開放降低了集成摩擦,把開發者轉化為天然的分銷渠道。開源既是一種技術哲學,也是一種市場策略。
但是,性能并非終點。讓大模型成為“操作系統”,推動多智能體協作,完成長流程、高復雜度的現實任務更為重要。吳泳銘說:“幾乎所有鏈接真實世界的工具接口都將與大模型進行鏈接,所有用戶需求和行業應用將會通過大模型相關工具執行任務。”
阿里云擁有百煉平臺,Qwen3-Coder等代碼生成模型,以及最新的無影AgentBay,都在降低開發、部署與運營智能體的門檻。阿里還和支付寶打造了Alipay Toolkit,相當于谷歌的AP2,讓客戶在自己的技術棧上兌現價值。
真正的價值兌現,更在于產業落地。阿里巴巴自身擁有規模效應的應用矩陣,同時也在服務更廣泛的企業客戶。只有將大模型能力深度嵌入企業實際生產流程,才能真正兌現token的單位價值。貝恩公司估計,到2030年,AI必須創造2萬億美元年收入才能實現財務平衡。阿里云瓴羊的企業級AI智能體服務平臺 AgentOne,已經開始觸及企業交付的“最后一公里”。
下一代計算機
阿里巴巴在大模型時代的“操作系統”,將跑在自己的“下一代計算機”上。谷歌與Meta正在嘗試講述這樣宏大的敘事,OpenAI同樣如此。在談到OpenAI與英偉達的交易時,奧特曼(Sam Altman)就很直白地說,一切都從計算開始,計算基礎設施將是未來經濟的基礎。
但是,AI的基礎設施正在變得前所未有的昂貴。今年初“星際之門”計劃公布后,亞馬遜、微軟、谷歌和 Meta 紛紛將年度 AI 基礎設施投入上調至千億美元規模,投資浪潮再度升級。英偉達宣布對 OpenAI ,也把這場競賽推高至10GW 級別的能源與算力門檻。
在最新一次訪談中,黃仁勛特意引用了阿里巴巴計劃在未來十年讓其全球數據中心容量增長十倍的消息。他最懂阿里巴巴想做什么,那就是未來的“AI工廠”。
唯有在“AI工廠”的生命周期內,壓榨出更多token才能攤薄成本。但這已不再只是單卡算力的較量,而是一個全棧層面的協同優化。也因此,黃仁勛始終看空ASIC定制芯片。
打造一座“AI工廠”的真正的挑戰,不是單單造出一顆“AI芯片”,而是前所未有的系統級協同設計。為此,英偉達重塑了CPU,革新了GPU、網絡芯片,推出NVLink實現縱向擴展(scale up),又以Spectrum-X實現橫向擴展(scale out)。
在黃仁勛看來,目前能在這一層級上有所建樹的,只有谷歌。因為它們早在一切開始之前就已經行動,以創業公司的姿態發布了TPU v1,直至今天Ironwood架構的TPUv7。
全棧自研能夠放大模型與芯片設計之間的協同效應。模型架構正從“稠密”走向“稀疏”,因此對超大帶寬和超低時延的網絡需求愈發剛性;從純訓練向訓推一體演進,使得預填充(prefill)與解碼(decode)階段的軟硬件解耦與針對性優化成為必要。
阿里巴巴并沒有缺席,而且起步較早。它的芯片研發平臺平頭哥成立于2018年,研發了服務器CPU的倚天系列、SSD主控芯片的鎮岳、AI推理的含光等等。AI芯片PPU“意外”曝光,多項性能參數已經超越了英偉達縮水版的H20。達摩院還是RISC-V軟件生態(RISE)的唯一中國創始成員。
云棲大會上,阿里披露了更多自研硬件進展,包括云基礎設施處理器的CIPU 2.0,服務器BMC的CMU610,安全模塊AliPRoT,SSD模塊AliFlash v5,以及首次規模量產的硅光芯片。阿里巴巴自研硅光芯片從2021年啟動,支持DSP、LPO與TRO的800G/1.6Tpbs的光模塊。可以說,阿里云正從計算、網絡、存儲三個維度全面重構AI云基礎設施。
阿里所描繪的“下一代計算機”,目前由四大組件構成:自主設計的磐久超節點服務器、負責橫向擴展的高性能網絡HPN 8.0、高吞吐并行文件存儲 CPFS,以及支持10萬卡穩定互聯的靈駿集群。
下一步,則是縱向擴展網絡能力。在云棲大會上,阿里云發布《UPN512 技術架構白皮書 v1.0》,與負責橫向擴展的HPN網絡相呼應,指向超大規模稀疏模型訓練的新挑戰。
稀疏模型的專家(Expert)規模正在快速膨脹。從最早的Mixtral(8個專家),到DeepSeek-V3(256 個),再到Kimi-K2(384 個),而最新的被視為阿里下一代模型架構探索之作的Qwen3-Next最為大膽,足足512個專家。
這使得基礎設施必須具備更強的縱向互聯能力,以滿足不斷擴大的 EP 并行需求。英偉達已將超節點升級至 NVL72,路線圖已經規劃至NVL576;華為的CM384超節點則可以塞下384顆昇騰910C。
HPN和 UPN 組成的高性能系統
![]()
UPN512-單層光互連解耦系統
![]()
目前,阿里巴巴的磐久服務器單柜最大支持2組縱向擴展,共128個GPU。它采用了無背板的正交互聯,不僅降低了信號傳輸損耗,還可以更好地適配各種插卡。這方便了靈活配比CPU與GPU節點,精準適配不同AI任務;也能將更多國產芯片納入到自己的算力生態來。在展廳里,阿里巴巴展示了它兼容海光K100、燧原S60等主流國產GPU以及飛騰S500c、海光C86-3G等主流國產CPU——只要它們樂意適配Alink。
阿里巴巴的UPN512對應512顆AI芯片的縱向擴展。從銅到全光互連,試圖突破大規模擴展的帶寬與距離的瓶頸;從高密封裝式小型機到解耦盒式設備,降低部署和運維的復雜度;傳輸語義的升級與在網計算的引入,不僅提升了數據搬運效率,也重塑了其傳輸方式。阿里的UPN512正在嘗試把AI超節點網絡,從“傳統”的“緊耦合方案”推向更為標準化、可擴展的云化架構。
數據中心的基礎設施不僅限于算力、網絡和存儲,還包括電力與物理外殼,即所謂的PowerShell。這部分往往被忽視,卻影響著AI服務商的生命周期成本。
二者生命周期存在顯著差異:智算相關硬件通常為5年左右,智算的PowerShell則可達20年。這意味著后者在初始設計時就必須具備跨越至少三個硬件迭代周期的擴展能力。在云棲大會上,阿里巴巴也提出了相應的架構方案與運維體系。
阿里云將自己定位為“全棧人工智能服務商”,這是一種對既有身份的根本性重構。它的目標不僅是贏得中國市場的一席之地,更是要在一個日益平行的人工智能市場中,建立起完整、自主且具有全球競爭力的全棧技術體系。它既復制了硅谷的技術樂觀主義,也嚴肅對待中國市場的現實約束。這讓市場重燃想象。
參考:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.