![]()
![]()
當“卡數”不再是核心指標,體系能力才是算力產業的新分水嶺。在長沙,640卡與384卡罕見同臺,背后是中國算力兩種范式的正面交鋒。本文帶你看懂中國算力的“雙路線體系崛起”與背后的架構哲學。
編輯:前沿在線 編輯部
![]()
從拼硬件到比體系,中國算力迎來拐點
當你還在關注一臺服務器能上多少卡、跑多快的時候,中國算力的討論焦點,已經悄悄發生了變化。
![]()
在2025年世界計算大會現場,最吸引圍觀的,不再是展示峰值性能的排名屏,而是一排排開放式超節點機柜。來自各地的工程師、采購方、研究者圍著這些設備討論的問題,也不再是“你們這張卡多強”,而是——“PUE能做到多少?”、“支持異構卡嗎?”、“我們現有模型能跑進去嗎?”這種提問方式的變化,本身就說明了一件事:中國算力產業,正在從“能造出來”轉向“能用起來”;從“單點突破”,走向以超節點為代表的“體系能力”競爭。
![]()
大模型是推動這一轉變的直接動力。在百億、千億、萬億參數的大模型時代,單一設備的性能早已無法撐起整個模型生命周期。行業真正需要的,不再是一塊更強的卡,而是一套可長期運行、穩定協同、按需擴展、可預期運維的算力系統。也正是在這個背景下,我們看到了今年世界計算大會上一幕頗具象征意味的場景——華為與曙光,兩個體系范式的代表,同臺亮相,以各自的方式展示了對“新型算力體系”的回答。
![]()
曙光與華為同場,雙路線體系首次并行亮相
在眾多展臺中,最受關注的兩臺設備并不孤單——一邊是曙光發布的scaleX640超節點,另一邊是華為展示的全棧384卡集成系統。一個強調“開放協同”,一個主打“全棧深耕”。它們并肩而立,像是在向整個行業展示一個信號:中國算力的范式,不止一條路線。這不是簡單的“誰更強”,也不是參數層面的PK,而是兩種完全不同的體系構建思路在同場域里展開了對話。它們并沒有誰取代誰,而是在逐漸構建一個“雙路線并行”的生態格局。
![]()
曙光主張構建一個開放的、可適配多種異構加速卡的協同體系。scaleX640超節點的核心,并不是“640卡”這個數字,而是它試圖把“算、存、網、電、冷、調度”這些底層模塊真正封裝為一個可復制、可部署的體系單元——不只是強,而是能用、能管、能擴。
相比之下,華為走的是一條更具控制力的“深度封裝”路徑,從芯片到通信、從算力到模型框架,每一個環節都自研、自控、自洽,追求的是高一致性、高性能、高可用。這種體系適用于對穩定性、安全性、確定性要求極高的大模型訓練平臺。雖然路徑不同,但要打造“體系化算力”,兩者都繞不過幾道共同的關口。
首先是通信瓶頸。算力節點數量的提升帶來了指數級增長的數據交換量,如果通信架構不合理,即便算力再強也可能被“拖死”。曙光通過在單柜內構建高密度通信域,讓GPU之間實現無中轉直連,有效降低跨卡延遲;華為則依托自主拓撲,確保資源調度與通信高效協同,跑大模型時依然能保持系統穩定。
第二是能效。單柜熱密度一旦突破50kW,傳統風冷就“搬”不走熱量了。scaleX640超節點采用的是浸沒相變液冷,把PUE壓到1.04;華為則通過閉環液冷與模塊化供電,把散熱、功耗和部署維護全部打包成一體化系統。第三,是系統調度與資源彈性。大模型時代不允許系統崩一次、任務全重跑。調度系統必須既要靈活,又要容錯。
兩家在這方面都強調了訓推一體、資源動態調度、自愈機制——不是為了炫技,而是因為只有這樣,體系才跑得起來、跑得穩。這些工程挑戰的出現,也說明一個事實:算力已經不只是“造出設備”,而是必須具備工業系統化能力。真正的“體系級算力”,要從通信到能效、從調度到兼容,每一環都能抗得住現實落地的壓力。
![]()
“開放協同” vs “全棧閉環”:雙路線分野全面成型
如果說前幾年大家還在討論“誰的GPU更強”“誰的芯片算得快”,那么今年的世界計算大會,則真正將國產算力的討論維度,拉到了“體系能力”的層面。曙光與華為并肩亮相,同為國產超節點代表,卻走出了兩條完全不同的系統路徑:一個強調開放協同,一個追求全棧閉環。兩者背后,是中國算力體系建設正邁入深水區的真實寫照。
![]()
曙光scaleX640超節點的技術價值,不在“640卡”數字本身,而在于其作為“體系能力”的工程樣本打造可部署、可復制的“算力積木”。支持主流大模型與異構平臺適配,兼顧高可用性與通用性;更重要的是,曙光率先支持多品牌AI加速卡,避免被鎖死單一供應鏈,具備長期演進能力。
相比之下,華為構建的是另一種“閉環式”全棧體系——從芯片、架構、框架到調度平臺全面自研,追求高一致性與控制力。其通信設計涵蓋張量切分與訓練節奏等關鍵路徑優化,調度平臺支持復雜策略與自動容錯,能效體系也通過整機冗余與機房級熱管理前置設計,確保PUE穩定、部署標準化。兩者路徑雖異,背后都體現了中國算力體系“從可研制到可部署”的躍遷。
當然,這種深度一致性的體系,也意味著更高的生態封閉度:只有在華為全棧體系下,才可發揮其最大性能。但對很多場景,“穩定可控”勝于“通用適配”,華為這種從底層到應用一體的戰略打法,也是定制化的體系路徑探索。
一個強調“可部署、可適配”,一個追求“可控、可閉環”。雖然思路不同,但它們共同構成了中國算力體系的雙范式格局,也標志著我們第一次在“系統級能力”上,走出了自己的技術岔路。曙光給出的體系方案,讓AI部署這件事從“超大機構的高定項目”,變成了更多企業“可以負擔、可以規劃”的基礎生產力資源;華為則提供了一種系統級的算力安全底座,在最不可妥協的場景里,用全棧閉環打通縱深戰略路徑。
而當這兩種能力可以并行、可選、可替、可演進時,中國算力體系的厚度與彈性,才真正建立起來。這背后也意味著,中國第一次真正擁有了“不靠別人定范式”的能力。過去,我們花了十幾年追趕國際性能指標;今天,我們開始有能力基于自身業務場景、應用需求和產業規劃,去反過來定義“什么才是適合中國的算力體系”。
這不是一種技術超越,而是一種系統成熟。
![]()
未來中國算力的核心競爭力,不會只是某個芯片多強、某條線路多快,而是——我們能不能持續構建一整套“體系即能力”的交付標準,讓AI成為真正可工業化部署的新型生產力。而這一次,中國已經不只是跟跑者。我們終于開始寫自己的體系規范。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.