網易首頁 > 網易號 > 正文申請入駐

2025世界計算大會：640卡超節點，曙光與華為詮釋兩種算力體系觀

2025-11-20 20:25:40　來源: 前沿在線

北京舉報

分享至

當“卡數”不再是核心指標，體系能力才是算力產業的新分水嶺。在長沙，640卡與384卡罕見同臺，背后是中國算力兩種范式的正面交鋒。本文帶你看懂中國算力的“雙路線體系崛起”與背后的架構哲學。

編輯：前沿在線編輯部

從拼硬件到比體系，中國算力迎來拐點

當你還在關注一臺服務器能上多少卡、跑多快的時候，中國算力的討論焦點，已經悄悄發生了變化。

在2025年世界計算大會現場，最吸引圍觀的，不再是展示峰值性能的排名屏，而是一排排開放式超節點機柜。來自各地的工程師、采購方、研究者圍著這些設備討論的問題，也不再是“你們這張卡多強”，而是——“PUE能做到多少？”、“支持異構卡嗎？”、“我們現有模型能跑進去嗎？”這種提問方式的變化，本身就說明了一件事：中國算力產業，正在從“能造出來”轉向“能用起來”；從“單點突破”，走向以超節點為代表的“體系能力”競爭。

大模型是推動這一轉變的直接動力。在百億、千億、萬億參數的大模型時代，單一設備的性能早已無法撐起整個模型生命周期。行業真正需要的，不再是一塊更強的卡，而是一套可長期運行、穩定協同、按需擴展、可預期運維的算力系統。也正是在這個背景下，我們看到了今年世界計算大會上一幕頗具象征意味的場景——華為與曙光，兩個體系范式的代表，同臺亮相，以各自的方式展示了對“新型算力體系”的回答。

曙光與華為同場，雙路線體系首次并行亮相

在眾多展臺中，最受關注的兩臺設備并不孤單——一邊是曙光發布的scaleX640超節點，另一邊是華為展示的全棧384卡集成系統。一個強調“開放協同”，一個主打“全棧深耕”。它們并肩而立，像是在向整個行業展示一個信號：中國算力的范式，不止一條路線。這不是簡單的“誰更強”，也不是參數層面的PK，而是兩種完全不同的體系構建思路在同場域里展開了對話。它們并沒有誰取代誰，而是在逐漸構建一個“雙路線并行”的生態格局。

曙光主張構建一個開放的、可適配多種異構加速卡的協同體系。scaleX640超節點的核心，并不是“640卡”這個數字，而是它試圖把“算、存、網、電、冷、調度”這些底層模塊真正封裝為一個可復制、可部署的體系單元——不只是強，而是能用、能管、能擴。

相比之下，華為走的是一條更具控制力的“深度封裝”路徑，從芯片到通信、從算力到模型框架，每一個環節都自研、自控、自洽，追求的是高一致性、高性能、高可用。這種體系適用于對穩定性、安全性、確定性要求極高的大模型訓練平臺。雖然路徑不同，但要打造“體系化算力”，兩者都繞不過幾道共同的關口。

首先是通信瓶頸。算力節點數量的提升帶來了指數級增長的數據交換量，如果通信架構不合理，即便算力再強也可能被“拖死”。曙光通過在單柜內構建高密度通信域，讓GPU之間實現無中轉直連，有效降低跨卡延遲；華為則依托自主拓撲，確保資源調度與通信高效協同，跑大模型時依然能保持系統穩定。

第二是能效。單柜熱密度一旦突破50kW，傳統風冷就“搬”不走熱量了。scaleX640超節點采用的是浸沒相變液冷，把PUE壓到1.04；華為則通過閉環液冷與模塊化供電，把散熱、功耗和部署維護全部打包成一體化系統。第三，是系統調度與資源彈性。大模型時代不允許系統崩一次、任務全重跑。調度系統必須既要靈活，又要容錯。

兩家在這方面都強調了訓推一體、資源動態調度、自愈機制——不是為了炫技，而是因為只有這樣，體系才跑得起來、跑得穩。這些工程挑戰的出現，也說明一個事實：算力已經不只是“造出設備”，而是必須具備工業系統化能力。真正的“體系級算力”，要從通信到能效、從調度到兼容，每一環都能抗得住現實落地的壓力。

“開放協同” vs “全棧閉環”：雙路線分野全面成型

如果說前幾年大家還在討論“誰的GPU更強”“誰的芯片算得快”，那么今年的世界計算大會，則真正將國產算力的討論維度，拉到了“體系能力”的層面。曙光與華為并肩亮相，同為國產超節點代表，卻走出了兩條完全不同的系統路徑：一個強調開放協同，一個追求全棧閉環。兩者背后，是中國算力體系建設正邁入深水區的真實寫照。

曙光scaleX640超節點的技術價值，不在“640卡”數字本身，而在于其作為“體系能力”的工程樣本打造可部署、可復制的“算力積木”。支持主流大模型與異構平臺適配，兼顧高可用性與通用性；更重要的是，曙光率先支持多品牌AI加速卡，避免被鎖死單一供應鏈，具備長期演進能力。

相比之下，華為構建的是另一種“閉環式”全棧體系——從芯片、架構、框架到調度平臺全面自研，追求高一致性與控制力。其通信設計涵蓋張量切分與訓練節奏等關鍵路徑優化，調度平臺支持復雜策略與自動容錯，能效體系也通過整機冗余與機房級熱管理前置設計，確保PUE穩定、部署標準化。兩者路徑雖異，背后都體現了中國算力體系“從可研制到可部署”的躍遷。

當然，這種深度一致性的體系，也意味著更高的生態封閉度：只有在華為全棧體系下，才可發揮其最大性能。但對很多場景，“穩定可控”勝于“通用適配”，華為這種從底層到應用一體的戰略打法，也是定制化的體系路徑探索。

一個強調“可部署、可適配”，一個追求“可控、可閉環”。雖然思路不同，但它們共同構成了中國算力體系的雙范式格局，也標志著我們第一次在“系統級能力”上，走出了自己的技術岔路。曙光給出的體系方案，讓AI部署這件事從“超大機構的高定項目”，變成了更多企業“可以負擔、可以規劃”的基礎生產力資源；華為則提供了一種系統級的算力安全底座，在最不可妥協的場景里，用全棧閉環打通縱深戰略路徑。

而當這兩種能力可以并行、可選、可替、可演進時，中國算力體系的厚度與彈性，才真正建立起來。這背后也意味著，中國第一次真正擁有了“不靠別人定范式”的能力。過去，我們花了十幾年追趕國際性能指標；今天，我們開始有能力基于自身業務場景、應用需求和產業規劃，去反過來定義“什么才是適合中國的算力體系”。

這不是一種技術超越，而是一種系統成熟。

未來中國算力的核心競爭力，不會只是某個芯片多強、某條線路多快，而是——我們能不能持續構建一整套“體系即能力”的交付標準，讓AI成為真正可工業化部署的新型生產力。而這一次，中國已經不只是跟跑者。我們終于開始寫自己的體系規范。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.