【環球網科技報道 記者 張陽】當前,人工智能產業正在經歷從生成式AI向智能體(Agentic AI)時代的躍遷。當大模型參數規模突破萬億級、訓練數據量達到10萬億Token量級時,算力需求呈現出十倍乃至百倍的爆發式增長。然而,傳統依賴服務器堆疊與以太網聯接的集群架構,正遭遇規模擴張與效率衰減的結構性矛盾——集群規模越大,算力利用率反而越低,訓練中斷頻率越高。
Meta在其Llama 3.1技術論文中披露的數據極具警示意義:在1.6萬卡H100集群的54天訓練過程中,累計中斷419次,平均每天近8次故障。這一數據揭示了傳統架構的致命短板:當計算節點通過低速網絡簡單聯接時,通信瓶頸、內存碎片化、調度開銷等問題會隨著規模擴張呈指數級惡化。
在此背景下,華為于MWC2026巴塞羅那首次向海外展示的Atlas 950 SuperPoD、TaiShan 950 SuperPoD等多款超節點產品及解決方案,標志著算力基礎設施建設正從“物理堆疊”走向“邏輯統一”的范式轉換。通過自研靈衢(Unified Bus)互聯協議,華為將最多8192張昇騰NPU卡整合為單一計算實體,使萬卡級集群在邏輯上如同一臺計算機協同工作。這種“集群+超節點”的系統級架構創新,本質上是對算力組織方式的重構,搭配全維度的開源開放生態布局,為全球算力產業發展提供了又一種選擇。
![]()
靈衢協議的技術突破:重新定義超節點的三大核心要素
超節點并不是將更多的計算單元進行連接,其技術內涵有著嚴格的界定標準。華為提出的“超大帶寬、超低時延、內存統一編址”三大核心要素,為行業提供了重要的技術參考框架。
在帶寬層面,Atlas 950 SuperPoD采用獨創的UB-Mesh遞歸直連拓撲網絡架構,支持單板內、單板間和機架間的NPU全互聯,靈衢全光互聯帶寬達到16.3PB/s。這一指標達到業界水平的62倍,徹底解決了大規模并行計算中的數據搬運瓶頸。
![]()
在時延層面,傳統以太網架構下跨節點通信時延通常在微秒級,而靈衢協議將RTT通信時延從7微秒降至3微妙,實現50%優化。對于金融風控等要求響應時間在10毫秒以下的場景,這種時延突破具有決定性意義。
在內存架構層面,Atlas 950 SuperPoD實現1152TB共享內存池,通過內存統一編址技術,數據可在計算節點間快速調取,避免了傳統架構中因數據搬運造成的算力空轉。FP8算力達8EFLOPS、FP4算力16EFLOPS的性能指標,分別達到業界水平的6.7倍。
值得注意的是,華為的技術演進遵循明確的版本迭代路徑。2025年3月推出的Atlas 900超節點基于靈衢1.0,滿配384卡,已在互聯網、電信、制造等行業商用部署數百套,驗證了技術的成熟度。此次展示的Atlas 950 SuperPoD基于優化升級的靈衢2.0,最大支持8192卡全互聯,實現了從“可用”到“領先”的跨越。
全場景產品矩陣:智算與通算的雙輪驅動
值得注意的是,華為此次展示的不僅是AI超節點,還包括全球首款通算超節點TaiShan 950 SuperPoD。這反映出一個關鍵趨勢:未來算力基礎設施必須兼顧通用計算與智能計算的雙重需求。
在智算領域,Atlas 950 SuperPoD定位為面向超大規模AI計算任務的全液冷解決方案,采用正交架構與零線纜電互聯設計,結合液冷接頭浮動盲插技術實現零漏液,光模塊液冷可靠性提升一倍。針對傳統風冷機房環境,Atlas 850E作為業界首個企業級風冷AI超節點服務器,支持8到1024卡靈活擴展,填補了風冷條件下的超節點部署空白。
在通算領域,TaiShan 950 SuperPoD作為業界首款通算超節點,具備百納秒級超低時延、TB級超大帶寬和48TB內存池化能力,為數據庫、虛機熱遷移、大數據處理等傳統通算場景開辟了性能提升的全新路徑。配合TaiShan 500、TaiShan 200等系列服務器,形成了高、中、低全梯度的通算產品體系。
開源開放戰略:從技術領先到生態共贏
技術創新的價值最終需要通過生態繁榮來實現。華為在此次展示中重申的開源開放戰略,是其算力底座能夠獲得全球認可的關鍵支撐。
在基礎軟件層面,openEuler操作系統社區已匯聚超2100家企業與機構,裝機量突破1600萬套,成為全球領先的開源操作系統社區。2021年華為將openEuler捐贈給開放原子開源基金會后,仍保持持續貢獻。
在AI軟件棧層面,華為于2025年底實現CANN異構計算架構的全面開源開放,算子庫、加速庫、圖計算、編程語言等27個軟件包、37個代碼倉全部向開發者開放。目前CANN已支持65+全球主流開源大模型、50+開源項目,代碼貢獻行超過百萬行,并與PyTorch、vLLM、xLLM、SGlang、Triton等主流開源社區實現深度適配。
這種開源開放策略的意義在于:通過分層解耦的架構設計,各行業客戶可以基于開源社區自主開發高性能算子,實現真正的自主創新。對于運營商、金融、制造等關鍵行業而言,這意味著不再受制于封閉的技術體系,而是能夠基于開放的算力底座構建自有能力。
全球算力格局的新變量
MWC26上華為超節點產品的海外首秀,發生在全球AI算力競爭格局深刻調整的背景下。為世界提供“新選擇”,意味著在當前以某種架構為主導的算力版圖之外,畫出了另一條清晰可行的路徑。這條路徑不是簡單的替代,而是基于對AI時代算力本質需求的理解,提供的一種更高效、更開放、更具韌性的可能性。
從產業視角審視,超節點技術的成熟與商用,正在推動三個層面的結構性變化:其一,算力建設從“芯片中心主義”轉向“系統架構優化”,互聯協議、拓撲結構、散熱設計等系統工程能力的重要性顯著提升;其二,算力供給從“標準化產品”轉向“場景化解決方案”,不同規模、不同冷卻條件、不同業務負載的客戶都能獲得適配方案;其三,算力生態從“封閉壟斷”轉向“開放共贏”,開源社區成為技術創新與產業協作的核心載體。
MWC2026的展示,標志著這一技術選擇正式走向全球市場。超節點時代已經開啟,堅實的算力底座,正為智能世界的下一程鋪路。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.