網易首頁 > 網易號 > 正文申請入駐

超節點洗牌AI算力格局，壁仞、浪潮信息、無問芯穹等掀起智算革命

2025-09-15 17:35:13　來源: 芯流智庫

黑龍江舉報

分享至

【摘要】一場由大模型引爆的算力革命，正從單芯片的物理極限走向超節點的系統級創新，AI基礎設施的競爭法則迎來新一輪重構。

從華為的全對等互聯、壁仞科技的光互連突破，到浪潮信息的“元腦”商用部署，再到無問芯穹的生態共建，一場由硬件到軟件、由單點突破到系統協同的智算革命，正在全面加速。

以下為正文：

超節點興起

近年來，DeepSeek-R1、Qwen3、MiniMax-VL-01、GLM 4.5等開源模型頻繁涌現，各廠商開啟大模型競賽，算力需求走向新高，AI基礎正面臨前所未有的挑戰。

麥肯錫研究報告預測，到2030年，全球數據中心投資規模或達6.7萬億美元，其中5.2萬億美元將用于支持人工智能算力需求，推動數據中心總裝機容量增至219GW。

與此同時，單芯片的顯存與帶寬愈發難以支撐萬億參數大模型，大模型推理的實時性要求又與多卡互聯長鏈路的延遲性產生沖突，由此，超節點架構成為應對性能瓶頸、響應市場需求的關鍵。

當前，超節點技術可突破單服務器限制，并通過NVLink/UB等高速互聯技術，將GPU間通信時延壓縮至百納秒級，極大提升資源調度效率。

在2025世界人工智能大會上，華為、中興、新華三、超聚變等中國企業紛紛推出智算超節點方案。

其中，華為昇騰384超節點（Atlas 900 A3 SuperPoD）是這一架構的典型代表，其集成了384個昇騰 910C 神經網絡處理單元(NPU)和192個鯤鵬920中央處理器(CPU)，采用華為自研的MatrixLink高速互聯技術，實現全對等互聯。

根據官方數據，在昇騰超節點集群上，LLaMA 3等千億稠密模型性能相比傳統集群提升2.5倍以上，在通信占比更高的Qwen、DeepSeek等多模態、MoE模型上，可以達到3倍以上的提升。

2025年，超節點已成為智算中心的核心架構，從互聯網巨頭到電信運營商，從創業公司到芯片龍頭，無不在這場變革中重新尋找自己的位置。

從傳輸到散熱

技術實現角度，想要擴大超節點規模，首先需要增加機柜與服務器連接數量。

而與傳統的銅纜相比，光纜具有遠距離傳輸優勢，可實現數據交付與機柜解耦與萬卡級彈性拓展，兼容現有機房設施降低部署成本，并按算力需求動態調整超節點規模，實現分階段建設。

基于此，業內頭部公司正在合作解決這一問題。

今年7月，曦智科技、壁仞科技、中興通訊聯合推出光躍LightSphere X，成為全球首個分布式光互連光交換GPU超節點解決方案，并獲得2025 WAIC SAIL大獎。

據悉，該超節點基于曦智科技全球首創的分布式光交換技術，采用硅光技術的光互連光交換芯片，搭配壁仞科技自主原創架構的大算力通用GPU液冷模組與全新載板，并搭載中興通訊高性能AI國產服務器及儀電智算云平臺軟件。

目前，曦智科技已與國內領先的光/電晶圓廠、光/電封裝廠、算力/交換芯片廠商、系統廠商等建立起全方位、多層次的戰略合作關系。

通過產業鏈上下游的深度協同與聯合技術攻關，公司在超節點建設、CPO等關鍵領域實現多項突破。這一緊密協作的體系不僅顯著提升了產品兼容性與系統效能，也實現了從核心器件到算力基礎設施的全鏈路協同優化，也為構建高效、開放、安全的新一代算力生態奠定了堅實基礎。

整個系統中，壁仞科技承擔關鍵的動力引擎角色，其產品不是普通的顯卡GPU，而是用于AI訓練、高性能計算等領域的超級計算芯片，計算能力非常強大，加上業內伙伴的加持，計算單元性能效率極高，特別適用于需要處理海量數據的場景。光躍LightSphere X方案也即將于上海儀電智算中心落地，計劃實現數千卡規模商業化部署。

此前壁仞科技相關負責人透露，從光直連技術到光互連光交換OCS GPU超節點，這已經是壁仞和曦智兩家合作實現的第三代產品。據悉，壁仞在第一代產品上便已實現真正意義上的超節點。

針對包含Deepseek的大模型訓練與推理需求，該方案可顯著縮短訓練時間、提升算力利用率并降低算力成本。與此同時，作為上海的標桿項目，該方案將有效推動上海本地光芯片、液冷技術、GPU模組等產業的協同發展，迅速形成“技術-產品-服務”的閉環生態。

此外，光交換芯片的低功耗特性及液冷技術的應用，能夠助力數據中心綠色轉型，也符合國家“雙碳”目標。

這一案例也可看出，超節點的散熱正逐漸從傳統風冷走向液冷。

IDC數據顯示，中國液冷服務器市場在2024年市場規模達到23.7億美元，同比增長67.0%，預計2024-2029年，中國液冷服務器市場年復合增長率將達到46.8%，2029年市場規模將達到162億美元。

從2024年數據來看，浪潮信息、超聚變和寧暢占據了液冷服務器市場七成左右的銷售份額，傳統服務器廠商正依托其硬件設計經驗與全鏈條方案加速融入AI服務器協同場景。

2025年開放計算技術大會上，浪潮信息發布面向萬億參數大模型的“元腦SD200”，可運行1.2萬億參數的Kimi K2，并支持DeepSeek、Qwen、Kimi、GLM等多模型并行，目前已投入商用。

不過，浪潮信息的該款超節點產品采用了電互聯和風冷技術，并未采用新興的光互聯與液冷技術，公司也表示在未來面向更高密度部署時將推進高壓直流供電、液冷散熱等方案。

硬件加碼與生態競爭

國產AI芯片與服務器廠商紛紛擁抱超節點的同時，一個典型特征是集體作戰。

據《科創板日報》報道，燧原科技云燧ESL超節點系統正在測試中，單節點最高64卡全帶寬互聯，采用液冷方案，可實現9216GB單節點存儲容量、230TB/s單節點存儲帶寬、51.2TB/s單節點聚合帶寬、單節點可支持PD分離優化。

沐曦集成則在WAIC大會上發布旗艦GPU曦云C600，首發訓推一體技術全棧方案，該芯片可支持MetaXLink超節點擴展技術。

與之共同沖刺科創板的摩爾線程首次提出AI工廠理念，其自研KUAE計算集群通過5D大規模分布式并行計算技術，可實現上千節點的高效協作。

此外，超節點競爭不僅拼硬件性能，也拼生態。

尤其是在CUDA生態差距之下，本土芯片企業正通過合縱連橫與開放生態加速追趕。

面對大模型的底層應用，階躍星辰聯合近10家芯片及基礎設施廠商，共同發起“模芯生態創新聯盟”，首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。

其中，無問芯穹與模速空間、華為昇騰開啟百億生態共建合作，華為昇騰910B加速卡已上線模速空間算力生態平臺，無穹AI云總算力規模超25000P。

與此同時，壁仞科技聯合創始人、CTO洪洲強調了一個現實，即兼容CUDA生態也很重要，而且不會妨礙創新，但不要把GPGPU和DSA對立起來，英偉達新的智算GPU也在不斷增加低比特精度矩陣運算，動態量化和數據搬運DSAs。

作為AI芯片企業中身段、戰略相對靈活的一家，壁仞除了關注芯片架構創新之外，尤其關注軟硬結合的系統級優化，這對其打造萬卡集群解決方案，實現了超大規模算力的高效利用具有重要作用。

此外，浪潮信息的元腦SD200也基于OCM（開放算力模組）與OAM（開放加速模塊）兩大架構打造，在開放架構下支持多樣化芯片、開放AI框架及主流開發工具，實現跨平臺兼容與擴展。

從硬件兼容到軟件適配，生態完善度對超節點方案的最終競爭力起著至關重要的作用。

尾聲

超節點架構的興起正在重塑整個AI算力產業鏈，從芯片制造、先進封裝到光互連技術、液冷散熱，再到系統集成與解決方案，每個環節都需要有企業頂上。

這一新技術的興起也標志著AI算力競爭從單芯片性能比拼進入系統級能力較量階段，既提高了競爭門檻，又創造了新的價值分配模式。

當前，華為、壁仞、浪潮信息、曦智、無問芯穹等企業已率先起跑，但超節點之戰才剛剛開始。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.