![]()
【摘要】一場由大模型引爆的算力革命,正從單芯片的物理極限走向超節點的系統級創新,AI基礎設施的競爭法則迎來新一輪重構。
從華為的全對等互聯、壁仞科技的光互連突破,到浪潮信息的“元腦”商用部署,再到無問芯穹的生態共建,一場由硬件到軟件、由單點突破到系統協同的智算革命,正在全面加速。
以下為正文:
01
超節點興起
近年來,DeepSeek-R1、Qwen3、MiniMax-VL-01、GLM 4.5等開源模型頻繁涌現,各廠商開啟大模型競賽,算力需求走向新高,AI基礎正面臨前所未有的挑戰。
麥肯錫研究報告預測,到2030年,全球數據中心投資規模或達6.7萬億美元,其中5.2萬億美元將用于支持人工智能算力需求,推動數據中心總裝機容量增至219GW。
與此同時,單芯片的顯存與帶寬愈發難以支撐萬億參數大模型,大模型推理的實時性要求又與多卡互聯長鏈路的延遲性產生沖突,由此,超節點架構成為應對性能瓶頸、響應市場需求的關鍵。
當前,超節點技術可突破單服務器限制,并通過NVLink/UB等高速互聯技術,將GPU間通信時延壓縮至百納秒級,極大提升資源調度效率。
在2025世界人工智能大會上,華為、中興、新華三、超聚變等中國企業紛紛推出智算超節點方案。
![]()
其中,華為昇騰384超節點(Atlas 900 A3 SuperPoD)是這一架構的典型代表,其集成了384個昇騰 910C 神經網絡處理單元(NPU)和192個鯤鵬920中央處理器(CPU),采用華為自研的MatrixLink高速互聯技術,實現全對等互聯。
根據官方數據,在昇騰超節點集群上,LLaMA 3等千億稠密模型性能相比傳統集群提升2.5倍以上,在通信占比更高的Qwen、DeepSeek等多模態、MoE模型上,可以達到3倍以上的提升。
2025年,超節點已成為智算中心的核心架構,從互聯網巨頭到電信運營商,從創業公司到芯片龍頭,無不在這場變革中重新尋找自己的位置。
02
從傳輸到散熱
技術實現角度,想要擴大超節點規模,首先需要增加機柜與服務器連接數量。
而與傳統的銅纜相比,光纜具有遠距離傳輸優勢,可實現數據交付與機柜解耦與萬卡級彈性拓展,兼容現有機房設施降低部署成本,并按算力需求動態調整超節點規模,實現分階段建設。
基于此,業內頭部公司正在合作解決這一問題。
今年7月,曦智科技、壁仞科技、中興通訊聯合推出光躍LightSphere X,成為全球首個分布式光互連光交換GPU超節點解決方案,并獲得2025 WAIC SAIL大獎。
據悉,該超節點基于曦智科技全球首創的分布式光交換技術,采用硅光技術的光互連光交換芯片,搭配壁仞科技自主原創架構的大算力通用GPU液冷模組與全新載板,并搭載中興通訊高性能AI國產服務器及儀電智算云平臺軟件。
目前,曦智科技已與國內領先的光/電晶圓廠、光/電封裝廠、算力/交換芯片廠商、系統廠商等建立起全方位、多層次的戰略合作關系。
通過產業鏈上下游的深度協同與聯合技術攻關,公司在超節點建設、CPO等關鍵領域實現多項突破。這一緊密協作的體系不僅顯著提升了產品兼容性與系統效能,也實現了從核心器件到算力基礎設施的全鏈路協同優化,也為構建高效、開放、安全的新一代算力生態奠定了堅實基礎。
整個系統中,壁仞科技承擔關鍵的動力引擎角色,其產品不是普通的顯卡GPU,而是用于AI訓練、高性能計算等領域的超級計算芯片,計算能力非常強大,加上業內伙伴的加持,計算單元性能效率極高,特別適用于需要處理海量數據的場景。光躍LightSphere X方案也即將于上海儀電智算中心落地,計劃實現數千卡規模商業化部署。
此前壁仞科技相關負責人透露,從光直連技術到光互連光交換OCS GPU超節點,這已經是壁仞和曦智兩家合作實現的第三代產品。據悉,壁仞在第一代產品上便已實現真正意義上的超節點。
針對包含Deepseek的大模型訓練與推理需求,該方案可顯著縮短訓練時間、提升算力利用率并降低算力成本。與此同時,作為上海的標桿項目,該方案將有效推動上海本地光芯片、液冷技術、GPU模組等產業的協同發展,迅速形成“技術-產品-服務”的閉環生態。
此外,光交換芯片的低功耗特性及液冷技術的應用,能夠助力數據中心綠色轉型,也符合國家“雙碳”目標。
這一案例也可看出,超節點的散熱正逐漸從傳統風冷走向液冷。
IDC數據顯示,中國液冷服務器市場在2024年市場規模達到23.7億美元,同比增長67.0%,預計2024-2029年,中國液冷服務器市場年復合增長率將達到46.8%,2029年市場規模將達到162億美元。
![]()
從2024年數據來看,浪潮信息、超聚變和寧暢占據了液冷服務器市場七成左右的銷售份額,傳統服務器廠商正依托其硬件設計經驗與全鏈條方案加速融入AI服務器協同場景。
2025年開放計算技術大會上,浪潮信息發布面向萬億參數大模型的“元腦SD200”,可運行1.2萬億參數的Kimi K2,并支持DeepSeek、Qwen、Kimi、GLM等多模型并行,目前已投入商用。
不過,浪潮信息的該款超節點產品采用了電互聯和風冷技術,并未采用新興的光互聯與液冷技術,公司也表示在未來面向更高密度部署時將推進高壓直流供電、液冷散熱等方案。
03
硬件加碼與生態競爭
國產AI芯片與服務器廠商紛紛擁抱超節點的同時,一個典型特征是集體作戰。
據《科創板日報》報道,燧原科技云燧ESL超節點系統正在測試中,單節點最高64卡全帶寬互聯,采用液冷方案,可實現9216GB單節點存儲容量、230TB/s單節點存儲帶寬、51.2TB/s單節點聚合帶寬、單節點可支持PD分離優化。
沐曦集成則在WAIC大會上發布旗艦GPU曦云C600,首發訓推一體技術全棧方案,該芯片可支持MetaXLink超節點擴展技術。
與之共同沖刺科創板的摩爾線程首次提出AI工廠理念,其自研KUAE計算集群通過5D大規模分布式并行計算技術,可實現上千節點的高效協作。
此外,超節點競爭不僅拼硬件性能,也拼生態。
尤其是在CUDA生態差距之下,本土芯片企業正通過合縱連橫與開放生態加速追趕。
面對大模型的底層應用,階躍星辰聯合近10家芯片及基礎設施廠商,共同發起“模芯生態創新聯盟”,首批成員包括華為昇騰、沐曦、壁仞科技、燧原科技、天數智芯、無問芯穹、寒武紀、摩爾線程、硅基流動等。
其中,無問芯穹與模速空間、華為昇騰開啟百億生態共建合作,華為昇騰910B加速卡已上線模速空間算力生態平臺,無穹AI云總算力規模超25000P。
與此同時,壁仞科技聯合創始人、CTO洪洲強調了一個現實,即兼容CUDA生態也很重要,而且不會妨礙創新,但不要把GPGPU和DSA對立起來,英偉達新的智算GPU也在不斷增加低比特精度矩陣運算,動態量化和數據搬運DSAs。
作為AI芯片企業中身段、戰略相對靈活的一家,壁仞除了關注芯片架構創新之外,尤其關注軟硬結合的系統級優化,這對其打造萬卡集群解決方案,實現了超大規模算力的高效利用具有重要作用。
此外,浪潮信息的元腦SD200也基于OCM(開放算力模組)與OAM(開放加速模塊)兩大架構打造,在開放架構下支持多樣化芯片、開放AI框架及主流開發工具,實現跨平臺兼容與擴展。
從硬件兼容到軟件適配,生態完善度對超節點方案的最終競爭力起著至關重要的作用。
04
尾聲
超節點架構的興起正在重塑整個AI算力產業鏈,從芯片制造、先進封裝到光互連技術、液冷散熱,再到系統集成與解決方案,每個環節都需要有企業頂上。
這一新技術的興起也標志著AI算力競爭從單芯片性能比拼進入系統級能力較量階段,既提高了競爭門檻,又創造了新的價值分配模式。
當前,華為、壁仞、浪潮信息、曦智、無問芯穹等企業已率先起跑,但超節點之戰才剛剛開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.