網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

不拼GPU！中興扔出AI超節(jié)點(diǎn)，把token價(jià)格打下來(lái)

2026-03-27 21:37:17　來(lái)源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：桃子

【新智元導(dǎo)讀】在萬(wàn)億級(jí)大模型橫行的時(shí)代，單純靠「堆芯片」已經(jīng)玩不動(dòng)了。中興交出了一份不一樣的答卷：跳出單一芯片的性能內(nèi)卷，靠「系統(tǒng)級(jí)協(xié)同」重構(gòu)智算底座。

當(dāng)前AI大模型參數(shù)規(guī)模已突破萬(wàn)億量級(jí)，單GPU芯片的物理功耗密度、互連帶寬與內(nèi)存容量瓶頸，成為制約算力發(fā)展的核心問(wèn)題，傳統(tǒng)「芯片堆砌」的算力建設(shè)模式，正面臨通信開(kāi)銷(xiāo)劇增、算力利用率驟降的行業(yè)共性痛點(diǎn)。

隨著技術(shù)的快速演進(jìn)和迭代，當(dāng)前已經(jīng)不是「一顆芯片決定算力」的時(shí)代，AI基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)正在由「單一芯片」轉(zhuǎn)向以「整機(jī)系統(tǒng)」為核心的競(jìng)爭(zhēng)。

在各大GPU廠商聚焦芯片研發(fā)競(jìng)賽的背景下，中興通訊從系統(tǒng)級(jí)協(xié)同架構(gòu)出發(fā)，推出超節(jié)點(diǎn)技術(shù)，通過(guò)重構(gòu)算力互聯(lián)體系，將數(shù)十至數(shù)百顆多廠家GPU邏輯整合為統(tǒng)一計(jì)算單元，實(shí)現(xiàn)了算力的系統(tǒng)級(jí)優(yōu)化。

近期中興通訊發(fā)布的《中興通訊超節(jié)點(diǎn)白皮書(shū)》，不僅為突破單GPU芯片瓶頸提供了全新解決方案，更重塑了AI算力基礎(chǔ)設(shè)施的構(gòu)建邏輯，其背后的技術(shù)創(chuàng)新與設(shè)計(jì)思路，對(duì)整個(gè)智算行業(yè)的發(fā)展都具有重要的參考意義。

核心底層邏輯

跳出GPU競(jìng)賽，錨定系統(tǒng)級(jí)算力協(xié)同

面對(duì)單GPU芯片的性能瓶頸，行業(yè)內(nèi)早已形成共識(shí)，即通過(guò)高速無(wú)損互聯(lián)技術(shù)將多顆GPU整合為邏輯上的「超級(jí)計(jì)算機(jī)」，是突破單芯片性能上限的核心技術(shù)路徑，中興超節(jié)點(diǎn)的底層設(shè)計(jì)邏輯，正是深度契合這一行業(yè)趨勢(shì)，跳出單芯片性能競(jìng)賽的傳統(tǒng)思路，將核心發(fā)力點(diǎn)放在系統(tǒng)級(jí)的算力協(xié)同上。

從第三方視角來(lái)看，這一選擇既避開(kāi)了GPU芯片研發(fā)的高壁壘、長(zhǎng)周期競(jìng)爭(zhēng)，又精準(zhǔn)切中了當(dāng)前算力建設(shè)的核心痛點(diǎn)——傳統(tǒng)模式的問(wèn)題并非單芯片性能不足，而是多芯片協(xié)同的效率過(guò)低。

中興超節(jié)點(diǎn)并非GPU的簡(jiǎn)單物理堆砌，而是融合多芯片、整機(jī)硬件、高速互聯(lián)與配套軟件的集成系統(tǒng)，其構(gòu)建嚴(yán)格遵循四大核心前提，為系統(tǒng)級(jí)算力協(xié)同筑牢基礎(chǔ)：

一是芯片能力的均衡性，要求GPU的算力、顯存、互聯(lián)帶寬三者匹配，避免資源浪費(fèi)；

二是互聯(lián)架構(gòu)的有效性，超節(jié)點(diǎn)內(nèi)任意GPU間的互聯(lián)帶寬達(dá)到機(jī)間互聯(lián)的8倍左右，兼顧通信效率、擴(kuò)展性與場(chǎng)景適配性；

三是內(nèi)存訪(fǎng)問(wèn)的便捷性，所有GPU支持統(tǒng)一內(nèi)存編址，兼容內(nèi)存語(yǔ)義和消息語(yǔ)義，保障編程易用性與數(shù)據(jù)訪(fǎng)問(wèn)效率；

四是架構(gòu)擴(kuò)展的原生性，且集群擴(kuò)展后仍屬于高帶寬域，滿(mǎn)足算力按需配置的需求。

這四大前提的設(shè)計(jì)，讓中興超節(jié)點(diǎn)從底層就確立了「系統(tǒng)級(jí)算力最優(yōu)」的目標(biāo)，所有后續(xù)技術(shù)創(chuàng)新均圍繞這一核心展開(kāi)。

硬件架構(gòu)創(chuàng)新

OEX正交無(wú)背板互聯(lián)，重構(gòu)GPU物理協(xié)同基礎(chǔ)

傳統(tǒng)GPU集群依賴(lài)Cable Tray線(xiàn)纜架構(gòu)，存在信號(hào)損耗大、算力密度低、運(yùn)維難度高、組網(wǎng)成本高的明顯短板，這也是制約多GPU協(xié)同效率的物理層關(guān)鍵問(wèn)題。

中興超節(jié)點(diǎn)在硬件架構(gòu)上的核心創(chuàng)新，就是推出了Orthogonal Electrical eXchange（OEX）正交無(wú)背板互聯(lián)交換架構(gòu)，這一架構(gòu)也于2025年成功入選ODCC「年度重大技術(shù)突破」案例，從第三方視角來(lái)看，這一創(chuàng)新實(shí)現(xiàn)了GPU物理互聯(lián)體系的底層重構(gòu)，為高密度、高可靠性的GPU協(xié)同奠定了物理基礎(chǔ)。

圖1 OEX互聯(lián)示意圖

OEX架構(gòu)的核心設(shè)計(jì)，是讓計(jì)算托盤(pán)與交換托盤(pán)實(shí)現(xiàn)垂直交叉物理直連，徹底摒棄傳統(tǒng)的高速線(xiàn)纜，通過(guò)正交連接器與單級(jí)交換拓?fù)錁?gòu)建無(wú)線(xiàn)纜的互聯(lián)體系，這一設(shè)計(jì)帶來(lái)的實(shí)際價(jià)值可通過(guò)白皮書(shū)的核心數(shù)據(jù)直觀體現(xiàn)：

在112G高速信號(hào)場(chǎng)景下，SerDes鏈路長(zhǎng)度縮短30%以上，直接消除了線(xiàn)纜引入的6.5dB插損，讓端到端鏈路插損余量大于3dB，大幅降低了誤碼率，為T(mén)B級(jí)互聯(lián)帶寬提供了穩(wěn)定的物理支撐；

無(wú)線(xiàn)纜設(shè)計(jì)直接釋放了機(jī)柜內(nèi)部的寶貴空間，讓標(biāo)準(zhǔn)機(jī)柜可集成64/128卡甚至更多GPU，實(shí)現(xiàn)了單位空間算力密度的跨越式提升；

同時(shí)從根源上減少了線(xiàn)纜松動(dòng)、老化導(dǎo)致的宕機(jī)風(fēng)險(xiǎn)，將系統(tǒng)故障修復(fù)時(shí)間MTTR從傳統(tǒng)的小時(shí)級(jí)縮短至分鐘級(jí)，完美適配AI大模型7×24小時(shí)不間斷訓(xùn)練的高可靠性需求；

此外，交換板內(nèi)集成參數(shù)面leaf交換，省去了傳統(tǒng)組網(wǎng)所需的leaf層級(jí)交換機(jī)、光模塊和光纖，在簡(jiǎn)化系統(tǒng)架構(gòu)的同時(shí)，顯著降低了組網(wǎng)的硬件成本與復(fù)雜度。

相較于行業(yè)內(nèi)其他正交架構(gòu)方案，中興OEX架構(gòu)的無(wú)集中式背板設(shè)計(jì)，進(jìn)一步降低了層間損耗與硬件復(fù)雜度，成為當(dāng)前高密度GPU互聯(lián)的優(yōu)質(zhì)物理架構(gòu)選擇。

圖2 OEX與Cable Tray方案對(duì)比

高速互聯(lián)技術(shù)創(chuàng)新

自研芯片+全維度優(yōu)化，打通算力協(xié)同通信瓶頸

GPU間的高效互聯(lián)是系統(tǒng)級(jí)算力協(xié)同的核心支撐，傳統(tǒng)GPU集群的「通信卡脖子」問(wèn)題，本質(zhì)是互聯(lián)帶寬、時(shí)延、協(xié)議兼容性的多重限制，而中興通訊依托其在通信領(lǐng)域數(shù)十年的技術(shù)積累，從芯片、物理層、協(xié)議層、計(jì)算卸載、擴(kuò)展性五個(gè)維度實(shí)現(xiàn)了高速互聯(lián)技術(shù)的全面創(chuàng)新，打造出適配AI算力需求的TB級(jí)通信通道，從第三方視角來(lái)看，這一系列創(chuàng)新將通信領(lǐng)域的技術(shù)優(yōu)勢(shì)與智算需求深度結(jié)合，真正解決了多GPU協(xié)同通信的核心痛點(diǎn)。

在核心硬件上，中興自研大容量交換芯片，成為高速互聯(lián)的基石，該芯片實(shí)現(xiàn)了三大突破：

帶寬與時(shí)延躍升至TB級(jí)、百納秒級(jí)，滿(mǎn)足海量AI數(shù)據(jù)的高速傳輸；

拓?fù)浼軜?gòu)從點(diǎn)對(duì)點(diǎn)升級(jí)為大規(guī)模全對(duì)等互聯(lián)，適配數(shù)十到數(shù)百顆GPU的協(xié)同計(jì)算；

全面兼容RDMA、CLink、OISA、Ethlink、SUE、UEC等國(guó)內(nèi)外主流互聯(lián)協(xié)議，為后續(xù)多廠家GPU兼容埋下伏筆。

在物理層選型上，中興放棄了傳統(tǒng)PCIe總線(xiàn)，選擇以太網(wǎng)物理層，白皮書(shū)數(shù)據(jù)顯示，PCIe 5.0 x16雙向帶寬僅約128GB/s，而以太網(wǎng)SerDes主流速率已達(dá)112Gbps，224Gbps產(chǎn)品已進(jìn)入商用階段，支持多通道靈活綁定，可輕松實(shí)現(xiàn)TB/s級(jí)端口帶寬，完美契合AI訓(xùn)練對(duì)超高帶寬的需求。

在協(xié)議層，中興立足開(kāi)放架構(gòu)，既支持UALink、ESUN等國(guó)際主流開(kāi)放協(xié)議，又積極參與工信部牽頭的CLink協(xié)議制定，推動(dòng)國(guó)內(nèi)算力互聯(lián)協(xié)議的統(tǒng)一，打破私有協(xié)議的生態(tài)壁壘。

同時(shí)，中興將在網(wǎng)計(jì)算技術(shù)深度集成至交換芯片，將GPU的高負(fù)載通信操作卸載至交換芯片完成，讓GPU專(zhuān)注核心計(jì)算，這一設(shè)計(jì)的優(yōu)化效果十分顯著：

在傳統(tǒng)稠密模型訓(xùn)練中，All-Reduce操作復(fù)雜度從O(logN)降至O(C)，大幅減少節(jié)點(diǎn)間消息傳遞次數(shù)；

在MoE混合專(zhuān)家模型訓(xùn)練中，Dispatch Multicast和Combine Reduce操作的分發(fā)時(shí)延下降20%-50%，歸約時(shí)延下降40%-60%以上，干線(xiàn)流量減少超30%，徹底解決了MoE模型通信開(kāi)銷(xiāo)大的行業(yè)難題。

此外，中興從互聯(lián)協(xié)議、拓?fù)洹⑽锢硇螒B(tài)、介質(zhì)四個(gè)維度做Scale-Up可擴(kuò)展性設(shè)計(jì)，預(yù)留GPU ID標(biāo)識(shí)bit位滿(mǎn)足未來(lái)十萬(wàn)級(jí)GPU集群尋址需求，采用線(xiàn)性無(wú)收斂擴(kuò)展拓?fù)浔苊馔ㄐ牌款i，以機(jī)柜為單元做模塊化設(shè)計(jì)實(shí)現(xiàn)「即插即用」擴(kuò)容，遵循「能銅盡銅，距遠(yuǎn)用光」原則兼顧傳輸效率與成本，為算力的無(wú)限擴(kuò)展提供了技術(shù)支撐。

功耗管理創(chuàng)新

液冷+高壓直流，適配高密度算力的能源需求

超節(jié)點(diǎn)的高密度GPU集成，必然帶來(lái)功耗的指數(shù)級(jí)增長(zhǎng)，白皮書(shū)援引英偉達(dá)的數(shù)據(jù)顯示，GPU超節(jié)點(diǎn)機(jī)柜功耗已從2022年H100的50kW，提升至2025年GB300 NVL72的120-150kW，未來(lái)更將向600kW乃至兆瓦級(jí)演進(jìn)，功耗與散熱問(wèn)題成為高密度算力建設(shè)的必解難題。

從第三方視角來(lái)看，中興超節(jié)點(diǎn)并未簡(jiǎn)單采用常規(guī)的散熱與供電方案，而是結(jié)合算力發(fā)展趨勢(shì)，打造了一套「前瞻布局、全維度適配」的功耗管理體系，從散熱和供電兩大維度實(shí)現(xiàn)創(chuàng)新，確保算力高效釋放的同時(shí)，實(shí)現(xiàn)能效最優(yōu)。

在散熱方面，中興構(gòu)建了全維度的液冷散熱體系，兼顧當(dāng)前需求與未來(lái)趨勢(shì)：

當(dāng)前階段采用單相冷板式液冷，這一方案是目前應(yīng)用最廣泛、工程化最成熟的液冷技術(shù)，市場(chǎng)占有率超過(guò)70%-80%，可有效支撐百千瓦級(jí)機(jī)柜的散熱需求；

針對(duì)未來(lái)單芯片功耗突破2000W的趨勢(shì)，未來(lái)規(guī)劃硅基微通道冷板和兩相冷板液冷技術(shù)，硅基微通道冷板適配HBM堆疊、Chiplet等先進(jìn)封裝的高熱流密度需求，兩相冷板液冷可在低流量下實(shí)現(xiàn)超高散熱效率；

同時(shí)兼容浸沒(méi)式液冷技術(shù)，為未來(lái)兆瓦級(jí)機(jī)柜的散熱需求提供解決方案。

液冷技術(shù)的全面應(yīng)用，不僅解決了高密度算力的散熱問(wèn)題，更推動(dòng)數(shù)據(jù)中心從「算力導(dǎo)向」向「能效導(dǎo)向」轉(zhuǎn)型，契合綠色智算的行業(yè)發(fā)展趨勢(shì)。

在供電方面，中興突破傳統(tǒng)48V/54V供電體系的物理極限，采用HVDC高壓直流供電架構(gòu)，主流演進(jìn)方向?yàn)椤?00V DC和800V DC，這一設(shè)計(jì)帶來(lái)的優(yōu)勢(shì)十分突出：同等功率下，電流可降低8-16倍，銅材用量減少40%-50%，為機(jī)柜內(nèi)的計(jì)算與冷卻組件釋放關(guān)鍵空間；有效抑制傳輸熱損，整體端到端供電效率提升3%-5%，在電力成本占比30%-50%的智算中心，這一提升能帶來(lái)顯著的運(yùn)營(yíng)成本節(jié)約；可輕松支撐從當(dāng)前100-150kW向250kW乃至1MW+級(jí)機(jī)柜的演進(jìn)需求；減少中間能量變換層級(jí)，從根本上緩解功率因數(shù)校正與無(wú)功功率管理壓力。

該架構(gòu)與OCP Diablo 400、英偉達(dá)800VDC等行業(yè)主流趨勢(shì)接軌，確保了供電體系的前瞻性與兼容性。

集群擴(kuò)展創(chuàng)新：Nebula Matrix集群超節(jié)點(diǎn)，實(shí)現(xiàn)算力規(guī)模化平滑升級(jí)

單臺(tái)單體超節(jié)點(diǎn)的算力終究有限，面對(duì)萬(wàn)億乃至十萬(wàn)億參數(shù)大模型的訓(xùn)練需求，算力的規(guī)模化擴(kuò)展成為必然要求，而傳統(tǒng)算力集群的擴(kuò)展往往面臨性能下降、成本激增、組網(wǎng)復(fù)雜等問(wèn)題。

從第三方視角來(lái)看，中興超節(jié)點(diǎn)的一大亮點(diǎn)，就是構(gòu)建了「單體超節(jié)點(diǎn)-集群超節(jié)點(diǎn)」的完整擴(kuò)展體系，通過(guò)Nebula Matrix集群超節(jié)點(diǎn)實(shí)現(xiàn)算力從百卡到萬(wàn)卡的平滑擴(kuò)展，既滿(mǎn)足了超大規(guī)模算力需求，又實(shí)現(xiàn)了性能與成本的最優(yōu)平衡。

中興Matrix集群超節(jié)點(diǎn)采用業(yè)界主流的「電交換+光互聯(lián)」技術(shù)路線(xiàn)，通過(guò)高性能電交換機(jī)實(shí)現(xiàn)機(jī)柜內(nèi)GPU間的互聯(lián)，受銅纜傳輸距離限制，跨機(jī)柜場(chǎng)景則采用光纖介質(zhì)完成互聯(lián)，這一路線(xiàn)依托電交換技術(shù)的高成熟度、高業(yè)務(wù)普適性，規(guī)避了全光交換技術(shù)門(mén)檻高、生態(tài)不完善、對(duì)業(yè)務(wù)適配要求高的問(wèn)題，成為當(dāng)前大規(guī)模集群超節(jié)點(diǎn)建設(shè)的最優(yōu)選擇。

基于這一路線(xiàn)，中興現(xiàn)有Nebula X32單體超節(jié)點(diǎn)可靈活擴(kuò)展為Nebula Matrix X256/800集群超節(jié)點(diǎn)，面向未來(lái)，依托更高密度的Nebula X128單體超節(jié)點(diǎn)，更可進(jìn)一步擴(kuò)展至X8192/16384的超大規(guī)模集群，充分滿(mǎn)足超大規(guī)模模型訓(xùn)練的算力需求。

同時(shí)，中興創(chuàng)新提出Scale-Up與Scale-Out網(wǎng)絡(luò)融合設(shè)計(jì)，打破了傳統(tǒng)兩類(lèi)網(wǎng)絡(luò)獨(dú)立組網(wǎng)的模式，Scale-Up網(wǎng)絡(luò)承載張量并行、專(zhuān)家并行等對(duì)帶寬和時(shí)延要求極高的通信流量，Scale-Out網(wǎng)絡(luò)承載數(shù)據(jù)并行、流水并行等對(duì)網(wǎng)絡(luò)性能要求相對(duì)較低的通信流量，融合后構(gòu)建統(tǒng)一的超節(jié)點(diǎn)互聯(lián)網(wǎng)絡(luò)，既滿(mǎn)足了集群超節(jié)點(diǎn)內(nèi)部的高性能互聯(lián)需求，又適配了集群間的常規(guī)互聯(lián)需求。

白皮書(shū)的模型測(cè)算顯示，這一融合架構(gòu)相比獨(dú)立組網(wǎng)模式，能顯著降低總擁有成本（TCO），同時(shí)保障了集群部署和擴(kuò)容的平滑性，讓用戶(hù)可根據(jù)算力需求按需擴(kuò)展，真正實(shí)現(xiàn)了「算力靈活選擇，性能與成本最佳平衡」。

軟件棧創(chuàng)新

打造超節(jié)點(diǎn)「操作系統(tǒng)」，充分釋放硬件算力潛能

硬件是算力的物理基礎(chǔ)，而軟件是釋放硬件算力的核心支撐，再好的硬件架構(gòu)，若缺乏適配的軟件體系，也無(wú)法將物理算力轉(zhuǎn)化為實(shí)際的有效算力。

從第三方視角來(lái)看，中興超節(jié)點(diǎn)的一大設(shè)計(jì)亮點(diǎn)，就是充分重視軟硬件的協(xié)同優(yōu)化，打造了一套深度協(xié)同、全棧優(yōu)化的軟件棧體系，將其定義為超節(jié)點(diǎn)的「操作系統(tǒng)」，實(shí)現(xiàn)了對(duì)硬件資源的統(tǒng)一調(diào)度、管理、優(yōu)化與監(jiān)控，確保物理層的所有創(chuàng)新都能轉(zhuǎn)化為實(shí)際的算力輸出。

這套軟件棧的創(chuàng)新體現(xiàn)在六大核心維度：

一是實(shí)現(xiàn)統(tǒng)一虛擬化資源池與智能編排，將超節(jié)點(diǎn)內(nèi)的算力、內(nèi)存、存儲(chǔ)資源抽象池化，根據(jù)AI訓(xùn)練、推理等不同工作負(fù)載需求，動(dòng)態(tài)彈性分配和隔離資源，支持多任務(wù)、多租戶(hù)環(huán)境下的共享與安全隔離；

二是做到極致通信優(yōu)化與拓?fù)涓兄ㄟ^(guò)深度優(yōu)化的通信庫(kù)和運(yùn)行時(shí)系統(tǒng)，自動(dòng)識(shí)別最優(yōu)數(shù)據(jù)傳輸路徑，結(jié)合計(jì)算與通信重疊、梯度壓縮等技術(shù)，將通信開(kāi)銷(xiāo)隱藏于計(jì)算過(guò)程之中，提升系統(tǒng)整體效率；

三是支持異構(gòu)計(jì)算統(tǒng)一調(diào)度與編譯器優(yōu)化，實(shí)現(xiàn)CPU/GPU/DSA等異構(gòu)單元的統(tǒng)一調(diào)度，通過(guò)算子融合、內(nèi)核生成等方式提升單卡效率與跨芯片協(xié)同效率；

四是構(gòu)建全棧可觀測(cè)性與智能運(yùn)維體系，實(shí)現(xiàn)芯片-節(jié)點(diǎn)-集群的多級(jí)監(jiān)控，實(shí)時(shí)可視化功耗、溫度、性能等指標(biāo)，結(jié)合AI運(yùn)維實(shí)現(xiàn)故障預(yù)測(cè)、根因分析，將故障定位時(shí)間從小時(shí)級(jí)縮短至分鐘級(jí)；

五是設(shè)置高可靠冗余機(jī)制，通過(guò)冗余算力節(jié)點(diǎn)與故障切換機(jī)制，避免單點(diǎn)故障導(dǎo)致的大模型訓(xùn)練中斷，保障業(yè)務(wù)連續(xù)性；

六是引入「算力-電力」協(xié)同的綠色調(diào)度，結(jié)合任務(wù)優(yōu)先級(jí)、功耗模型與實(shí)時(shí)電價(jià)，動(dòng)態(tài)調(diào)整算力調(diào)度與芯片頻率，在保障服務(wù)水平協(xié)議（SLA）的前提下，平滑功率波動(dòng)，降低能耗與運(yùn)營(yíng)成本。

此外，中興還打造了算力仿真平臺(tái)，為超節(jié)點(diǎn)的算力配置提供「數(shù)字孿生」推演能力，該平臺(tái)基于硬件參數(shù)、模型結(jié)構(gòu)、算子實(shí)測(cè)數(shù)據(jù)，可模擬不同超節(jié)點(diǎn)形態(tài)下的訓(xùn)練/推理性能，為用戶(hù)的硬件選型、并行策略設(shè)計(jì)提供科學(xué)依據(jù)。

白皮書(shū)以Qwen3-235B模型為例，通過(guò)算力仿真平臺(tái)得出結(jié)論：在2K卡的規(guī)模下，256卡超節(jié)點(diǎn)相比8卡服務(wù)器，訓(xùn)練性能提升15%，這一結(jié)果能有效幫助用戶(hù)規(guī)避試錯(cuò)成本，實(shí)現(xiàn)算力配置的最優(yōu)選擇。

圖3 Qwen3-235B不同超節(jié)點(diǎn)形態(tài)最優(yōu)切分下各部分耗時(shí)

多維度設(shè)計(jì)

實(shí)現(xiàn)多廠家GPU兼容，打破生態(tài)鎖定

在各大廠商紛紛構(gòu)建封閉算力生態(tài)的背景下，中興超節(jié)點(diǎn)將多廠家GPU兼容作為核心創(chuàng)新點(diǎn)之一，這一設(shè)計(jì)不僅是其「繞開(kāi)GPU瓶頸、另辟蹊徑」的重要體現(xiàn)，更契合了行業(yè)開(kāi)放、融合、創(chuàng)新的發(fā)展趨勢(shì)。

從第三方視角來(lái)看，中興超節(jié)點(diǎn)并非簡(jiǎn)單實(shí)現(xiàn)多廠家GPU的「接入」，而是通過(guò)硬件、芯片、協(xié)議、生態(tài)、集群五個(gè)維度的系統(tǒng)化設(shè)計(jì)，真正打破了單一GPU廠商的生態(tài)鎖定，為用戶(hù)提供了靈活的算力選擇，也推動(dòng)了國(guó)產(chǎn)GPU生態(tài)的繁榮發(fā)展。

在硬件層，中興Nebula單體超節(jié)點(diǎn)的OEX正交架構(gòu)采用高度組件化設(shè)計(jì)，將GPU適配的核心模塊獨(dú)立為UBB模組，針對(duì)不同廠家的GPU，用戶(hù)僅需更換UBB模組，無(wú)需對(duì)超節(jié)點(diǎn)的整體架構(gòu)、交換托盤(pán)、供電散熱等核心部件做任何改動(dòng)，即可實(shí)現(xiàn)「即插即用」的適配，大幅降低了多廠家GPU的集成門(mén)檻。

在芯片層，自研的大容量交換芯片成為多廠家GPU兼容的硬件核心，該芯片全面兼容國(guó)內(nèi)外主流的GPU互聯(lián)協(xié)議，而目前國(guó)內(nèi)外主流GPU廠商的產(chǎn)品均已適配這些通用協(xié)議，從底層解決了多廠家GPU的通信兼容問(wèn)題，打造了「一次設(shè)計(jì)，多卡兼容」的通用互聯(lián)底座。

在協(xié)議層，中興不僅是現(xiàn)有互聯(lián)協(xié)議的適配者，更是行業(yè)標(biāo)準(zhǔn)的制定者，積極參與工信部牽頭的CLink協(xié)議制定，推動(dòng)形成統(tǒng)一的國(guó)內(nèi)算力互聯(lián)標(biāo)準(zhǔn)，同時(shí)其自研的OLink協(xié)議采用開(kāi)放標(biāo)準(zhǔn)設(shè)計(jì)，向行業(yè)開(kāi)放協(xié)議規(guī)范，讓各GPU廠商可輕松適配。

在生態(tài)層，中興秉持「開(kāi)放解耦」的理念，全面開(kāi)放OEX正交架構(gòu)的機(jī)械與電氣接口規(guī)范，第三方GPU廠商只需按照該規(guī)范設(shè)計(jì)計(jì)算/交換托盤(pán)，即可實(shí)現(xiàn)與中興超節(jié)點(diǎn)的標(biāo)準(zhǔn)化接入，無(wú)需單獨(dú)定制；同時(shí)，中興已于2025年6月在ODCC網(wǎng)絡(luò)工作組成功立項(xiàng)《基于正交架構(gòu)的超節(jié)點(diǎn)硬件系統(tǒng)》，推動(dòng)超節(jié)點(diǎn)硬件的行業(yè)標(biāo)準(zhǔn)化，讓多廠家GPU的兼容從企業(yè)設(shè)計(jì)升級(jí)為行業(yè)規(guī)范。

在集群層，多廠家GPU的兼容能力更延伸至Nebula Matrix集群超節(jié)點(diǎn)，其Scale-Up/Scale-Out融合組網(wǎng)架構(gòu)繼承了單體超節(jié)點(diǎn)的協(xié)議兼容和組件化適配能力，無(wú)論組成集群的各單體超節(jié)點(diǎn)搭載不同廠家GPU，還是同一超節(jié)點(diǎn)內(nèi)混布多品牌GPU，都能通過(guò)自研大容量交換芯片的多協(xié)議支持、融合網(wǎng)絡(luò)的統(tǒng)一調(diào)度，實(shí)現(xiàn)跨機(jī)柜、跨品牌GPU的高帶寬、低時(shí)延協(xié)同，讓多廠家GPU的規(guī)模化組網(wǎng)成為現(xiàn)實(shí)。

小結(jié)

從第三方視角對(duì)中興超節(jié)點(diǎn)技術(shù)進(jìn)行全面解讀后可以發(fā)現(xiàn)，中興通訊始終圍繞「做TCO最優(yōu)算力系統(tǒng)級(jí)整合者」這一核心定位，跳出傳統(tǒng)的芯片研發(fā)競(jìng)賽，從系統(tǒng)級(jí)協(xié)同架構(gòu)出發(fā)，通過(guò)硬件架構(gòu)、高速互聯(lián)、功耗管理、集群擴(kuò)展、軟件棧、多廠家GPU兼容六大維度的全方位創(chuàng)新，成功繞開(kāi)了單GPU芯片的性能瓶頸，拼出了AI算力的系統(tǒng)級(jí)最優(yōu)解。

這份創(chuàng)新的價(jià)值，不僅體現(xiàn)在具體的技術(shù)指標(biāo)提升上——白皮書(shū)數(shù)據(jù)顯示，MoE模型分發(fā)時(shí)延下降20%-50%、歸約時(shí)延下降40%-60%以上，更體現(xiàn)在對(duì)算力建設(shè)模式的重構(gòu)上：中興超節(jié)點(diǎn)讓算力建設(shè)從「芯片堆疊」走向「協(xié)同釋放」，從「單一硬件性能競(jìng)爭(zhēng)」走向「全棧系統(tǒng)優(yōu)化」，并以此為核心打造了「AI工廠」，將AI開(kāi)發(fā)從傳統(tǒng)的「手工作坊」升級(jí)為標(biāo)準(zhǔn)化、規(guī)模化、自動(dòng)化的「現(xiàn)代化流水線(xiàn)」，為AI大模型的訓(xùn)練與推理提供了高效的算力底座。

更重要的是，中興超節(jié)點(diǎn)的開(kāi)放兼容設(shè)計(jì)，打破了單一廠商的生態(tài)鎖定，為用戶(hù)提供了靈活的GPU選擇，推動(dòng)了智算行業(yè)的開(kāi)放與融合。

正如中興超節(jié)點(diǎn)技術(shù)白皮書(shū)中所言，未來(lái)算力的競(jìng)爭(zhēng)不再是「每秒浮點(diǎn)運(yùn)算次數(shù)（FLOPS）」的競(jìng)爭(zhēng)，而是「每瓦Token數(shù)」的競(jìng)爭(zhēng)，中興超節(jié)點(diǎn)通過(guò)系統(tǒng)級(jí)的創(chuàng)新設(shè)計(jì)，實(shí)現(xiàn)了算力效率、擴(kuò)展能力、生態(tài)兼容性的多重最優(yōu)，不僅為自身在智算行業(yè)占據(jù)了一席之地，更為整個(gè)智算行業(yè)的發(fā)展提供了全新的思路與方向。

在AI大模型持續(xù)發(fā)展的背景下，中興超節(jié)點(diǎn)技術(shù)的落地與推廣，必將為千行百業(yè)的智能化升級(jí)提供堅(jiān)實(shí)的算力支撐，推動(dòng)智算基礎(chǔ)設(shè)施向更高效率、更綠色、更開(kāi)放的方向演進(jìn)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.