<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      不拼GPU!中興扔出AI超節(jié)點(diǎn),把token價(jià)格打下來(lái)

      0
      分享至


      新智元報(bào)道

      編輯:桃子

      【新智元導(dǎo)讀】在萬(wàn)億級(jí)大模型橫行的時(shí)代,單純靠「堆芯片」已經(jīng)玩不動(dòng)了。中興交出了一份不一樣的答卷:跳出單一芯片的性能內(nèi)卷,靠「系統(tǒng)級(jí)協(xié)同」重構(gòu)智算底座。

      當(dāng)前AI大模型參數(shù)規(guī)模已突破萬(wàn)億量級(jí),單GPU芯片的物理功耗密度、互連帶寬與內(nèi)存容量瓶頸,成為制約算力發(fā)展的核心問(wèn)題,傳統(tǒng)「芯片堆砌」的算力建設(shè)模式,正面臨通信開(kāi)銷(xiāo)劇增、算力利用率驟降的行業(yè)共性痛點(diǎn)。

      隨著技術(shù)的快速演進(jìn)和迭代,當(dāng)前已經(jīng)不是「一顆芯片決定算力」的時(shí)代,AI基礎(chǔ)設(shè)施的競(jìng)爭(zhēng)正在由「單一芯片」轉(zhuǎn)向以「整機(jī)系統(tǒng)」為核心的競(jìng)爭(zhēng)。

      在各大GPU廠商聚焦芯片研發(fā)競(jìng)賽的背景下,中興通訊從系統(tǒng)級(jí)協(xié)同架構(gòu)出發(fā),推出超節(jié)點(diǎn)技術(shù),通過(guò)重構(gòu)算力互聯(lián)體系,將數(shù)十至數(shù)百顆多廠家GPU邏輯整合為統(tǒng)一計(jì)算單元,實(shí)現(xiàn)了算力的系統(tǒng)級(jí)優(yōu)化。

      近期中興通訊發(fā)布的《中興通訊超節(jié)點(diǎn)白皮書(shū)》,不僅為突破單GPU芯片瓶頸提供了全新解決方案,更重塑了AI算力基礎(chǔ)設(shè)施的構(gòu)建邏輯,其背后的技術(shù)創(chuàng)新與設(shè)計(jì)思路,對(duì)整個(gè)智算行業(yè)的發(fā)展都具有重要的參考意義。

      核心底層邏輯

      跳出GPU競(jìng)賽,錨定系統(tǒng)級(jí)算力協(xié)同

      面對(duì)單GPU芯片的性能瓶頸,行業(yè)內(nèi)早已形成共識(shí),即通過(guò)高速無(wú)損互聯(lián)技術(shù)將多顆GPU整合為邏輯上的「超級(jí)計(jì)算機(jī)」,是突破單芯片性能上限的核心技術(shù)路徑,中興超節(jié)點(diǎn)的底層設(shè)計(jì)邏輯,正是深度契合這一行業(yè)趨勢(shì),跳出單芯片性能競(jìng)賽的傳統(tǒng)思路,將核心發(fā)力點(diǎn)放在系統(tǒng)級(jí)的算力協(xié)同上。

      從第三方視角來(lái)看,這一選擇既避開(kāi)了GPU芯片研發(fā)的高壁壘、長(zhǎng)周期競(jìng)爭(zhēng),又精準(zhǔn)切中了當(dāng)前算力建設(shè)的核心痛點(diǎn)——傳統(tǒng)模式的問(wèn)題并非單芯片性能不足,而是多芯片協(xié)同的效率過(guò)低。

      中興超節(jié)點(diǎn)并非GPU的簡(jiǎn)單物理堆砌,而是融合多芯片、整機(jī)硬件、高速互聯(lián)與配套軟件的集成系統(tǒng),其構(gòu)建嚴(yán)格遵循四大核心前提,為系統(tǒng)級(jí)算力協(xié)同筑牢基礎(chǔ):

      一是芯片能力的均衡性,要求GPU的算力、顯存、互聯(lián)帶寬三者匹配,避免資源浪費(fèi);

      二是互聯(lián)架構(gòu)的有效性,超節(jié)點(diǎn)內(nèi)任意GPU間的互聯(lián)帶寬達(dá)到機(jī)間互聯(lián)的8倍左右,兼顧通信效率、擴(kuò)展性與場(chǎng)景適配性;

      三是內(nèi)存訪(fǎng)問(wèn)的便捷性,所有GPU支持統(tǒng)一內(nèi)存編址,兼容內(nèi)存語(yǔ)義和消息語(yǔ)義,保障編程易用性與數(shù)據(jù)訪(fǎng)問(wèn)效率;

      四是架構(gòu)擴(kuò)展的原生性,且集群擴(kuò)展后仍屬于高帶寬域,滿(mǎn)足算力按需配置的需求。

      這四大前提的設(shè)計(jì),讓中興超節(jié)點(diǎn)從底層就確立了「系統(tǒng)級(jí)算力最優(yōu)」的目標(biāo),所有后續(xù)技術(shù)創(chuàng)新均圍繞這一核心展開(kāi)。

      硬件架構(gòu)創(chuàng)新

      OEX正交無(wú)背板互聯(lián),重構(gòu)GPU物理協(xié)同基礎(chǔ)

      傳統(tǒng)GPU集群依賴(lài)Cable Tray線(xiàn)纜架構(gòu),存在信號(hào)損耗大、算力密度低、運(yùn)維難度高、組網(wǎng)成本高的明顯短板,這也是制約多GPU協(xié)同效率的物理層關(guān)鍵問(wèn)題。

      中興超節(jié)點(diǎn)在硬件架構(gòu)上的核心創(chuàng)新,就是推出了Orthogonal Electrical eXchange(OEX)正交無(wú)背板互聯(lián)交換架構(gòu),這一架構(gòu)也于2025年成功入選ODCC「年度重大技術(shù)突破」案例,從第三方視角來(lái)看,這一創(chuàng)新實(shí)現(xiàn)了GPU物理互聯(lián)體系的底層重構(gòu),為高密度、高可靠性的GPU協(xié)同奠定了物理基礎(chǔ)。


      圖1 OEX互聯(lián)示意圖

      OEX架構(gòu)的核心設(shè)計(jì),是讓計(jì)算托盤(pán)與交換托盤(pán)實(shí)現(xiàn)垂直交叉物理直連,徹底摒棄傳統(tǒng)的高速線(xiàn)纜,通過(guò)正交連接器與單級(jí)交換拓?fù)錁?gòu)建無(wú)線(xiàn)纜的互聯(lián)體系,這一設(shè)計(jì)帶來(lái)的實(shí)際價(jià)值可通過(guò)白皮書(shū)的核心數(shù)據(jù)直觀體現(xiàn):

      在112G高速信號(hào)場(chǎng)景下,SerDes鏈路長(zhǎng)度縮短30%以上,直接消除了線(xiàn)纜引入的6.5dB插損,讓端到端鏈路插損余量大于3dB,大幅降低了誤碼率,為T(mén)B級(jí)互聯(lián)帶寬提供了穩(wěn)定的物理支撐;

      無(wú)線(xiàn)纜設(shè)計(jì)直接釋放了機(jī)柜內(nèi)部的寶貴空間,讓標(biāo)準(zhǔn)機(jī)柜可集成64/128卡甚至更多GPU,實(shí)現(xiàn)了單位空間算力密度的跨越式提升;

      同時(shí)從根源上減少了線(xiàn)纜松動(dòng)、老化導(dǎo)致的宕機(jī)風(fēng)險(xiǎn),將系統(tǒng)故障修復(fù)時(shí)間MTTR從傳統(tǒng)的小時(shí)級(jí)縮短至分鐘級(jí),完美適配AI大模型7×24小時(shí)不間斷訓(xùn)練的高可靠性需求;

      此外,交換板內(nèi)集成參數(shù)面leaf交換,省去了傳統(tǒng)組網(wǎng)所需的leaf層級(jí)交換機(jī)、光模塊和光纖,在簡(jiǎn)化系統(tǒng)架構(gòu)的同時(shí),顯著降低了組網(wǎng)的硬件成本與復(fù)雜度。

      相較于行業(yè)內(nèi)其他正交架構(gòu)方案,中興OEX架構(gòu)的無(wú)集中式背板設(shè)計(jì),進(jìn)一步降低了層間損耗與硬件復(fù)雜度,成為當(dāng)前高密度GPU互聯(lián)的優(yōu)質(zhì)物理架構(gòu)選擇。


      圖2 OEX與Cable Tray方案對(duì)比

      高速互聯(lián)技術(shù)創(chuàng)新

      自研芯片+全維度優(yōu)化,打通算力協(xié)同通信瓶頸

      GPU間的高效互聯(lián)是系統(tǒng)級(jí)算力協(xié)同的核心支撐,傳統(tǒng)GPU集群的「通信卡脖子」問(wèn)題,本質(zhì)是互聯(lián)帶寬、時(shí)延、協(xié)議兼容性的多重限制,而中興通訊依托其在通信領(lǐng)域數(shù)十年的技術(shù)積累,從芯片、物理層、協(xié)議層、計(jì)算卸載、擴(kuò)展性五個(gè)維度實(shí)現(xiàn)了高速互聯(lián)技術(shù)的全面創(chuàng)新,打造出適配AI算力需求的TB級(jí)通信通道,從第三方視角來(lái)看,這一系列創(chuàng)新將通信領(lǐng)域的技術(shù)優(yōu)勢(shì)與智算需求深度結(jié)合,真正解決了多GPU協(xié)同通信的核心痛點(diǎn)。

      在核心硬件上,中興自研大容量交換芯片,成為高速互聯(lián)的基石,該芯片實(shí)現(xiàn)了三大突破

      帶寬與時(shí)延躍升至TB級(jí)、百納秒級(jí),滿(mǎn)足海量AI數(shù)據(jù)的高速傳輸;

      拓?fù)浼軜?gòu)從點(diǎn)對(duì)點(diǎn)升級(jí)為大規(guī)模全對(duì)等互聯(lián),適配數(shù)十到數(shù)百顆GPU的協(xié)同計(jì)算;

      全面兼容RDMA、CLink、OISA、Ethlink、SUE、UEC等國(guó)內(nèi)外主流互聯(lián)協(xié)議,為后續(xù)多廠家GPU兼容埋下伏筆。

      在物理層選型上,中興放棄了傳統(tǒng)PCIe總線(xiàn),選擇以太網(wǎng)物理層,白皮書(shū)數(shù)據(jù)顯示,PCIe 5.0 x16雙向帶寬僅約128GB/s,而以太網(wǎng)SerDes主流速率已達(dá)112Gbps,224Gbps產(chǎn)品已進(jìn)入商用階段,支持多通道靈活綁定,可輕松實(shí)現(xiàn)TB/s級(jí)端口帶寬,完美契合AI訓(xùn)練對(duì)超高帶寬的需求。

      在協(xié)議層,中興立足開(kāi)放架構(gòu),既支持UALink、ESUN等國(guó)際主流開(kāi)放協(xié)議,又積極參與工信部牽頭的CLink協(xié)議制定,推動(dòng)國(guó)內(nèi)算力互聯(lián)協(xié)議的統(tǒng)一,打破私有協(xié)議的生態(tài)壁壘。

      同時(shí),中興將在網(wǎng)計(jì)算技術(shù)深度集成至交換芯片,將GPU的高負(fù)載通信操作卸載至交換芯片完成,讓GPU專(zhuān)注核心計(jì)算,這一設(shè)計(jì)的優(yōu)化效果十分顯著:

      在傳統(tǒng)稠密模型訓(xùn)練中,All-Reduce操作復(fù)雜度從O(logN)降至O(C),大幅減少節(jié)點(diǎn)間消息傳遞次數(shù);

      在MoE混合專(zhuān)家模型訓(xùn)練中,Dispatch Multicast和Combine Reduce操作的分發(fā)時(shí)延下降20%-50%,歸約時(shí)延下降40%-60%以上,干線(xiàn)流量減少超30%,徹底解決了MoE模型通信開(kāi)銷(xiāo)大的行業(yè)難題。

      此外,中興從互聯(lián)協(xié)議、拓?fù)洹⑽锢硇螒B(tài)、介質(zhì)四個(gè)維度做Scale-Up可擴(kuò)展性設(shè)計(jì),預(yù)留GPU ID標(biāo)識(shí)bit位滿(mǎn)足未來(lái)十萬(wàn)級(jí)GPU集群尋址需求,采用線(xiàn)性無(wú)收斂擴(kuò)展拓?fù)浔苊馔ㄐ牌款i,以機(jī)柜為單元做模塊化設(shè)計(jì)實(shí)現(xiàn)「即插即用」擴(kuò)容,遵循「能銅盡銅,距遠(yuǎn)用光」原則兼顧傳輸效率與成本,為算力的無(wú)限擴(kuò)展提供了技術(shù)支撐。

      功耗管理創(chuàng)新

      液冷+高壓直流,適配高密度算力的能源需求

      超節(jié)點(diǎn)的高密度GPU集成,必然帶來(lái)功耗的指數(shù)級(jí)增長(zhǎng),白皮書(shū)援引英偉達(dá)的數(shù)據(jù)顯示,GPU超節(jié)點(diǎn)機(jī)柜功耗已從2022年H100的50kW,提升至2025年GB300 NVL72的120-150kW,未來(lái)更將向600kW乃至兆瓦級(jí)演進(jìn),功耗與散熱問(wèn)題成為高密度算力建設(shè)的必解難題。

      從第三方視角來(lái)看,中興超節(jié)點(diǎn)并未簡(jiǎn)單采用常規(guī)的散熱與供電方案,而是結(jié)合算力發(fā)展趨勢(shì),打造了一套「前瞻布局、全維度適配」的功耗管理體系,從散熱和供電兩大維度實(shí)現(xiàn)創(chuàng)新,確保算力高效釋放的同時(shí),實(shí)現(xiàn)能效最優(yōu)。

      在散熱方面,中興構(gòu)建了全維度的液冷散熱體系,兼顧當(dāng)前需求與未來(lái)趨勢(shì):

      當(dāng)前階段采用單相冷板式液冷,這一方案是目前應(yīng)用最廣泛、工程化最成熟的液冷技術(shù),市場(chǎng)占有率超過(guò)70%-80%,可有效支撐百千瓦級(jí)機(jī)柜的散熱需求;

      針對(duì)未來(lái)單芯片功耗突破2000W的趨勢(shì),未來(lái)規(guī)劃硅基微通道冷板和兩相冷板液冷技術(shù),硅基微通道冷板適配HBM堆疊、Chiplet等先進(jìn)封裝的高熱流密度需求,兩相冷板液冷可在低流量下實(shí)現(xiàn)超高散熱效率;

      同時(shí)兼容浸沒(méi)式液冷技術(shù),為未來(lái)兆瓦級(jí)機(jī)柜的散熱需求提供解決方案。

      液冷技術(shù)的全面應(yīng)用,不僅解決了高密度算力的散熱問(wèn)題,更推動(dòng)數(shù)據(jù)中心從「算力導(dǎo)向」向「能效導(dǎo)向」轉(zhuǎn)型,契合綠色智算的行業(yè)發(fā)展趨勢(shì)。

      在供電方面,中興突破傳統(tǒng)48V/54V供電體系的物理極限,采用HVDC高壓直流供電架構(gòu),主流演進(jìn)方向?yàn)椤?00V DC和800V DC,這一設(shè)計(jì)帶來(lái)的優(yōu)勢(shì)十分突出:同等功率下,電流可降低8-16倍,銅材用量減少40%-50%,為機(jī)柜內(nèi)的計(jì)算與冷卻組件釋放關(guān)鍵空間;有效抑制傳輸熱損,整體端到端供電效率提升3%-5%,在電力成本占比30%-50%的智算中心,這一提升能帶來(lái)顯著的運(yùn)營(yíng)成本節(jié)約;可輕松支撐從當(dāng)前100-150kW向250kW乃至1MW+級(jí)機(jī)柜的演進(jìn)需求;減少中間能量變換層級(jí),從根本上緩解功率因數(shù)校正與無(wú)功功率管理壓力。

      該架構(gòu)與OCP Diablo 400、英偉達(dá)800VDC等行業(yè)主流趨勢(shì)接軌,確保了供電體系的前瞻性與兼容性。

      集群擴(kuò)展創(chuàng)新:Nebula Matrix集群超節(jié)點(diǎn),實(shí)現(xiàn)算力規(guī)模化平滑升級(jí)

      單臺(tái)單體超節(jié)點(diǎn)的算力終究有限,面對(duì)萬(wàn)億乃至十萬(wàn)億參數(shù)大模型的訓(xùn)練需求,算力的規(guī)模化擴(kuò)展成為必然要求,而傳統(tǒng)算力集群的擴(kuò)展往往面臨性能下降、成本激增、組網(wǎng)復(fù)雜等問(wèn)題。

      從第三方視角來(lái)看,中興超節(jié)點(diǎn)的一大亮點(diǎn),就是構(gòu)建了「單體超節(jié)點(diǎn)-集群超節(jié)點(diǎn)」的完整擴(kuò)展體系,通過(guò)Nebula Matrix集群超節(jié)點(diǎn)實(shí)現(xiàn)算力從百卡到萬(wàn)卡的平滑擴(kuò)展,既滿(mǎn)足了超大規(guī)模算力需求,又實(shí)現(xiàn)了性能與成本的最優(yōu)平衡。

      中興Matrix集群超節(jié)點(diǎn)采用業(yè)界主流的「電交換+光互聯(lián)」技術(shù)路線(xiàn),通過(guò)高性能電交換機(jī)實(shí)現(xiàn)機(jī)柜內(nèi)GPU間的互聯(lián),受銅纜傳輸距離限制,跨機(jī)柜場(chǎng)景則采用光纖介質(zhì)完成互聯(lián),這一路線(xiàn)依托電交換技術(shù)的高成熟度、高業(yè)務(wù)普適性,規(guī)避了全光交換技術(shù)門(mén)檻高、生態(tài)不完善、對(duì)業(yè)務(wù)適配要求高的問(wèn)題,成為當(dāng)前大規(guī)模集群超節(jié)點(diǎn)建設(shè)的最優(yōu)選擇。

      基于這一路線(xiàn),中興現(xiàn)有Nebula X32單體超節(jié)點(diǎn)可靈活擴(kuò)展為Nebula Matrix X256/800集群超節(jié)點(diǎn),面向未來(lái),依托更高密度的Nebula X128單體超節(jié)點(diǎn),更可進(jìn)一步擴(kuò)展至X8192/16384的超大規(guī)模集群,充分滿(mǎn)足超大規(guī)模模型訓(xùn)練的算力需求。

      同時(shí),中興創(chuàng)新提出Scale-Up與Scale-Out網(wǎng)絡(luò)融合設(shè)計(jì),打破了傳統(tǒng)兩類(lèi)網(wǎng)絡(luò)獨(dú)立組網(wǎng)的模式,Scale-Up網(wǎng)絡(luò)承載張量并行、專(zhuān)家并行等對(duì)帶寬和時(shí)延要求極高的通信流量,Scale-Out網(wǎng)絡(luò)承載數(shù)據(jù)并行、流水并行等對(duì)網(wǎng)絡(luò)性能要求相對(duì)較低的通信流量,融合后構(gòu)建統(tǒng)一的超節(jié)點(diǎn)互聯(lián)網(wǎng)絡(luò),既滿(mǎn)足了集群超節(jié)點(diǎn)內(nèi)部的高性能互聯(lián)需求,又適配了集群間的常規(guī)互聯(lián)需求。

      白皮書(shū)的模型測(cè)算顯示,這一融合架構(gòu)相比獨(dú)立組網(wǎng)模式,能顯著降低總擁有成本(TCO),同時(shí)保障了集群部署和擴(kuò)容的平滑性,讓用戶(hù)可根據(jù)算力需求按需擴(kuò)展,真正實(shí)現(xiàn)了「算力靈活選擇,性能與成本最佳平衡」。

      軟件棧創(chuàng)新

      打造超節(jié)點(diǎn)「操作系統(tǒng)」,充分釋放硬件算力潛能

      硬件是算力的物理基礎(chǔ),而軟件是釋放硬件算力的核心支撐,再好的硬件架構(gòu),若缺乏適配的軟件體系,也無(wú)法將物理算力轉(zhuǎn)化為實(shí)際的有效算力。

      從第三方視角來(lái)看,中興超節(jié)點(diǎn)的一大設(shè)計(jì)亮點(diǎn),就是充分重視軟硬件的協(xié)同優(yōu)化,打造了一套深度協(xié)同、全棧優(yōu)化的軟件棧體系,將其定義為超節(jié)點(diǎn)的「操作系統(tǒng)」,實(shí)現(xiàn)了對(duì)硬件資源的統(tǒng)一調(diào)度、管理、優(yōu)化與監(jiān)控,確保物理層的所有創(chuàng)新都能轉(zhuǎn)化為實(shí)際的算力輸出。

      這套軟件棧的創(chuàng)新體現(xiàn)在六大核心維度

      一是實(shí)現(xiàn)統(tǒng)一虛擬化資源池與智能編排,將超節(jié)點(diǎn)內(nèi)的算力、內(nèi)存、存儲(chǔ)資源抽象池化,根據(jù)AI訓(xùn)練、推理等不同工作負(fù)載需求,動(dòng)態(tài)彈性分配和隔離資源,支持多任務(wù)、多租戶(hù)環(huán)境下的共享與安全隔離;

      二是做到極致通信優(yōu)化與拓?fù)涓兄ㄟ^(guò)深度優(yōu)化的通信庫(kù)和運(yùn)行時(shí)系統(tǒng),自動(dòng)識(shí)別最優(yōu)數(shù)據(jù)傳輸路徑,結(jié)合計(jì)算與通信重疊、梯度壓縮等技術(shù),將通信開(kāi)銷(xiāo)隱藏于計(jì)算過(guò)程之中,提升系統(tǒng)整體效率;

      三是支持異構(gòu)計(jì)算統(tǒng)一調(diào)度與編譯器優(yōu)化,實(shí)現(xiàn)CPU/GPU/DSA等異構(gòu)單元的統(tǒng)一調(diào)度,通過(guò)算子融合、內(nèi)核生成等方式提升單卡效率與跨芯片協(xié)同效率;

      四是構(gòu)建全棧可觀測(cè)性與智能運(yùn)維體系,實(shí)現(xiàn)芯片-節(jié)點(diǎn)-集群的多級(jí)監(jiān)控,實(shí)時(shí)可視化功耗、溫度、性能等指標(biāo),結(jié)合AI運(yùn)維實(shí)現(xiàn)故障預(yù)測(cè)、根因分析,將故障定位時(shí)間從小時(shí)級(jí)縮短至分鐘級(jí);

      五是設(shè)置高可靠冗余機(jī)制,通過(guò)冗余算力節(jié)點(diǎn)與故障切換機(jī)制,避免單點(diǎn)故障導(dǎo)致的大模型訓(xùn)練中斷,保障業(yè)務(wù)連續(xù)性;

      六是引入「算力-電力」協(xié)同的綠色調(diào)度,結(jié)合任務(wù)優(yōu)先級(jí)、功耗模型與實(shí)時(shí)電價(jià),動(dòng)態(tài)調(diào)整算力調(diào)度與芯片頻率,在保障服務(wù)水平協(xié)議(SLA)的前提下,平滑功率波動(dòng),降低能耗與運(yùn)營(yíng)成本。

      此外,中興還打造了算力仿真平臺(tái),為超節(jié)點(diǎn)的算力配置提供「數(shù)字孿生」推演能力,該平臺(tái)基于硬件參數(shù)、模型結(jié)構(gòu)、算子實(shí)測(cè)數(shù)據(jù),可模擬不同超節(jié)點(diǎn)形態(tài)下的訓(xùn)練/推理性能,為用戶(hù)的硬件選型、并行策略設(shè)計(jì)提供科學(xué)依據(jù)。

      白皮書(shū)以Qwen3-235B模型為例,通過(guò)算力仿真平臺(tái)得出結(jié)論:在2K卡的規(guī)模下,256卡超節(jié)點(diǎn)相比8卡服務(wù)器,訓(xùn)練性能提升15%,這一結(jié)果能有效幫助用戶(hù)規(guī)避試錯(cuò)成本,實(shí)現(xiàn)算力配置的最優(yōu)選擇。


      圖3 Qwen3-235B不同超節(jié)點(diǎn)形態(tài)最優(yōu)切分下各部分耗時(shí)

      多維度設(shè)計(jì)

      實(shí)現(xiàn)多廠家GPU兼容,打破生態(tài)鎖定

      在各大廠商紛紛構(gòu)建封閉算力生態(tài)的背景下,中興超節(jié)點(diǎn)將多廠家GPU兼容作為核心創(chuàng)新點(diǎn)之一,這一設(shè)計(jì)不僅是其「繞開(kāi)GPU瓶頸、另辟蹊徑」的重要體現(xiàn),更契合了行業(yè)開(kāi)放、融合、創(chuàng)新的發(fā)展趨勢(shì)。

      從第三方視角來(lái)看,中興超節(jié)點(diǎn)并非簡(jiǎn)單實(shí)現(xiàn)多廠家GPU的「接入」,而是通過(guò)硬件、芯片、協(xié)議、生態(tài)、集群五個(gè)維度的系統(tǒng)化設(shè)計(jì),真正打破了單一GPU廠商的生態(tài)鎖定,為用戶(hù)提供了靈活的算力選擇,也推動(dòng)了國(guó)產(chǎn)GPU生態(tài)的繁榮發(fā)展。

      在硬件層,中興Nebula單體超節(jié)點(diǎn)的OEX正交架構(gòu)采用高度組件化設(shè)計(jì),將GPU適配的核心模塊獨(dú)立為UBB模組,針對(duì)不同廠家的GPU,用戶(hù)僅需更換UBB模組,無(wú)需對(duì)超節(jié)點(diǎn)的整體架構(gòu)、交換托盤(pán)、供電散熱等核心部件做任何改動(dòng),即可實(shí)現(xiàn)「即插即用」的適配,大幅降低了多廠家GPU的集成門(mén)檻。

      在芯片層,自研的大容量交換芯片成為多廠家GPU兼容的硬件核心,該芯片全面兼容國(guó)內(nèi)外主流的GPU互聯(lián)協(xié)議,而目前國(guó)內(nèi)外主流GPU廠商的產(chǎn)品均已適配這些通用協(xié)議,從底層解決了多廠家GPU的通信兼容問(wèn)題,打造了「一次設(shè)計(jì),多卡兼容」的通用互聯(lián)底座。

      在協(xié)議層,中興不僅是現(xiàn)有互聯(lián)協(xié)議的適配者,更是行業(yè)標(biāo)準(zhǔn)的制定者,積極參與工信部牽頭的CLink協(xié)議制定,推動(dòng)形成統(tǒng)一的國(guó)內(nèi)算力互聯(lián)標(biāo)準(zhǔn),同時(shí)其自研的OLink協(xié)議采用開(kāi)放標(biāo)準(zhǔn)設(shè)計(jì),向行業(yè)開(kāi)放協(xié)議規(guī)范,讓各GPU廠商可輕松適配。

      在生態(tài)層,中興秉持「開(kāi)放解耦」的理念,全面開(kāi)放OEX正交架構(gòu)的機(jī)械與電氣接口規(guī)范,第三方GPU廠商只需按照該規(guī)范設(shè)計(jì)計(jì)算/交換托盤(pán),即可實(shí)現(xiàn)與中興超節(jié)點(diǎn)的標(biāo)準(zhǔn)化接入,無(wú)需單獨(dú)定制;同時(shí),中興已于2025年6月在ODCC網(wǎng)絡(luò)工作組成功立項(xiàng)《基于正交架構(gòu)的超節(jié)點(diǎn)硬件系統(tǒng)》,推動(dòng)超節(jié)點(diǎn)硬件的行業(yè)標(biāo)準(zhǔn)化,讓多廠家GPU的兼容從企業(yè)設(shè)計(jì)升級(jí)為行業(yè)規(guī)范。

      在集群層,多廠家GPU的兼容能力更延伸至Nebula Matrix集群超節(jié)點(diǎn),其Scale-Up/Scale-Out融合組網(wǎng)架構(gòu)繼承了單體超節(jié)點(diǎn)的協(xié)議兼容和組件化適配能力,無(wú)論組成集群的各單體超節(jié)點(diǎn)搭載不同廠家GPU,還是同一超節(jié)點(diǎn)內(nèi)混布多品牌GPU,都能通過(guò)自研大容量交換芯片的多協(xié)議支持、融合網(wǎng)絡(luò)的統(tǒng)一調(diào)度,實(shí)現(xiàn)跨機(jī)柜、跨品牌GPU的高帶寬、低時(shí)延協(xié)同,讓多廠家GPU的規(guī)模化組網(wǎng)成為現(xiàn)實(shí)。

      小結(jié)

      從第三方視角對(duì)中興超節(jié)點(diǎn)技術(shù)進(jìn)行全面解讀后可以發(fā)現(xiàn),中興通訊始終圍繞「做TCO最優(yōu)算力系統(tǒng)級(jí)整合者」這一核心定位,跳出傳統(tǒng)的芯片研發(fā)競(jìng)賽,從系統(tǒng)級(jí)協(xié)同架構(gòu)出發(fā),通過(guò)硬件架構(gòu)、高速互聯(lián)、功耗管理、集群擴(kuò)展、軟件棧、多廠家GPU兼容六大維度的全方位創(chuàng)新,成功繞開(kāi)了單GPU芯片的性能瓶頸,拼出了AI算力的系統(tǒng)級(jí)最優(yōu)解。

      這份創(chuàng)新的價(jià)值,不僅體現(xiàn)在具體的技術(shù)指標(biāo)提升上——白皮書(shū)數(shù)據(jù)顯示,MoE模型分發(fā)時(shí)延下降20%-50%、歸約時(shí)延下降40%-60%以上,更體現(xiàn)在對(duì)算力建設(shè)模式的重構(gòu)上:中興超節(jié)點(diǎn)讓算力建設(shè)從「芯片堆疊」走向「協(xié)同釋放」,從「單一硬件性能競(jìng)爭(zhēng)」走向「全棧系統(tǒng)優(yōu)化」,并以此為核心打造了「AI工廠」,將AI開(kāi)發(fā)從傳統(tǒng)的「手工作坊」升級(jí)為標(biāo)準(zhǔn)化、規(guī)模化、自動(dòng)化的「現(xiàn)代化流水線(xiàn)」,為AI大模型的訓(xùn)練與推理提供了高效的算力底座。

      更重要的是,中興超節(jié)點(diǎn)的開(kāi)放兼容設(shè)計(jì),打破了單一廠商的生態(tài)鎖定,為用戶(hù)提供了靈活的GPU選擇,推動(dòng)了智算行業(yè)的開(kāi)放與融合。

      正如中興超節(jié)點(diǎn)技術(shù)白皮書(shū)中所言,未來(lái)算力的競(jìng)爭(zhēng)不再是「每秒浮點(diǎn)運(yùn)算次數(shù)(FLOPS)」的競(jìng)爭(zhēng),而是「每瓦Token數(shù)」的競(jìng)爭(zhēng),中興超節(jié)點(diǎn)通過(guò)系統(tǒng)級(jí)的創(chuàng)新設(shè)計(jì),實(shí)現(xiàn)了算力效率、擴(kuò)展能力、生態(tài)兼容性的多重最優(yōu),不僅為自身在智算行業(yè)占據(jù)了一席之地,更為整個(gè)智算行業(yè)的發(fā)展提供了全新的思路與方向。

      在AI大模型持續(xù)發(fā)展的背景下,中興超節(jié)點(diǎn)技術(shù)的落地與推廣,必將為千行百業(yè)的智能化升級(jí)提供堅(jiān)實(shí)的算力支撐,推動(dòng)智算基礎(chǔ)設(shè)施向更高效率、更綠色、更開(kāi)放的方向演進(jìn)。


      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      蒙古國(guó)總理遞交辭呈

      蒙古國(guó)總理遞交辭呈

      瀟湘晨報(bào)
      2026-03-27 19:10:15
      個(gè)人公眾號(hào)“千問(wèn)”停更近10年,近期接連遭阿里投訴均被駁回,號(hào)主:規(guī)避風(fēng)險(xiǎn)不發(fā)AI文章,如果我不發(fā)聲,賬號(hào)就不保了

      個(gè)人公眾號(hào)“千問(wèn)”停更近10年,近期接連遭阿里投訴均被駁回,號(hào)主:規(guī)避風(fēng)險(xiǎn)不發(fā)AI文章,如果我不發(fā)聲,賬號(hào)就不保了

      中國(guó)能源網(wǎng)
      2026-03-25 13:53:05
      戲外一樣猛!《俠探杰克》男主當(dāng)街KO鄰居,警方認(rèn)定:正當(dāng)防衛(wèi)

      戲外一樣猛!《俠探杰克》男主當(dāng)街KO鄰居,警方認(rèn)定:正當(dāng)防衛(wèi)

      仰臥撐FTUer
      2026-03-26 22:37:11
      留幾手談張雪峰去世:死者又不是我爹,憑啥為大

      留幾手談張雪峰去世:死者又不是我爹,憑啥為大

      三言科技
      2026-03-25 19:03:05
      美智庫(kù):美若出兵攔中國(guó)收臺(tái),解放軍30分鐘內(nèi)能將美軍事基地夷平

      美智庫(kù):美若出兵攔中國(guó)收臺(tái),解放軍30分鐘內(nèi)能將美軍事基地夷平

      南權(quán)先生
      2026-03-25 15:28:41
      中央電視臺(tái)對(duì)張雪峰的評(píng)價(jià)

      中央電視臺(tái)對(duì)張雪峰的評(píng)價(jià)

      冷桂零落
      2026-03-26 07:01:16
      有關(guān)薄一波的十個(gè)冷知識(shí)

      有關(guān)薄一波的十個(gè)冷知識(shí)

      深度報(bào)
      2026-02-13 22:45:30
      香港第一風(fēng)水師陳朗,因助人改命受天譴,李嘉誠(chéng)花費(fèi)千萬(wàn)為他續(xù)命

      香港第一風(fēng)水師陳朗,因助人改命受天譴,李嘉誠(chéng)花費(fèi)千萬(wàn)為他續(xù)命

      郁郁乎文
      2024-07-07 22:25:36
      球星卡博主解析天價(jià)梅西球星卡:標(biāo)準(zhǔn)尺寸下梅西首張簽字卡,全世界唯一

      球星卡博主解析天價(jià)梅西球星卡:標(biāo)準(zhǔn)尺寸下梅西首張簽字卡,全世界唯一

      懂球帝
      2026-03-28 00:15:06
      美股收盤(pán):標(biāo)普、納指創(chuàng)開(kāi)戰(zhàn)后最大單日跌幅 特朗普盤(pán)后發(fā)聲

      美股收盤(pán):標(biāo)普、納指創(chuàng)開(kāi)戰(zhàn)后最大單日跌幅 特朗普盤(pán)后發(fā)聲

      財(cái)聯(lián)社
      2026-03-27 06:07:21
      美軍計(jì)劃增兵中東 對(duì)伊朗地面戰(zhàn)爭(zhēng)要來(lái)了?

      美軍計(jì)劃增兵中東 對(duì)伊朗地面戰(zhàn)爭(zhēng)要來(lái)了?

      看看新聞Knews
      2026-03-24 19:12:06
      玄學(xué)提醒:如果一個(gè)人還在穿著10年前的衣服,只說(shuō)明3個(gè)問(wèn)題

      玄學(xué)提醒:如果一個(gè)人還在穿著10年前的衣服,只說(shuō)明3個(gè)問(wèn)題

      洞讀君
      2026-03-04 14:30:12
      日本諾貝爾獎(jiǎng)得主大江健三郎表示:很遺憾,日本很可能將重復(fù)歷史

      日本諾貝爾獎(jiǎng)得主大江健三郎表示:很遺憾,日本很可能將重復(fù)歷史

      議紀(jì)史
      2025-11-27 14:35:03
      徐靜蕾在洛杉磯的近況,看得人心里五味雜陳。

      徐靜蕾在洛杉磯的近況,看得人心里五味雜陳。

      南權(quán)先生
      2026-03-09 15:52:48
      被兒子折磨4小時(shí)還替他求情?絕望母親到死都相信他,最終慘遭鐵錘殺害...

      被兒子折磨4小時(shí)還替他求情?絕望母親到死都相信他,最終慘遭鐵錘殺害...

      英國(guó)那些事兒
      2026-03-26 23:32:27
      炸鍋!北約最高司令當(dāng)眾認(rèn)慫:烏軍愛(ài)國(guó)者戰(zhàn)力吊打美軍

      炸鍋!北約最高司令當(dāng)眾認(rèn)慫:烏軍愛(ài)國(guó)者戰(zhàn)力吊打美軍

      老馬拉車(chē)莫少裝
      2026-03-26 20:01:46
      西班牙女孩自愿安樂(lè)死引爭(zhēng)議!被精神病父母拋棄,遭福利院同伴集體侵犯又癱瘓:太痛苦!

      西班牙女孩自愿安樂(lè)死引爭(zhēng)議!被精神病父母拋棄,遭福利院同伴集體侵犯又癱瘓:太痛苦!

      英國(guó)報(bào)姐
      2026-03-27 21:27:48
      美國(guó)務(wù)卿稱(chēng)與伊朗談判已取得進(jìn)展

      美國(guó)務(wù)卿稱(chēng)與伊朗談判已取得進(jìn)展

      財(cái)聯(lián)社
      2026-03-27 06:38:07
      有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

      有沒(méi)有人敢爆自己的瓜?網(wǎng)友:確定玩這么大嗎?

      夜深?lèi)?ài)雜談
      2026-02-18 20:55:58
      73歲大爺哭訴:我每月退休金9千,可如今卻連買(mǎi)斤牛肉都買(mǎi)不起

      73歲大爺哭訴:我每月退休金9千,可如今卻連買(mǎi)斤牛肉都買(mǎi)不起

      熱心柚子姐姐
      2026-03-27 15:20:09
      2026-03-28 01:15:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺(tái)領(lǐng)航智能+時(shí)代
      14829文章數(shù) 66720關(guān)注度
      往期回顧 全部

      科技要聞

      楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價(jià)

      頭條要聞

      男醫(yī)生給孕妻做彩超 丈夫崩潰撞墻:不過(guò)了 明天就離婚

      頭條要聞

      男醫(yī)生給孕妻做彩超 丈夫崩潰撞墻:不過(guò)了 明天就離婚

      體育要聞

      邵佳一:足球就像一場(chǎng)馬拉松

      娛樂(lè)要聞

      范瑋琪加盟,官宣《浪姐7》遭全網(wǎng)抵制

      財(cái)經(jīng)要聞

      我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

      汽車(chē)要聞

      與眾08,金標(biāo)大眾不能輸?shù)囊粦?zhàn)

      態(tài)度原創(chuàng)

      房產(chǎn)
      時(shí)尚
      本地
      健康
      軍事航空

      房產(chǎn)要聞

      6.8萬(wàn)方!天河員村再征地,金融城西區(qū)開(kāi)發(fā)全面提速

      推廣中獎(jiǎng)名單-更新至2026年3月11日推廣

      本地新聞

      在濰坊待了三天,沒(méi)遇到一個(gè)“濰坊人”

      干細(xì)胞抗衰4大誤區(qū),90%的人都中招

      軍事要聞

      伊朗:已組織超100萬(wàn)人為地面戰(zhàn)斗做準(zhǔn)備

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版