近日,中興通訊正式發(fā)布了《超節(jié)點技術(shù)白皮書》,提出以超節(jié)點為核心構(gòu)建標準化“AI工廠”,通過系統(tǒng)級架構(gòu)創(chuàng)新,突破傳統(tǒng)算力極限與能效瓶頸,為AI基礎(chǔ)設(shè)施的可持續(xù)發(fā)展開辟了新的路徑。
隨著AI模型參數(shù)規(guī)模突破萬億量級,算力需求正從單芯片堆疊向系統(tǒng)級協(xié)同轉(zhuǎn)型。傳統(tǒng)分布式訓(xùn)練模式面臨通信開銷劇增和算力利用率下降等嚴峻挑戰(zhàn)。為解決這一問題,中興通訊推出的超節(jié)點技術(shù)采用高速互聯(lián)協(xié)議和專用交換芯片,構(gòu)建高帶寬域(HBD),將數(shù)十到數(shù)百顆GPU芯片邏輯整合為統(tǒng)一編址、低延遲、高帶寬的協(xié)同計算系統(tǒng)。這一創(chuàng)新架構(gòu)不僅保留了GPU的物理獨立性,還帶來了類單機的編程與調(diào)度體驗,顯著提升了算力利用效率,為大規(guī)模模型訓(xùn)練和推理提供了高性能的算力底座。
在硬件層面,中興通訊自研的OEX正交無背板互聯(lián)交換架構(gòu)成為白皮書的一大亮點。該架構(gòu)通過物理設(shè)計的根本性創(chuàng)新,實現(xiàn)了高密集成、高可靠、簡化運維和開放互聯(lián)四大核心優(yōu)勢。OEX架構(gòu)突破了物理空間極限,徹底消除了機柜內(nèi)部成千上萬根高速線纜,極大釋放了機柜空間,實現(xiàn)了單位空間算力密度的飛躍。同時,正交無背板互聯(lián)顯著降低了通信損耗和誤碼率,確保了大規(guī)模集群通信的高速與穩(wěn)定。
中興通訊提出的“AI工廠模式”倡導(dǎo)從“項目制”向“工廠模式”轉(zhuǎn)型,將AI能力建設(shè)升級為標準化的現(xiàn)代化流水線。通過統(tǒng)一虛擬化資源池與智能編排,軟件層實現(xiàn)對異構(gòu)算力的深度調(diào)度與管理,最大化資源利用率。依托Nebula單體超節(jié)點與Nebula Matrix集群超節(jié)點,算力可從百卡平滑擴展至萬卡規(guī)模,靈活滿足不同階段的大模型訓(xùn)練需求。
中興通訊憑借40多年在通信領(lǐng)域的系統(tǒng)工程積累,已構(gòu)建起從自研系列高性能芯片、復(fù)雜系統(tǒng)設(shè)計到全球工程交付的全棧能力體系。展望未來,中興通訊將堅持開源開放理念,攜手產(chǎn)業(yè)伙伴共同推動智能算力基礎(chǔ)設(shè)施的標準化與生態(tài)化,構(gòu)建高效、綠色、可持續(xù)的AI發(fā)展體系,引領(lǐng)AI算力新紀元。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.