![]()
3月12日,高新區(qū)企業(yè)中科曙光宣布實現(xiàn)國產(chǎn)高端原生RDMA技術(shù)重大突破,正式發(fā)布首款全棧自研400G無損高速網(wǎng)絡(luò)——scaleFabric。該產(chǎn)品基于原生RDMA架構(gòu),從底層的112G SerDes IP、硬件設(shè)備到上層的管理軟件實現(xiàn)100%自主研發(fā),填補(bǔ)了國內(nèi)數(shù)據(jù)中心高速網(wǎng)絡(luò)領(lǐng)域的空白,以比肩國際頂尖同類產(chǎn)品的性能表現(xiàn),為超大規(guī)模智算集群鋪就了一條高帶寬、低時延、真無損、超可靠的“算力大動脈”。
![]()
高端智算互聯(lián)待破局
隨著AI大模型訓(xùn)練與高通量推理計算需求持續(xù)擴(kuò)大,萬卡級乃至更大規(guī)模的算力集群正成為主流形態(tài)。研究表明,在大規(guī)模分布式訓(xùn)練中,網(wǎng)絡(luò)通信耗時占比已達(dá)到30-50%,網(wǎng)絡(luò)性能直接影響算力系統(tǒng)的整體效率。
在大規(guī)模智算集群領(lǐng)域,RDMA(遠(yuǎn)程直接內(nèi)存訪問)網(wǎng)絡(luò)已成為算力中心的基本需求,憑借零丟包、高帶寬、低延遲等特征,可極大提升通信效率。其中,InfiniBand憑借低時延與原生無損傳輸能力,在全球頂級超算與AI集群中被廣泛采用。根據(jù)TOP500榜單,目前全球約60%的高性能計算系統(tǒng)采用InfiniBand網(wǎng)絡(luò)架構(gòu)。
長期以來,從高速SerDes IP、核心芯片到IB網(wǎng)卡、IB交換機(jī)等設(shè)備,InfiniBand相關(guān)產(chǎn)業(yè)鏈基本被海外廠商壟斷。隨著AI算力需求快速增長及數(shù)據(jù)中心網(wǎng)絡(luò)持續(xù)演進(jìn),自主高性能RDMA網(wǎng)絡(luò)正成為產(chǎn)業(yè)關(guān)注焦點。中國工程院院士鄔賀銓表示,高速網(wǎng)絡(luò)作為算力基礎(chǔ)設(shè)施的關(guān)鍵核心技術(shù),其自主可控性直接關(guān)系到國家算力基礎(chǔ)設(shè)施的安全與發(fā)展質(zhì)量。在大模型訓(xùn)練和智算集群規(guī)模化部署背景下,網(wǎng)絡(luò)需要同時具備超低延遲、超高帶寬與無損傳輸能力,而RDMA高速網(wǎng)絡(luò)正是智算集群的“算力大動脈”。
![]()
中國工程院院士? 鄔賀銓 視頻致辭
國產(chǎn)原生RDMA問世
scaleFabric是國內(nèi)首款原生無損RDMA高速網(wǎng)絡(luò),面向超大規(guī)模智算集群設(shè)計,從核心關(guān)鍵IP、交換芯片、網(wǎng)卡到交換機(jī)、驅(qū)動與管理軟件均實現(xiàn)自主研發(fā),構(gòu)建起從硬件到軟件的完整技術(shù)體系。
此次發(fā)布的scaleFabric400系列網(wǎng)絡(luò)產(chǎn)品技術(shù)規(guī)格全面對標(biāo)英偉達(dá)NDR,部分指標(biāo)實現(xiàn)趕超。性能方面,scaleFabric400網(wǎng)卡基于PCIe5.0接口,端口帶寬達(dá)400Gbps,端到端通信時延低至0.9微秒;scaleFabric400交換機(jī)單端口帶寬達(dá)800Gbps,整機(jī)交換容量可達(dá)雙向64Tbps,交換時延約260納秒,支持800G×40或400G×80端口擴(kuò)展。這一性能組合,可充分滿足萬卡級AI訓(xùn)練集群對高帶寬、低時延網(wǎng)絡(luò)的極致需求。
穩(wěn)定性與擴(kuò)展能力上,產(chǎn)品采用基于信用的無損流控機(jī)制,從根源規(guī)避擁塞丟包風(fēng)險,鏈路故障恢復(fù)時間小于1毫秒,已支撐近萬卡集群持續(xù)穩(wěn)定運行驗證超10個月。與英偉達(dá)NDR相比,交換機(jī)端口密度提升25%,網(wǎng)卡最大QP數(shù)支持提升100%,單子網(wǎng)互連規(guī)模是傳統(tǒng)IB的2.33倍,可輕松支持最大11.4萬卡集群部署,同時網(wǎng)絡(luò)總成本可降低30%。
在大規(guī)模AI訓(xùn)練系統(tǒng)中,網(wǎng)絡(luò)互聯(lián)能力已成為影響算力利用率的關(guān)鍵變量。scaleFabric的發(fā)布,標(biāo)志著國產(chǎn)智算網(wǎng)絡(luò)在高端RDMA領(lǐng)域?qū)崿F(xiàn)重大突破。
萬卡集群率先驗證
在實際應(yīng)用層面,scaleFabric目前已部署于國家超算互聯(lián)網(wǎng)鄭州核心節(jié)點,支撐三套萬卡級scaleX智算集群上線運行,總規(guī)模達(dá)3萬卡。中科曙光高級副總裁李斌表示,隨著產(chǎn)品在超大規(guī)模智算集群中的落地應(yīng)用,國產(chǎn)原生RDMA技術(shù)路線正逐步走向成熟,圍繞其形成的高性能網(wǎng)絡(luò)產(chǎn)業(yè)生態(tài)也正在加速形成。
![]()
運行數(shù)據(jù)顯示,該網(wǎng)絡(luò)系統(tǒng)在大規(guī)模集群環(huán)境中保持穩(wěn)定運行,可支持跨POD組網(wǎng)及大規(guī)模并行訓(xùn)練任務(wù),為國產(chǎn)原生無損RDMA網(wǎng)絡(luò)在高端智算基礎(chǔ)設(shè)施中的應(yīng)用提供了實踐驗證。
依托在高性能計算、存儲與網(wǎng)絡(luò)領(lǐng)域的長期技術(shù)積累,中科曙光已逐步形成“算—存—網(wǎng)”協(xié)同發(fā)展的完整算力底座能力,為大規(guī)模AI基礎(chǔ)設(shè)施提供系統(tǒng)級支撐。隨著政府工作報告提出持續(xù)推進(jìn)“人工智能+”,算力基礎(chǔ)設(shè)施正進(jìn)入新一輪升級周期。國產(chǎn)原生RDMA網(wǎng)絡(luò)的落地,意味著我國在智算互聯(lián)這一關(guān)鍵環(huán)節(jié)開始形成自主技術(shù)路徑,補(bǔ)齊了我國智算基礎(chǔ)設(shè)施中的關(guān)鍵一環(huán)。
文字、圖片來源:中科曙光 ,轉(zhuǎn)載請注明出處
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.