C114訊 1月22日消息(水易)大模型快速推陳出新,參數(shù)的規(guī)模、多模態(tài)的復(fù)雜度以及推理的負(fù)載不斷提升,在Scaling Law法則仍發(fā)揮重要作用的背景下,對AI基礎(chǔ)設(shè)施提出全新要求,超節(jié)點(diǎn)架構(gòu)的出現(xiàn)為構(gòu)建更大規(guī)模的算力集群提供可選方案。
為實(shí)現(xiàn)資源的彈性調(diào)度與極致能效,超節(jié)點(diǎn)內(nèi)部的Scale-up互連、超節(jié)點(diǎn)之間的Scale-out網(wǎng)絡(luò),以及跨數(shù)據(jù)中心的Scale-across,共同構(gòu)成了新一代AI基礎(chǔ)設(shè)施的核心骨架。相較于傳統(tǒng)電互連,光互連在帶寬密度、功耗效率和傳輸距離方面具備顯著優(yōu)勢,但其在封裝集成度、成本控制、熱管理及系統(tǒng)兼容性等方面仍面臨挑戰(zhàn)。
1月22日,CIOE中國光博會與C114聯(lián)合舉辦“2026中國光通信高質(zhì)量發(fā)展論壇”線上研討會——“AI超節(jié)點(diǎn)互連架構(gòu)演進(jìn)”專場。深入探討AI驅(qū)動(dòng)下超節(jié)點(diǎn)互連架構(gòu)的演進(jìn)趨勢,聚焦光互連在高性能AI集群中的可行性與落地路徑,推動(dòng)“以網(wǎng)強(qiáng)算、以光賦智”理念在算力基礎(chǔ)設(shè)施中的實(shí)踐落地。
![]()
需求驅(qū)動(dòng):光互連支撐超節(jié)點(diǎn)可持續(xù)發(fā)展
中國電信研究院副院長李俊杰表示,面向大模型訓(xùn)練、迭代調(diào)優(yōu)及推理云服務(wù)能力場景需求,AI超節(jié)點(diǎn)可充分發(fā)揮高帶寬、低時(shí)延、強(qiáng)協(xié)同、高效率等特點(diǎn),但電互連方案或?qū)⒚媾R內(nèi)存墻、功耗墻與I/O墻“三堵墻”等問題。光互連技術(shù)有望在速率、功耗和容量三個(gè)層面解決目前超節(jié)點(diǎn)面臨的可持續(xù)發(fā)展瓶頸。
中山大學(xué)通信工教研室主任、教授、博士生導(dǎo)師李凡認(rèn)為,算力需求在大模型的推動(dòng)下,呈現(xiàn)爆發(fā)式的增長,增速遠(yuǎn)超摩爾定律,下一代算力節(jié)點(diǎn)的增長必然將通過跨域擴(kuò)展來實(shí)現(xiàn),而在其中光通信光互連的重要性不言而喻。
阿里云資深架構(gòu)師席永青表示,在超大規(guī)模集群中,真正決定集群性能上限的往往不是計(jì)算單元,而是連接這些單元的網(wǎng)絡(luò),如何讓網(wǎng)絡(luò)性能從“盡力而為”(Best-effort)變成“可預(yù)期”(Predictable),成為AI Infra競爭的新高地。
中國聯(lián)通研究院主任研究員鄭滟雷指出,研究并構(gòu)建高效、可靠的超節(jié)點(diǎn)廣域互連網(wǎng)絡(luò)架構(gòu)及關(guān)鍵技術(shù),已成為突破算力瓶頸、釋放AI潛能的核心任務(wù)。光纖通信憑借其固有優(yōu)勢,成為破局的關(guān)鍵。全光網(wǎng)絡(luò),特別是基于OTN的全光互連架構(gòu),能夠提供超大帶寬的一跳直達(dá)能力,有效突破算效瓶頸。
騰訊光網(wǎng)絡(luò)架構(gòu)師付思東表示,當(dāng)前“算力如火箭攀升,網(wǎng)絡(luò)如步行前進(jìn)”的失衡狀態(tài),導(dǎo)致在萬卡乃至十萬卡級別的GPU集群協(xié)同訓(xùn)練時(shí),節(jié)點(diǎn)間數(shù)據(jù)傳輸速度成為系統(tǒng)性能的關(guān)鍵瓶頸,嚴(yán)重影響集群整體效率與資源利用率,全光互連為破解這一難題提供了新路徑。
創(chuàng)新不斷:材料、封裝、架構(gòu)持續(xù)升級
當(dāng)然,光互連技術(shù)在超節(jié)點(diǎn)中應(yīng)用需要一系列關(guān)鍵技術(shù),中國電信李俊杰將其總結(jié)為大帶寬器件、系統(tǒng)架構(gòu)以及互連介質(zhì)等三個(gè)方面。大帶寬器件方面,底層光電材料、封裝工藝創(chuàng)新,LPO/LRO、CPO等創(chuàng)新模塊以及電信級可靠性光模塊;系統(tǒng)架構(gòu)方面,包括OCS、光網(wǎng)絡(luò)智能化;互連介質(zhì)方面,空芯光纖可實(shí)現(xiàn)更低時(shí)延。
光庫科技芯片設(shè)計(jì)兼產(chǎn)品經(jīng)理郝婷表示,超節(jié)點(diǎn)光互連中,光調(diào)制技術(shù)不可或缺。目前行業(yè)內(nèi)光調(diào)制的技術(shù)主要有三種:基于硅光、磷化銦和鈮酸鋰材料平臺的電光調(diào)制器。硅光主要應(yīng)用在短程場景,磷化銦應(yīng)用于中距和長距場景,鈮酸鋰電主要用在400Gbps以上的長距骨干網(wǎng)相干通信和單波200/400Gbps的超高速數(shù)據(jù)中心中。
郝婷介紹,基于薄膜鈮酸鋰的光調(diào)制器,可以提供超高單通道速率、超低驅(qū)動(dòng)功耗、超高線性度以及材料穩(wěn)定性與可集成性,有望成為未來CPO規(guī)模部署的重要選擇,從而支撐超節(jié)點(diǎn)光互連的部署。未來還要加強(qiáng)異質(zhì)異構(gòu)集成,充分發(fā)揮各材料的優(yōu)勢,同時(shí)推動(dòng)先進(jìn)封裝。
凌云光技術(shù)股份有限公司光纖器件與儀器事業(yè)部CTO張華介紹,光IO與光電路交換(OCS)等核心光互連技術(shù),通過光電協(xié)同設(shè)計(jì),突破傳統(tǒng)電IO的傳輸距離/功耗/帶寬密度等限制,此外OCS技術(shù)通過全光動(dòng)態(tài)拓?fù)渲貥?gòu),可構(gòu)建低時(shí)延、無阻塞的全局光互連架構(gòu),結(jié)合智能調(diào)度算法,提升算力資源利用率,為AI可重構(gòu)數(shù)據(jù)中心網(wǎng)絡(luò)(RDCN)構(gòu)建高效、彈性、可擴(kuò)展的光底座。
中山大學(xué)李凡表示,為了支撐數(shù)據(jù)中心算力的持續(xù)增長,服務(wù)器中核心交換機(jī)光模塊接口速率從40G逐漸演變到下一代1.6T,因此光通信傳輸技術(shù)也需要不停更新迭代。下一代1.6T光互連中,相干技術(shù)可以通過技術(shù)路線簡化的方式,滿足多個(gè)數(shù)據(jù)中心之間互連的Scale-Across需求。
應(yīng)用實(shí)踐落地:光互連充分釋放算力潛能
阿里云席永青介紹,阿里云圍繞高性能、高可靠、高性價(jià)比三大核心訴求,開展全棧式網(wǎng)絡(luò)架構(gòu)創(chuàng)新。通過HPN(High-Performance Network)和UPN(Ultra-Performance Network)雙軌并進(jìn),構(gòu)建起支撐訓(xùn)推一體、萬卡協(xié)同的下一代AI基礎(chǔ)設(shè)施。
其中,HPN是阿里云面向大規(guī)模分布式訓(xùn)練與推理打造的高速網(wǎng)絡(luò),應(yīng)用于Scale-out場景。UPN采用LPO/NPO全光互連技術(shù),在單機(jī)柜內(nèi)部構(gòu)建光速通信網(wǎng)絡(luò),直面未來Scale-up的終極挑戰(zhàn)。阿里云將基于HPN+UPN的協(xié)同設(shè)計(jì),構(gòu)建一個(gè)超大規(guī)模、低時(shí)延、高可靠、低成本、可擴(kuò)展的智算底座。
中國聯(lián)通鄭滟雷介紹,中國聯(lián)通在2024年成功完成業(yè)界首個(gè)3000公里長距無損傳輸現(xiàn)網(wǎng)驗(yàn)證,充分證明了全光網(wǎng)絡(luò)在廣域場景下支撐AI超節(jié)點(diǎn)互連的技術(shù)可行性與巨大潛力。通過構(gòu)建一個(gè)近乎零丟包的廣域無損網(wǎng)絡(luò),全光底座可為跨地域的GPU集群提供接近數(shù)據(jù)中心內(nèi)部的通信性能,進(jìn)而釋放AI的全部潛能。
騰訊付思東表示,硅光技術(shù)與NPO已成為推動(dòng)網(wǎng)絡(luò)性能躍升的核心技術(shù)路徑。Scale-out方向,騰訊堅(jiān)定地布局硅光技術(shù),目前自研400G硅光BR4模塊累計(jì)部署量達(dá)200萬只,保持零失效記錄。Scale-up方向,NPO通過將OE引擎部署在靠近主芯片,具有低成本和低時(shí)延優(yōu)勢,同時(shí)尺寸更小、速率更快,端口數(shù)的減少還能降低部署和運(yùn)維工作量,目前已聯(lián)合阿里云等在ODCC發(fā)起3.2T NPO標(biāo)準(zhǔn)化項(xiàng)目,旨在推動(dòng)應(yīng)用場景、硬件接口、管理協(xié)議等規(guī)范制定。
“2026中國光通信高質(zhì)量發(fā)展論壇”是由CIOE中國光博會與C114通信網(wǎng)聯(lián)合推出的大型研討會系列活動(dòng)。下一場研討會將于3月26日上線,主題為“空芯光纖:下一代光傳輸介質(zhì)的戰(zhàn)略突破”,將深入探討空芯光纖的技術(shù)成熟度與應(yīng)用場景適配性,剖析從材料、光纖、器件到系統(tǒng)全鏈條的國產(chǎn)化突破路徑,推動(dòng)我國在下一代光傳輸基礎(chǔ)設(shè)施領(lǐng)域?qū)崿F(xiàn)跨越式發(fā)展。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.