國產(chǎn)算力正從"能用"邁向"好用",超節(jié)點(diǎn)技術(shù)成為彌合差距的關(guān)鍵支點(diǎn)。
華爾街見聞提及,4月24日,DeepSeek V4預(yù)覽版發(fā)布,公司披露受限于高端算力供給,V4 Pro版本服務(wù)吞吐十分有限,預(yù)計(jì)下半年隨華為昇騰950超節(jié)點(diǎn)批量上市后,Pro版本價(jià)格將大幅下調(diào)。
高盛研報(bào)指出,這一表態(tài)具有雙重意涵:一是DeepSeek的成本競(jìng)爭(zhēng)力將進(jìn)一步強(qiáng)化;二是在芯片管制持續(xù)收緊的背景下,中國頂尖AI模型向國產(chǎn)算力遷移的趨勢(shì)得到頭部玩家的背書。
此前,國家發(fā)改委亦于2025年底的新聞發(fā)布會(huì)上罕見正面回應(yīng),稱"超節(jié)點(diǎn)等集群互聯(lián)技術(shù)發(fā)展,為國產(chǎn)算力趕上國際領(lǐng)先水平提供了良好機(jī)遇"。
在此背景下,東方證券發(fā)布電子行業(yè)深度報(bào)告,以"超節(jié)點(diǎn):國產(chǎn)算力進(jìn)攻的'矛'"為題,系統(tǒng)梳理超節(jié)點(diǎn)的技術(shù)邏輯、產(chǎn)業(yè)格局與投資機(jī)會(huì),認(rèn)為2026年將是國產(chǎn)超節(jié)點(diǎn)規(guī)模放量元年,交換芯片、服務(wù)器ODM、液冷、供電等全鏈條有望深度受益。
AI算力需求躍升,超節(jié)點(diǎn)成必然選擇
大模型參數(shù)規(guī)模的持續(xù)膨脹,正將算力基礎(chǔ)設(shè)施推入超節(jié)點(diǎn)時(shí)代。
東方證券報(bào)告指出,隨著MoE(混合專家)架構(gòu)成為新趨勢(shì),模型參數(shù)以每年約10倍的速度增長,已邁入十萬億級(jí)階段——Qwen3-Max模型總參數(shù)超過1T,文心5.0參數(shù)量達(dá)2.4T。
與此對(duì)應(yīng),算力集群規(guī)模不斷提升,萬卡集群已成訓(xùn)練大模型的最低標(biāo)配,十萬卡級(jí)集群成為主流趨勢(shì)。
![]()
Scaling Law的適用范圍亦從預(yù)訓(xùn)練擴(kuò)展至后訓(xùn)練和推理全流程。
據(jù)OpenAI介紹,在開發(fā)o3時(shí)訓(xùn)練計(jì)算和推理時(shí)間均增加了一個(gè)數(shù)量級(jí),驗(yàn)證了模型性能會(huì)隨思考次數(shù)持續(xù)提升。
DeepSeek則表示,對(duì)模型后訓(xùn)練強(qiáng)化學(xué)習(xí)持續(xù)投入算力,V3.2在后訓(xùn)練投入超過預(yù)訓(xùn)練成本的10%,推理性能已與GPT-5-high相似。
在分布式訓(xùn)練架構(gòu)中,張量并行(TP)和混合專家并行(EP)對(duì)帶寬需求最為突出。
![]()
隨著MoE模型中跨服務(wù)器的All-to-All通信量急劇增長,傳統(tǒng)以太網(wǎng)已難以承受千億級(jí)模型單次梯度同步產(chǎn)生的TB級(jí)數(shù)據(jù)量。
超節(jié)點(diǎn)通過內(nèi)部高速總線互連,有效打破"通信墻"與"內(nèi)存墻"瓶頸,成為大規(guī)模訓(xùn)練與推理的最優(yōu)解。
![]()
在推理側(cè),AI Agent的興起亦大幅拉升詞元Token消耗。據(jù)國家數(shù)據(jù)局?jǐn)?shù)據(jù),2026年3月中國日均AI Token使用量已突破140萬億,為2025年底的近四倍。
報(bào)告援引數(shù)據(jù)指出,超節(jié)點(diǎn)Blackwell NVL72相比H200 8卡服務(wù)器,單瓦每秒生成Token數(shù)量更高,推理性價(jià)比顯著領(lǐng)先。
超節(jié)點(diǎn)以量取勝,國產(chǎn)集群彎道超車
東方證券報(bào)告的核心論斷之一,是超節(jié)點(diǎn)架構(gòu)為國產(chǎn)芯片提供了繞過單卡性能短板的有效路徑。
以華為CloudMatrix 384與英偉達(dá)GB200 NVL72為例:單顆昇騰910C芯片的BF16性能僅為GB200模組的約三分之一,但通過超節(jié)點(diǎn)集群方式,單個(gè)CloudMatrix 384集群的BF16總性能反而是NVL72的1.7倍,總內(nèi)存容量為后者3.6倍,總內(nèi)存帶寬為后者2.1倍。
報(bào)告指出,通過Switch tray多芯片方案,國產(chǎn)交換芯片帶寬代際相對(duì)落后的問題亦可得到有效彌補(bǔ)。
據(jù)玉淵譚天援引的數(shù)據(jù),2025年國產(chǎn)AI芯片的國內(nèi)市場(chǎng)份額已達(dá)到約41%。
模型端同樣有新進(jìn)展——DeepSeek-V4模型適配昇騰芯片后,實(shí)現(xiàn)了高吞吐、低時(shí)延的推理部署;智譜GLM-5宣布完成與7家主流國產(chǎn)芯片平臺(tái)的深度適配。
東方證券指出,在互聯(lián)協(xié)議層面,國產(chǎn)生態(tài)布局亦在提速:
- 華為于2025年9月發(fā)布并開放靈衢(UB)2.0技術(shù)規(guī)范,支持從機(jī)柜級(jí)向數(shù)據(jù)中心級(jí)的多維度擴(kuò)展;
- 中國移動(dòng)牽頭、包括盛科通信等48家單位參與的OISA Gen2.0協(xié)議,支持AI芯片數(shù)量提升至1024張,帶寬突破TB/s級(jí)別;
- 海光、阿里、字節(jié)跳動(dòng)亦分別發(fā)布HSL、ALS、EthLink等自研互聯(lián)協(xié)議,開放Scale up生態(tài)持續(xù)豐富。
五大變化趨勢(shì),產(chǎn)業(yè)鏈?zhǔn)芤媛窂角逦?/p>
東方證券報(bào)告梳理出超節(jié)點(diǎn)時(shí)代的五大產(chǎn)業(yè)變化趨勢(shì)。
首先是,交換芯片需求量價(jià)齊升。
超節(jié)點(diǎn)機(jī)柜內(nèi)新增Scale up域,驅(qū)動(dòng)交換機(jī)及交換芯片用量大幅增加。
![]()
以Rubin NVL72為例,相比Blackwell,隨著GPU帶寬翻倍,單機(jī)柜交換芯片用量從18顆提升至36顆。
報(bào)告還指出,伴隨集群規(guī)模擴(kuò)展、引入二級(jí)HBD域,交換芯片需求或?qū)⑦M(jìn)一步倍增。
其次,液冷成為剛需,全液冷時(shí)代漸進(jìn)。當(dāng)單機(jī)柜總功耗達(dá)到50KW以上時(shí),液冷成為必選方案。
![]()
GB200 NVL72單機(jī)柜功耗已達(dá)120KW,華為CloudMatrix 384和阿里磐久2.0均采用風(fēng)液混合方案。
更新一代的Vera Rubin NVL72機(jī)柜將正式采用100%全液冷,交換機(jī)芯片、DPU、光模塊等全面搭配液冷散熱模組,機(jī)柜外側(cè)CDU散熱量將邁入MW級(jí)。
第三則是服務(wù)器ODM價(jià)值重估。
超節(jié)點(diǎn)服務(wù)器使廠商從過去L10級(jí)別的服務(wù)器組裝交付,提升至L11整機(jī)柜級(jí)甚至L12多機(jī)柜級(jí)制造交付,參與環(huán)節(jié)從Computer tray延伸至Switch tray、網(wǎng)絡(luò)互聯(lián)、供電與制冷系統(tǒng)集成,準(zhǔn)入門檻大幅提高。
![]()
華勤技術(shù)預(yù)計(jì)2026年全年超節(jié)點(diǎn)項(xiàng)目收入將超過百億元;浪潮信息發(fā)布元腦SD200超節(jié)點(diǎn),實(shí)現(xiàn)64路國產(chǎn)AI芯片高速統(tǒng)一互連;百度旗下昆侖芯256/512超節(jié)點(diǎn)將分別于2026年上下半年上市。
第四,光互連與PCB背板需求新增。
計(jì)算節(jié)點(diǎn)與交換節(jié)點(diǎn)之間的高速互聯(lián),在64或128 XPU規(guī)模內(nèi)以銅纜為首選,綜合成本約為光互聯(lián)方案的二分之一。
![]()
超出128 XPU后,正交背板方案信號(hào)損耗更低、結(jié)構(gòu)穩(wěn)固,適合高密架構(gòu);更大規(guī)模超節(jié)點(diǎn)集群則需引入OCS(光電路交換)設(shè)備,進(jìn)一步支持Dragonfly+或3D Torus等拓?fù)鋽U(kuò)展。
最后是供電架構(gòu)重構(gòu),PSU及HVDC需求提升。
超節(jié)點(diǎn)采用"機(jī)房級(jí)高壓直供→機(jī)柜級(jí)母線傳輸→節(jié)點(diǎn)級(jí)精準(zhǔn)降壓"的三級(jí)集中供電架構(gòu),PSU逐步從3.3KW向5.5KW、18.3KW升級(jí),對(duì)應(yīng)Powershelf提升至33KW乃至110KW。
隨著機(jī)柜功率邁入MW級(jí),數(shù)據(jù)中心供電架構(gòu)有望加速向高壓直流(HVDC)和固態(tài)變壓器(SST)轉(zhuǎn)型。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.