![]()
2026年,中國智算市場的競賽正處在一個微妙的關鍵節點。賽道一端是巨頭主導的超大規模超節點集群,聚焦萬億參數模型訓練等尖端需求;另一端是服務海量主體的中小規模算力,但傳統方案常受限于性能與擴展性。而銜接兩者的中小算力超節點賽道,正成為推動AI普惠的核心突破口。
3月26日,中科曙光在北京中關村國際創新中心發布的世界首款無線纜箱式超節點scaleX40,正是對這一行業命題的精準作答。
01
算力市場的“夾心層”,被看見了
中科曙光高級副總裁李斌指出,作為算力系統架構迭代升級的產物,超節點在當下的推理時代正面臨全新挑戰:一方面,面向訓練場景打造的數百卡/千卡級超節點,對于主流推理業務而言配置過剩,投入成本遠超性能收益甜點;另一方面,市場上主流的8卡GPU服務器,即便擴展至16卡規格,也難以匹配當前大模型的發展需求。這兩者之間,形成了顯著的產品供給空白與行業認知斷層。
![]()
中科曙光高級副總裁李斌
聚焦國內超節點賽道的市場格局,不同算力層級的玩家布局也呈現出鮮明的分化特征。
![]()
目前,64卡及以上超節點賽道,已有數十家參與者入局。其中既包括中科曙光、浪潮這樣的傳統服務器廠商,也有阿里云等云服務廠商。這一賽道的核心特征是追求64卡乃至數百卡的極致密度集成,目標是滿足科技巨頭與國家級科研平臺的核心算力訴求。例如華為的昇騰384超節點,以及百度計劃2026年上市的天池256、天池512超節點,均屬于這一范疇。這類方案普遍采用自研高速互聯協議、液冷散熱、高密供電等頂尖技術,將數百張GPU高效協同,以規模優勢突破算力天花板,能夠支撐萬億參數大模型訓練、AI for Science等極致算力需求。但相應地,當前主流大規模超節點產品的門檻極高:單集群售價普遍達到億元級別,后續的運維成本、機房改造投入、電力配套支出等更是居高不下。這樣的成本規模,讓絕大多數企業望而卻步,也注定了這類產品只能服務于極少數頭部主體,難以實現規模化普惠。
再看8卡節點,其本質是高性能服務器,屬于單臺服務器內的多卡集成方案,是AI算力的入門級標配,也是過去幾年中小市場的主流選擇。
![]()
過去數年里,8卡服務器堪稱AI技術普及的“功臣”——它入門門檻低、部署便捷靈活,即便在當下,面對小規模、輕量級的推理場景,依然能滿足基礎算力需求。從飛騰與中國長城聯合推出的擎天GF7280V5,到佑泰信息的8卡訓推一體機,這類產品憑借靈活部署、成本可控的優勢,長期占據著特定市場空間。然而,AI產業的迭代速度早已超越硬件升級的節奏,8卡服務器的性能短板也隨之愈發明顯。近日爆火的 OpenClaw “小龍蝦” 智能體,恰恰暴露了中小企業的算力痛點:云端調用Token成本飆升,單月開銷動輒過萬;本地8卡服務器跑不動多實例智能體,頻繁顯存溢出、響應卡頓;傳統高密度集群又被線纜拖累,算力損耗超標的同時,還讓硬件投入打了水漂。上述現象正是用戶在算力選型中面臨的難題:8卡集群難以支撐大模型相關任務,百卡級超節點又超出預算承受范圍——只能在“不夠用”與“用不起”之間被迫妥協。
“讓高端算力普及不是單一硬件的降價,而是要讓中小企業‘用得上、買得起、用得好’。”李斌強調,曙光將以開放姿態攜手模型廠商、系統廠商、軟件ISV等產業鏈上下游伙伴,通過全棧技術協同,精準填補算力市場的中間空白地帶,共同推動AI算力產業的普惠化發展。
02
剛需型超節點,戳中智算選型的“中間焦慮”
發布會現場,中科曙光展示了世界首個無線纜箱式超節點——scaleX40。
![]()
在關鍵指標上,scaleX40單節點集成40張GPU,總算力超過28PFLOPS(FP8精度),HBM顯存容量超過5TB,訪存總帶寬超過80TB/s。采用一級互連設計,40張加速卡Scale-Up全互連,支持內存語義、統一顯存編址,兼具極低延遲與超高帶寬,聚合帶寬超17TB/s;創新正交架構讓計算節點和交換節點無線纜正交對接,相比銅纜模式可用性提高10倍,相比光纖連接功耗下降40%~70%;尺寸方面,scaleX40采用19英寸標準尺寸,適配主流機柜,支持單柜單Pod、單柜雙Pod的靈活擴展方式;同時兼容主流軟件生態,搭配完善的開發工具、基礎軟件及AI大模型與應用,用戶可輕松完成大模型遷移,實現開箱即用。
![]()
傳統萬卡或千卡集群,采用“外置線纜+獨立交換機”的連接模式,每一張加速卡都需要通過獨立高速線纜與交換機對接,卡數越多,線纜數量呈幾何級增長。這種模式存在三大致命短板:一是通信損耗大,長距離線纜傳輸帶來信號衰減,端到端延遲居高不下,多卡協同效率大幅折損;二是部署運維難,數百根線纜梳理、調試、故障排查耗時極長,后期擴容難度極大;三是散熱與空間浪費,線纜堆積阻礙風道循環,提升散熱壓力,同時占用大量機柜空間,降低算力密度。而scaleX40的背部設計呈現出極高的集成度與整潔性:機柜內部數百根高速互聯線纜被徹底移除,發揮主要作用的,正是正交互連的結構。該設計既消除了長距離傳輸的信號損耗,又大幅簡化部署運維流程;同時優化機柜風道設計,提升算力密度,搭配靈活擴展與全生態兼容特性。這種“做減法”的架構哲學,實則是為了在性能上做“乘法”。
至于,為什么是40卡?
曙光信息產業(北京)有限公司副總裁李柳結合AI產業發展趨勢,深入剖析了普惠型超節點的核心邏輯與產品定位,其核心觀點可概括為三大關鍵判斷:
其一,算力供給需要“尖端與普惠”雙軌并行。超大規模千卡/萬卡級超節點,是支撐萬億參數大模型訓練等尖端場景的核心力量;而AI商業化要實現規模化落地,更離不開適配中小企業實際需求的普惠化算力——二者互為補充、缺一不可。
其二,剛需型超節點的核心,是在多重約束中找到平衡最優解。不同于高端超節點對極致性能的單一追求,剛需型產品必須兼顧性能適配、成本可控與部署便捷三大核心訴求:既要突破傳統8卡服務器的性能瓶頸,又要把采購、運維、機房改造等綜合成本壓到中小企業可承受范圍,同時降低部署門檻,適配現有基礎設施條件,避免“性能不夠用”或“成本用不起”的兩難。
其三,40卡規模是精準填補市場空白的“算力甜點區”。經過對千行百業AI應用場景的深度調研與反復性能測算,40卡配置能全面覆蓋千億參數大模型微調、MoE架構推理、垂直行業模型訓練等主流商業化場景,既避開了8卡節點的性能短板,又無需為64卡及以上超節點的冗余算力支付額外成本,恰好命中了市場長期存在的需求空白,成為解決行業痛點的關鍵配置選擇。
03
這場“集團軍作戰”,沒有一個是短板
高端算力的普及化,從來不是單一硬件的降價,而是算、存、網、管全鏈路的協同升級,單一環節的突破,只會形成新的木桶短板,無法真正釋放算力價值,這也是傳統超節點難以落地的重要原因。中科曙光深諳此道,深耕算力領域多年,具備全棧自研能力,為scaleX40量身打造了一套完整的技術生態體系。
ParaStor,也被稱為最懂AI的存儲。中科曙光分布式存儲產品部總經理石靜表示,曙光scaleX40超節點支持三套雙路/多路擴展配置,并且無論哪種規格,scaleX40都能靈活搭配ParaStor F9000全閃存儲節點,這些存儲節點構成統一資源池,形成“存算一體化”數據底座,完美匹配scaleX40面向中小規模訓練與推理的核心場景定位。此外,中科曙光提出“3+5”存算協同技術,構建三級強協同(scaleX40計算、scaleFabric網絡、ParaStor F9000存儲)與五大核心優化(GPU顯存卸載、本地內存加速、RDMA低延遲網絡、全閃存高帶寬、端到端IO鏈路)。實現訓推帶寬提升2倍以上、推理TTFT降低97%,大幅提升GPU利用率,解決大模型IO瓶頸。曙光scaleX40還構建了專屬“AI設計工廠”:從數據采集、標注、處理到驗證,全流程嵌入存儲加速能力。通過向量數據庫集成、流水線IO加速庫等技術,存儲深度參與AI業務流轉,打破存力與算力的物理邊界,實現“以存代算、以存促算”的新模式。
SothisAI一站式平臺專為超節點架構深度優化,覆蓋模型訓推全鏈路閉環,更支持智能體應用高效集成,讓AI開發從碎片化走向一體化。中科曙光高端計算總工程師解西國表示,針對大規模AI系統在訓練與部署階段普遍存在的穩定性差、部署復雜等痛點,曙光智算打造了一套極簡、智能化的運營管理體系。在資源部署層面,SothisAI實現了對超節點系統的集中式管理,涵蓋部件管理、驅動升級及模型部署等環節,支持“一鍵部署、開箱即用”,極大降低了運維門檻。在全域管理層面,SothisAI實現了從芯片、機電、網絡、存儲到應用的多維度集中管控,構建了面向AI業務的全棧管理技術體系。面對海量監控數據與復雜運維流程,SothisAI內置了智能檢測算法與AI大模型,結合運維知識庫與系統拓撲結構,實現了運維流程的自動化編排。同時,SothisAI具備故障預測、檢測與分析能力,并能與上層大模型訓練框架聯動,有效提升了大模型在訓練與推理全生命周期中的穩定性與可靠性。
從核心超節點硬件,到AI專屬存儲、一站式運維平臺,這套全棧自研體系沒有冗余堆砌,每一個環節都圍繞scaleX40的普惠定位深度適配、協同優化。
04
高端算力標配的時代,已經到來
scaleX40的推出,不止是一款新品的發布,更標志著超節點行業迎來發展拐點。
當前,智算采購早已跳出單純比拼峰值算力的窠臼。受數字化進程提速、算力需求動態增長以及成本與運維雙重管控的多重影響,“易部署、快交付、可擴展”已成為諸多核心客群的核心采購決策依據。而scaleX40的產品定位,恰好精準契合這一市場需求。
scaleX40可廣泛適配六大核心應用場景:大模型訓練、智算中心建設、企業級推理、高校科研攻關、研發測試環境搭建及行業解決方案落地。其中,針對政企類客戶,其標準化設計無需定制改造,可快速適配現有機房體系的標準設施,高效落地政務數字化、智慧城市等場景,兼顧合規與效率;面向科研類客戶,模塊化架構支持靈活彈性擴容,降低運維門檻,讓科研團隊專注核心研發,適配多類科研計算需求;對于中小制造企業,這款超節點性價比出眾,部署靈活、易擴展,能快速適配工業仿真、數字孿生等場景,以低成本算力方案助力制造業數字化轉型,徹底破解各類客群的算力落地難題。
目前,中國AI產業正在從“頭部試點”走向“全域落地”的關鍵分水嶺。2025年以來,多地制定算力券、算力補貼等機制,密集出臺數據要素企業扶持政策,強化對AI產業的支持。從少數巨頭的技術試驗場,到萬千中小企業的轉型工具箱,AI 產業的成熟,需要高端算力的堅實支撐。曙光scaleX40 的問世,正是順應這一趨勢的一次重要實踐。它以40卡“算力甜點區” 的配置,平衡了性能與成本;以全棧協同的生態體系,簡化了部署與運維。這不僅為中小企業打開了擁抱大模型等AI場景的大門,更讓算力真正成為驅動各行各業創新的通用生產力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.