通信世界網消息(CWW)在光纖光纜價格持續上漲、算力基礎設施成本不斷攀升的背景下,AI產業正經歷一場從“規模擴張”向“效率優先”的轉變。
在此背景下,中科曙光于3月26日在中關村論壇現場發布了世界首個無線纜箱式超節點scaleX40,并同步開啟預售。這款產品的意義,并不只在于性能提升,更在于它試圖回答一個關鍵問題:如何讓超節點從少數人的“奢品/象征”,變成多數人的“標配”。
圍繞這一產品發布,中科曙光高級副總裁李斌與曙光信息產業(北京)有限公司副總裁李柳在工信智媒體記者接受采訪時,對其背后的技術邏輯與行業判斷進行了系統闡釋。
scaleX40為何“去線纜”?
在算力基礎設施建設中,光纖一直是核心互連技術之一。但近年來,其成本持續上行。“這背后是多重因素疊加。”李柳表示,一方面,算力基礎設施規模不斷擴大,帶動光纖需求增長;另一方面,國際局勢變化以及多行業廣泛應用,也在進一步推高資源消耗。
但在scaleX40的設計中,“無線纜”并不僅僅是為了節省成本。李柳強調,產品采用正交架構設計,核心目標是通過性能優化對沖成本壓力。“減少節點之間復雜的互連和外部線纜傳輸,本質上是在降低網絡層面的故障點。”
在大規模算力系統中,網絡往往是最容易出現問題的環節之一。通過減少互連復雜度,不僅可以降低故障率,也能夠提升系統穩定性與可維護性,從而保障推理與訓練過程的連續性。“故障率的降低和效率的提升,最終都會反映在投入產出比上。”李柳表示。
補位推理時代:scaleX40重構“超節點”定位
如果說“無線纜”解決的是架構問題,那么scaleX40更核心的意義,在于對“超節點”的重新定義。
“過去大家對超節點的認知,是幾百卡互連的高配系統,主要服務頂級訓練場景。”李斌表示,但在當前以推理為主的應用階段,這類產品顯得“過于超前”,而主流推理設備又難以支撐規模化服務需求。
scaleX40的推出,正是試圖填補這一“市場缺位”。這一判斷,建立在AI算力使用模式的變化之上。隨著大模型從訓練走向應用,推理需求快速增長,算力系統開始從“算力供給”轉向“服務供給”。
在這一過程中,“token”成為新的關鍵衡量指標。“未來更重要的,不是系統有多少算力,而是能否以更經濟的方式產出token。”李斌指出,這意味著算力系統需要同時兼顧響應速度與并發能力,在多維度上實現平衡。
讓超節點走向“標配”
讓超節點成為“多數人的標配”,不僅取決于性能,也取決于使用門檻。李斌介紹,傳統超節點通常以整柜形式售賣,采用高度定制化設計,對機房供電、散熱等條件要求較高,部署和運維復雜。而scaleX40采用標準箱式設計,可直接部署在標準機柜中,接入標準機房的供電與冷卻體系。“我們的目標,是把它從一個定制化系統,變成可以規模化復制的標準產品。”李斌表示。
這一改變,使超節點從“高門檻基礎設施”轉向“可部署能力單元”,不僅降低了部署復雜度,也縮短了上線周期。在具體配置上,scaleX40選擇“40卡”作為關鍵形態。“這不是一個絕對標準,而是當前場景下的一個‘甜點區間’。”李斌表示,相較于常見的32卡配置,40卡可以提供更高性能,同時為未來預留一定算力冗余,更適合實際生產環境。
此外,在推理場景中,算力系統通常通過多節點集群部署,實現能力的線性擴展。因此,單個40卡節點既是獨立單元,也是構建大規模“算力工廠”的基礎模塊。
scaleX40背后的算力競爭邏輯
scaleX40的發布,也折射出算力產業競爭邏輯的變化。
隨著AI應用不斷深化,算力正在從資源要素,轉變為可規模化生產的能力。token成為標準化產出,而算力系統則逐漸演變為“生產系統”。
在這一背景下,競爭的核心,不再只是“算力規模”,而是“單位成本下的token產出效率”。
李斌表示,這一轉變也推動技術創新從單點突破走向系統級協同,從芯片、硬件到系統軟件,再到模型與應用,通過全鏈條協同優化,實現整體效率提升。“我們更強調的是系統能力,而不是單一部件的能力。”他說。
從這一意義上看,scaleX40不僅是一款產品,更是一種嘗試。在推理時代,為算力基礎設施尋找一種新的平衡方式。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.