![]()
![]()
中科曙光 scaleX 萬卡超集群真機首秀!5EFlops 總算力+單機柜 640 卡超節點,四大硬核技術突破國產算力瓶頸,更以開放生態重構智算產業新格局,這場算力革命等你來探!
編輯:前沿在線 編輯部
2025年12月18日,昆山,2025人工智能創新大會上,國產萬卡級AI集群系統,在此首次以真機形式亮相。
這是一個意義重大的“國之重器”。面向十五五,中國正全面加速算力基礎設施建設,賦能整個社會經濟數智化轉型。然而,國產算力芯片性能差距大、自主軟硬件生態不成熟等“短板”,正制約了中國智算產業的發展。
現在,面對這些挑戰,中科曙光給出了中國創新的響亮回應。
12月18日,在昆山舉行的2025人工智能創新大會(HAIC2025)上,中科曙光發布并展出了全球領先的大規模智能計算系統——scaleX萬卡超集群。
它不僅是一個領先技術突破,更象征著中國智算產業突破瓶頸、構建自主生態之路的新階段。
![]()
四大優勢:突破算力瓶頸
當前,人工智能規模化落地的主要瓶頸,在于傳統的單機和集群架構在處理大規模AI訓練和推理任務時,普遍存在服務器間帶寬不足、高時延等問題。
因此,基于高速互聯技術,將多塊算力芯片(如GPU或NPU)集成進一個邏輯單元,形成“超節點”規模化計算單元,并進一步構建大規模算力集群,已成為有效縮短時延、提升服務器間帶寬,實現更高算力效率的行業大趨勢。
“scaleX萬卡超集群,正是曙光發揮大型計算機系統研制經驗優勢,面向萬億參數大模型、科學智能等復雜任務場景打造的大規模智能算力基礎設施方案。”中科曙光高級副總裁 李斌向《中國新聞周刊》表示。
![]()
據了解,面對人工智能基礎設施對性能、效率、可靠性、可擴展性等方面的極致需求,scaleX萬卡超集群以當前業內最高的集成度,實現了超節點架構、高速互聯網絡、存儲性能優化、系統管理調度等全方位的創新突破,部分技術與能力甚至超越英偉達計劃于2027年發布的NVL576。
相比同類產品,scaleX萬卡超集群實現了四大技術優勢:
第一,全球首創單機柜級640卡超節點。scaleX萬卡超集群由16個曙光scaleX640超節點通過scaleFabric高速網絡互連而成,可實現10240塊AI加速卡部署,總算力規模超5EFlops。作為世界首個單機柜級640卡超節點,scaleX640采用超高密度刀片、浸沒相變液冷等技術,將單機柜算力密度提升20倍,PUE值低至1.04。
第二,自主研發原生RDMA高速網絡。曙光scaleFabric網絡,基于國內首款400G 類InfiniBand的原生RDMA網卡與交換芯片,可實現400Gb/s超高帶寬、低于1微秒端側通信延遲,充分釋放萬卡超集群算力,并可將超集群規模輕松擴展至10 萬卡以上,相比傳統IB網絡提升2.33倍,同時網絡總體成本降低 30%。
第三,存、算、傳緊耦合深度優化。通過“超級隧道”、AI數據加速等設計,實現從芯片級、系統級到應用級的三級數據傳輸協同優化,使存力平臺高效應對大模型訓練時萬卡并發讀寫帶寬極致需求挑戰,提升高通量AI推理時的響應速度與結果精準度,并可將AI加速卡資源利用率提高55%。
第四,超集群數字孿生與智能調度。通過物理集群數字孿生,實現故障定位、修復等全流程可視化智能管理;智能化運維平臺可支撐集群長期可用性達99.99%;智能調度引擎可管理萬級節點、服務十萬級用戶,支持每秒萬級作業調度。
![]()
從“單點突圍”到“生態共進”:中科曙光引領產業升級
scaleX萬卡超集群并非橫空出世,而是中科曙光沿著清晰的“開放創新”路徑,不斷向前突破邁進的成果。
過去十年來,中科曙光累計已建設超過20個大規模算力集群,累計部署超過50萬張異構加速卡。自2025年以來,中科曙光更深入軟件、硬件和生態底層,聯手合作伙伴,牽頭打造出了一個更加自主、更具韌性、高質量、可持續成長的開放多元架構。
2025年9月,中科曙光協同AI芯片、AI整機、大模型等20多家產業鏈上下游企業,共同發布國內首個AI計算開放架構,將過去“算、存、網、電、冷、管、軟”各個環節的單點突破,升級為整個產業鏈的集群協同創新。
![]()
2025年8月,中科曙光發布了國內首個行業標準化超智融合算力平臺:Nebula800。該平臺依托開放架構,專攻智能制造、生命科學、石油勘探等領域AI4S復雜計算任務場景,以一套系統打通超算、智算技術與生態壁壘,一平臺支持多精度、混精度計算,破解非融合系統計算精度不全、應用普適性差、異構資源管理調度困難等問題。
2025年10月,中科曙光發布國內首個科學大模型一站式開發平臺OneScience,基于AI計算開放架構理念,讓人工智能更高效地服務于加速科學發現進程,驅動新型科研范式。基于該平臺,科研用戶開發和部署大模型的效率百倍提升,最快只需要3小時就可以開發一個科學大模型。
![]()
2025年11月,中科曙光發布全球首個單機柜級640卡超節點scaleX640,相比業界同類產品,scaleX640單機柜算力密度提升20倍,可實現MoE萬億參數大模型訓練推理場景高達30%~40%的性能提升,并保障10萬卡級超大規模集群擴展部署,綜合算力性能和各項指標均已全面超越此前國內最領先的同類型384超節點。
![]()
而現在,scaleX萬卡超集群的落地,則是中科曙光將開放理念轉化為可落地普惠算力的全新里程碑。作為“AI計算開放架構”最新重磅成果,scaleX萬卡超集群可支持多品牌加速卡以及主流計算生態,并實現400+主流大模型、世界模型等適配優化。在實際應用中,該超集群可覆蓋大模型訓練、金融風控、地質能源勘探及科學智能等多元場景,助力“人工智能+”戰略在千行百業落地生根。
這一系列的動作背后,是一場具有深遠戰略意義的產業變革。中科曙光正協同產業界多方伙伴,從以前的“各自為戰”“單點突圍”,轉變為共享若干關鍵共性技術能力,依托系統工程思維推進智算集群創新的產業“生態共進”。將內部多樣化的技術路線整合為對外統一的強大算力服務。
這不僅是解鎖“人工智能+”戰略的算力密碼,更將為全球數智化未來,提供一個多元、開放的中國方案。
前沿動態
前沿大會
前沿人物
點「在看」,給前前加雞腿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.