允中 發自 凹非寺
量子位 | 公眾號 QbitAI
國內智算基礎設施,正跨過一個關鍵的分水嶺。
2月5日,由中科曙光提供的3套scaleX萬卡超集群,在國家超算互聯網核心節點同時上線試運行。
由此,全國首個實現3萬卡部署、且實際投入運營的最大國產AI算力池正式形成。
![]()
過去,萬卡集群更像是頭部玩家的實力勛章。如今,當萬卡規模的算力開始實現“多套并行、同時落地、即刻應用”,國產超集群便跨過了單點突破的階段,正式步入規模化落地的工程成熟期。
從產業角度,這釋放了三層明確信號:
- 第一,國產萬卡超集群開始進入規模化落地階段;
- 第二,系統創新正在取代“單點算力參數”,成為競爭主戰場;
- 第三,萬卡超集群已實現從“做出來”向“讓真實業務跑起來”的跨越。
能落地、穩得住,才是萬卡時代的“入場券”
萬卡超集群的難點,早已從單純的“做出一套系統”,轉向了能否實現規模化復制和落地。
規模化落地,說到底是系統工程能力的集中較量。
周期可控、性能可復現、故障可定位、成本可核算——這些硬核能力,才是長期玩家真正的入場券。
萬卡超集群的競爭,正在從“總卡數、總算力”轉向“系統級協同”:即網絡、存儲、散熱、供配電、調度與運維的聯動優化,才是把大規模算力變成穩定產能的關鍵。
以scaleX萬卡超集群為例,其scaleFabric網絡不僅能實現萬卡超集群400Gb/s超高帶寬、低于1微秒端側通信延遲,更具備未來面向十萬卡、百萬卡演進的擴展能力。
同時,通過高密設計、低PUE導向的工程方案,以及智能調度等系統能力,讓集群不止于“建得起來”,更能“穩得住、用得好”
到了規模化落地階段,系統級創新就不是虛詞了,效率高不高、穩不穩、好不好維護、TCO(總成本)劃不劃算,才是見真章的地方。
說到底,這些實打實的指標,才是撐起萬卡超集群大規模復制的“壓艙石”。
萬卡超集群真正的勝負手:規模化應用
搞定萬卡的穩定供應,充其量只是拿到了“及格分”。
真正的終極考題在于:這些卡能不能實實在在地轉化成真實業務的生產力
過去行業里有個怪象,不少萬卡項目更像是“樣子工程”,停留在展示和跑分上,一旦拉到真實業務里去“練兵”,就顯得底氣不足,那是因為缺少持續業務負載的實際檢驗。
規模化應用背后,至少包含三層要素。
1、開放兼容,決定萬卡超集群應用門檻與廣度
一個封閉生態的萬卡超集群,即便性能很強,也會在遷移成本上勸退大量用戶。
相反,開放兼容意味著更低的適配門檻、更快的上手速度、更可控的改造成本
曙光scaleX超集群基于AI計算開放架構,可全面兼容CUDA等主流軟件生態,支持多品牌國產加速卡混合部署,加速國產AI生態繁榮。
2、萬卡超集群不應是“大公司專屬”,公共基礎設施屬性正在形成
過去,萬卡超集群過去給很多人的直觀印象是:只有極少數巨頭公司用得起、用得好。
但在萬卡超集群進駐國家級算力網絡的核心節點后,它就從單純的技術設施,真正轉變為一種公共基礎設施,成為制造、能源、交通、科研、教育、醫療、金融領域等千行百業的算力“水煤電”。
3、用真實業務把萬卡超集群變成各行各業生產力
萬卡超集群能不能行,跑通幾個模型和應用只是“及格線”,能不能扛住千行百業實打實的業務負載,才是真正的“分水嶺”。
以scaleX萬卡超集群為例,其已完成400余個主流大模型與世界模型的適配與優化,并依托國家超算互聯網實現上千款應用對接運行,鏈接更多AI產業生態伙伴,推動形成“算力+應用”協同的一體化落地模式。
![]()
在實戰應用中,scaleX萬卡超集群的價值,在三個維度得到了充分釋放:
第一,在大模型訓練場景下,主打“穩”字。
它能穩穩托住萬億參數級模型的整機訓練,并提供容錯與快速恢復能力,保障超長周期訓練穩定連續。
第二,在高通量推理場景下,強調“實”字。
通過軟硬協同與端到端聯合優化,將推理能力沉淀為可長期承載核心業務的服務化能力,目前已服務于多家頭部互聯網用戶的核心智能化業務。
第三,在AI for Science場景下,突出“快”字。
將算力直接變現為科研效率。無論是支撐材料研發大模型刷新全球評測紀錄,還是將蛋白質研究效率提升百萬倍(3-6個數量級),它都在加速科學發現的進程。
3套scaleX萬卡超集群上線背后,釋放了一個信號——
單純堆砌算力規模已不再是核心勝負手。
未來的贏家,必須要能讓萬卡集群在業務一線持續“出力”,并能把這種復雜的工程能力大規模地鋪向全行業
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.