國內最大單體國產AI算力資源池正式啟用!2月5日,由中科曙光提供的3萬卡超集群系統在國家超算互聯網核心節點上線試運行,并將用于萬億參數模型訓練、高通量推理、AI for Science等大規模AI計算場景。
![]()
在老冀看來,這次3萬卡超集群的成功部署可謂意義重大,因為它同時承擔起了中國經濟的“技術破壁者”、“產業賦能者”、“發展新引擎”的三重角色。
技術破壁者
要知道,國內AI市場苦算力久矣。
一方面,過去幾年,隨著AI在各行各業和消費市場的加速落地,對于AI算力的需求出現了爆發性的增長。知名研究機構IDC預測,2020年到2028年,中國AI算力年均復合增長率高達46.2%,并在2028年達到2781 EFLOPS的驚人規模。
另一方面,由于GPU等關鍵AI芯片以及高端制程工藝均受到限制,國內AI算力的供給遭遇眾多掣肘,供不應求局面日益凸顯。
如何解決AI算力的瓶頸?建設能夠容納更多加速卡的AI算力集群,顯然是關鍵的解決之道。
要知道,在大洋彼岸的美國,美國能源部、xAI、OpenAI、Meta等已經建成了超萬卡甚至超10萬卡的集群。
在國內,雖然已經涌現了一大批國產加速卡廠商,但是單卡性能與英偉達等美國廠商還有一定的差距。由此,國內建設超萬卡集群的需求,其實比美國更加強烈。
那為什么在此之前,國產超萬卡集群并不多呢?這是因為隨著加速卡品類和數量的激增,超萬卡集群需要同時解決異構計算、通信效率優化、能耗與散熱平衡、系統穩定性保障等多個技術難點,這就需要系統級的解決方案。
當此關鍵時刻,中科曙光勇敢地站了出來,通過高密度機柜、高速網絡、深度優化、智能調度四大技術突破,打造了scaleX萬卡超集群,不僅實現了技術的集大成,部分技術與能力已經超越英偉達一年多之后才發布的NVL576里程節點。
![]()
而且,中科曙光scaleX萬卡超集群基于AI計算開放架構,可全面兼容CUDA等主流軟件生態,支持多品牌國產加速卡混合部署,具備向十萬卡、百萬卡規模的靈活擴展,目前已完成400多個主流大模型、世界模型的適配優化。依托國家超算互聯網實現一體化算力調度,更可接入上千款應用,從而可為全球用戶提供好用易用的中國AI算力。
產業賦能者
如果你認為3萬卡超集群只是讓國產AI算力可用,那你就小看它的沖擊力了。實際上,它還承擔起了算力普惠的角色,為千行百業賦能。
3萬卡超集群在國家超算互聯網核心節點上線之后,從2月5日到4月30日,國家超算互聯網對外公布了邀測計劃,不僅為各行業領域專業用戶提供從百卡級到萬卡級規模的應用適配測試,也可為創客、初創團隊、大學生等群體提供上千卡時、百G存儲、千萬Tokens等免費試用資源。
目前,國家超算互聯網的用戶規模已經突破100萬,接入了超30家國家級超算中心與智算中心,商品數量超過了7200個,已完成了1.96億的作業量。在2月5日3萬卡超集群上線發布會上,還發布了首批千款應用驗證成果。
![]()
3萬卡超集群能做什么?
首先,支持AI頭部大廠的全業務。它針對AI頭部大廠的超大規模模型訓練,支持萬億參數模型的整機訓練與容錯恢復;它面向高通量推理場景,服務多家頭部互聯網用戶的核心智能化業務,通過聯合深度優化,持續提升推理效能。
其次,幫助科研團隊降低成本。前不久,科研團隊在國家超算互聯網平臺使用GROMACS v2023.2 加速版,對油-水體系的界面張力進行了計算。計算表明,基于國產異構加速卡,對約2萬原子的體系進行1ns模擬,成本低至1元。如今有了3萬卡超集群提供的澎湃算力支持,科研進度還能大大加速,成本也能繼續降低。
之前在AI for Science領域,scaleX萬卡超集群支撐國內某材料研發大模型登頂國際權威榜單,助力國內頂級科研團隊將蛋白質研究效率提升3-6個數量級等;同時搭配OneScience科學大模型一站式開發平臺,大幅降低多學科交叉研究的創新門檻。
最后,助力創業者快速起飛。此前,大學生創業團隊匯視威科技就通過國家超算互聯網的平臺生態扶持,成長為湖南省“人工智能+”重點企業,其算力商品銷量突破4800單。
有了3萬卡超集群,即使是規模很小的創業團隊,也不用為算力發愁,從而將自己的主要精力放在算法和場景創新方面,快速完成PMF(產品與市場匹配)。老冀相信,有了3萬卡超集群的助力,未來會有更多創業公司成長為獨角獸甚至行業巨頭。
發展新引擎
為行業賦能就夠了嗎?目前,國家層面正在積極推動全國算力一張網,“十五五”規劃建議中就提出推進“全國一體化算力網”,而國務院《關于深入實施“人工智能+”行動的意見》強調“強化智能算力統籌”,指明未來算力發展將加強高效協同。
如今,3萬卡超集群在國家超算互聯網核心節點的上線,打響了中部算力應用高地崛起“第一槍”,成為全國最大算力調度樞紐,有效聯動中國乃至全球算力資源與應用需求。同時,依托規模優勢,超算互聯網核心節點也將帶來人才、數據、應用場景等產業聚集效應,助力區域高質量發展。
此前,“東數西算”的8大算力樞紐和10大算力中心均位于東西部,3萬卡超集群部署在中部的鄭州,能夠更好地連接東部的算力需求和西部的算力供給,充當起全國算力中轉分發的樞紐。
如今,我們正在加速走進“人工智能+”時代。3萬卡超集群的上線,讓AI算力走向普惠,助力AI應用加速普及,還實現了跨區域算力協同。所以說,它不僅僅是技術破壁者和產業賦能者,還在成為經濟發展的新引擎。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.