在烏鎮(zhèn)世界互聯(lián)網(wǎng)大會的舞臺上,流傳于AI行業(yè)許久的超高密度超節(jié)點(diǎn)傳聞終于塵埃落定——中科曙光正式發(fā)布了scaleX640超節(jié)點(diǎn)。
根據(jù)官方披露的信息,這款新產(chǎn)品相較行業(yè)內(nèi)同類型產(chǎn)品,綜合算力性能足足提升一倍,單機(jī)柜的算力密度更是實(shí)現(xiàn)了20倍的飛躍,并且能夠通過雙scaleX640超節(jié)點(diǎn)搭配組成千卡級計算單元,支持百萬卡規(guī)模的靈活拓展。
比亮眼的性能參數(shù)更讓人矚目的,是scaleX640超節(jié)點(diǎn)出色的生態(tài)兼容性。硬件方面,它能夠適配“多品牌加速卡”;軟件層面,也達(dá)成了與主流AI計算生態(tài)的無縫兼容。
對于正遭遇發(fā)展瓶頸的國產(chǎn)AI算力而言,這款超節(jié)點(diǎn)的出現(xiàn),無疑搭建起了一個真正實(shí)用、可靠的“算力底座”。
![]()
國產(chǎn)AI為何需要萬卡超節(jié)點(diǎn)?
要理解曙光scaleX640超節(jié)點(diǎn)的戰(zhàn)略意義,首先得弄清楚一個核心問題:國產(chǎn)AI為何對千卡乃至萬卡級的計算單元有著迫切需求?
答案其實(shí)并不復(fù)雜,當(dāng)前國產(chǎn)AI正面臨著兩大難題的夾擊——“單芯片性能不足”與“大模型需求猛增”。
目前,國產(chǎn)AI單芯片的性能與國際頂尖水平仍存在一定差距;而萬億參數(shù)大模型已然成為AI領(lǐng)域競爭的核心門檻,這類大模型在訓(xùn)練和推理過程中,對算力的需求呈現(xiàn)出指數(shù)級增長的態(tài)勢。在這樣的背景下,突破困境的核心關(guān)鍵在于系統(tǒng)集成創(chuàng)新。
借助集群規(guī)模帶來的效益來彌補(bǔ)單卡性能的短板,將成千上萬張加速卡進(jìn)行高效協(xié)同運(yùn)作,搭建萬卡級甚至百萬卡級的超大規(guī)模集群,已經(jīng)成為國產(chǎn)AI打破算力瓶頸的必經(jīng)之路。
最新發(fā)布的《2025中國算力發(fā)展之AI 計算開放架構(gòu)研究報告》明確指出,國內(nèi)AI產(chǎn)業(yè)要實(shí)現(xiàn)破局,需要依靠“以集群規(guī)模效益彌補(bǔ)單卡性能代差”,而曙光scaleX640超節(jié)點(diǎn)正是這一理念下的標(biāo)桿性產(chǎn)品。
但要達(dá)成“集群規(guī)模效益”的目標(biāo),絕不是簡單地把10000張卡堆放在一起那么容易,而是需要攻克三個關(guān)鍵難關(guān):
供電與散熱的難題首當(dāng)其沖。“千卡”規(guī)模的集群功耗極為驚人,一個機(jī)柜的用電功率甚至堪比一座樓宇,傳統(tǒng)的風(fēng)冷散熱方式在這里完全不起作用,無法滿足散熱需求。
高速通信的實(shí)現(xiàn)同樣關(guān)鍵。如何讓海量的“加速卡”之間實(shí)現(xiàn)高速通信,同時保持低延遲?如果做不到卡間的高速通信,AI集群的規(guī)模越大,整體效率反而會越低,難以發(fā)揮集群的優(yōu)勢。
生態(tài)協(xié)同的問題更是核心痛點(diǎn)。在傳統(tǒng)的封閉體系中,不同品牌的加速卡與軟件棧之間互不兼容,形成了一個個孤立的“生態(tài)孤島”。這使得統(tǒng)一的資源調(diào)度、高效的算力協(xié)同變得幾乎不可能實(shí)現(xiàn),也嚴(yán)重制約了國產(chǎn)AI算力的發(fā)展。
這三大難關(guān),最終匯聚成了“物理極限”與“生態(tài)割裂”兩大核心挑戰(zhàn)。而中科曙光的scaleX640超節(jié)點(diǎn),通過“系統(tǒng)工程創(chuàng)新”與“開放計算架構(gòu)”的雙重發(fā)力,成功破解了上述三大難題。
這三道“瓶頸”,最終形成了“物理極限”與“生態(tài)割裂”兩大核心挑戰(zhàn)。而中科曙光scaleX640超節(jié)點(diǎn),則通過“系統(tǒng)工程創(chuàng)新”以及采用“開放計算架構(gòu)”,解決了上述三大難題。
曙光方案:筑就國產(chǎn)AI高效算力底座
面對“物理極限”與“生態(tài)割裂”等多重挑戰(zhàn),曙光scaleX640超節(jié)點(diǎn)的核心價值,不在于對算力卡的簡單疊加,而在于集群架構(gòu)的創(chuàng)新設(shè)計與開放生態(tài)的構(gòu)建。
通過系統(tǒng)級的工程突破,它為國產(chǎn)AI打造出了一個高效且統(tǒng)一的算力底座。
在“高效節(jié)能”方面,scaleX640超節(jié)點(diǎn)采用“浸沒相變液冷”與“高壓直流供電”相結(jié)合的方案,
相比傳統(tǒng)風(fēng)冷模式,節(jié)能效率提升了30%,同時全面釋放了算力設(shè)施的潛在性能,這也是它能夠?qū)崿F(xiàn)“單機(jī)柜640卡”超高算力密度的關(guān)鍵物理基礎(chǔ)。
![]()
“高速互聯(lián)”則是scaleX640超節(jié)點(diǎn)的核心優(yōu)勢之一。它以“超高速正交架構(gòu)”為支撐,搭配“超高密度刀片”設(shè)計,這一組合如同超節(jié)點(diǎn)的“神經(jīng)體系”,成功實(shí)現(xiàn)了“單機(jī)柜640卡超高速總線互連”,構(gòu)建起“大規(guī)模、高帶寬、低時延”的通信環(huán)境,為百萬卡級超大規(guī)模集群的擴(kuò)展部署提供了堅實(shí)保障。
在“生態(tài)協(xié)同”上,scaleX640超節(jié)點(diǎn)依托“AI計算開放架構(gòu)”,硬件層面能夠支持多品牌加速卡接入,軟件層面則與主流計算生態(tài)完美兼容,打造出了“軟硬協(xié)同、生態(tài)兼容”的國產(chǎn)智算全新模式。
![]()
scaleX640超節(jié)點(diǎn)為國產(chǎn)AI的發(fā)展提供了極具價值的樣板參考,它深刻印證了“集成創(chuàng)新+開放系統(tǒng)”模式的戰(zhàn)略意義。
這一模式不僅精準(zhǔn)破解了當(dāng)下國產(chǎn)AI面臨的算力瓶頸,更是為未來萬卡乃至百萬卡時代的發(fā)展搶占了先機(jī),做好了布局。
隨著生態(tài)壁壘被逐步打破,集群效率不斷實(shí)現(xiàn)躍升,一個兼容并蓄、自主可控的算力底座正在逐漸成型。
這一變化意味著國產(chǎn)AI算力不再受限于他人,有望在開放架構(gòu)的引領(lǐng)下,真正邁入規(guī)模化、生態(tài)化發(fā)展的全新階段。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.