在剛剛落幕的光合組織2025人工智能創(chuàng)新大會(HAIC2025)上,國產(chǎn)AI產(chǎn)業(yè)呈現(xiàn)出前所未有的“體系化”趨勢。從海光信息的開放系統(tǒng)互聯(lián)總線,到曙光的萬卡集群;從統(tǒng)一異構(gòu)編程工具包UPTK到科學大模型一站式開發(fā)平臺的開放共享;從整機、操作系統(tǒng)、芯片廠商的大規(guī)模聯(lián)合簽約,到覆蓋三年周期、總投入10億元的AI計算開放架構(gòu)聯(lián)合實驗室的項目組協(xié)同創(chuàng)新計劃等,國產(chǎn)AI正在從碎片化走向生態(tài)化協(xié)同;從單點產(chǎn)品競爭走向系統(tǒng)工程競爭。而在這一轉(zhuǎn)變中,“開放架構(gòu)”已不再是行業(yè)口號,而成為了支撐國產(chǎn)AI走向可持續(xù)繁榮的技術拐點。
![]()
告別“煙囪式”繁榮,生態(tài)的本質(zhì)是連接與選擇
眾所周知,過去幾年,國產(chǎn)算力市場呈現(xiàn)出“爆發(fā)式”增長。然而,當我們撥開繁榮的表象,審視其內(nèi)核時,會發(fā)現(xiàn)這種繁榮在某種程度上伴隨著“虛火”。
例如為了在短期內(nèi)搶占市場,許多廠商選擇了“類大型機”的封閉垂直優(yōu)化模式,且這種模式僅由少數(shù)巨頭主導,從芯片、基礎軟件、框架到模型進行全棧耦合優(yōu)化。
不可否認,此種“煙囪式”模式在初期的確能帶來較高的整合效率,但長此以往,勢必導致嚴重的“生態(tài)隔離”,即不同品牌的芯片之間無法互通、不同架構(gòu)的系統(tǒng)之間難以遷移以及算力資源變成相互割裂的孤島的同時,給用戶帶來極高的試錯成本和被廠商鎖定的風險,而站在整個產(chǎn)業(yè)的高度,則意味著重復造輪子,大量研發(fā)資源被消耗在無意義的適配而非核心技術的創(chuàng)新上。
此外,國產(chǎn)智算產(chǎn)業(yè)要想實現(xiàn)真正的突圍,還面臨“性能墻”與“生態(tài)墻”的雙重阻礙。
以“性能墻”阻礙為例,隨著摩爾定律的放緩和單芯片性能提升邊際效應的遞減,單純依靠堆砌晶體管數(shù)量來提升單點算力的路徑已難以為繼。特別是在高端芯片供應鏈受限的大背景下,單純靠“單卡性能”硬剛,如同以己之短攻彼之長。
相較之下,“生態(tài)墻”的阻礙則更為隱秘且致命。具體表現(xiàn)為專有封閉系統(tǒng)導致應用適配遷移成本高昂,軟硬件生態(tài)不成熟,資源供需錯配,從而導致許多企業(yè)在采購了昂貴的國產(chǎn)算力設備后,卻發(fā)現(xiàn)由于軟件棧不兼容,主流的大模型無法跑通,或者性能折損嚴重。而這種“有算力無生態(tài)”的尷尬局面,勢必嚴重制約國產(chǎn)AI產(chǎn)業(yè)的落地進程。
正是在上述背景下,行業(yè)亟待重新定義“伙伴繁榮”的含義。而重新定義它的關鍵在于企業(yè)不應建立在“綁定”之上,而應建立在“選擇權”之上;不應依賴單卡性能的極限突破,而是仰仗體系協(xié)同的持續(xù)演進。
基于此,惟有打破“煙囪式”模式,通過開放、標準化建立一個基于統(tǒng)一開放技術底座(“類Cluster”的開放跨層優(yōu)化模式)的“安卓”開放生態(tài),打通底層的互聯(lián)互通,讓不同廠商的產(chǎn)品像搭積木一樣自由組合,實現(xiàn)資源的普惠,才是國產(chǎn)計算走向可持續(xù)發(fā)展的唯一技術路線,也是實現(xiàn)算力普惠的必由之路。
開放架構(gòu)為支點,五層開放體系重構(gòu)產(chǎn)業(yè)協(xié)作
如果說“打破煙囪”是行業(yè)的共識,那么“AI計算開放架構(gòu)”就是實現(xiàn)這一目標的具體路徑。而在HAIC2025上,光合組織詳細闡述了這一架構(gòu),即與封閉垂直模式不同,AI計算開放架構(gòu)并非由單一廠商主導,而是以系統(tǒng)工程思維,聯(lián)合芯片、整機、基礎軟件、數(shù)據(jù)與應用等產(chǎn)業(yè)鏈多方共同構(gòu)建。這種路徑更像國產(chǎn)智算界的“安卓模式”,通過開放接口與標準,降低協(xié)作門檻,放大整體創(chuàng)新效率。
而從工程角度看,開放架構(gòu)的關鍵不在于“是否開放”,而在于“開放到哪一層、以何種方式開放”。具體到此次光合組織推動的開放架構(gòu),其核心體現(xiàn)在五個層面的系統(tǒng)性打通。
眾所周知,在AI集群中,芯片與芯片之間的互聯(lián)帶寬往往是性能的瓶頸所在,是架構(gòu)的基石。為了解決這一問題,海光信息推出了HSL(High-performanceScalable Link)。
相比傳統(tǒng)的PCIe接口,HSL不僅大幅降低了延遲,提升了帶寬,更實現(xiàn)了芯片間(C2C)的高速直連和全局地址空間一致性。這意味著,基于HSL,不同廠商的AI加速卡可以像“搭積木”一樣與CPU進行高效協(xié)同,極大簡化了編程復雜度,尤其是在本屆大會上海光HSL 1.0規(guī)范及設計參考方案的發(fā)布,硬件伙伴的適配門檻將大幅降低,解決了長期以來國產(chǎn)AI服務器“適配難”的頑疾,推動了部件級的“即插即用”。而10余家國產(chǎn)芯片廠商的加入,正是看中了這一標準所帶來的生態(tài)紅利。
建立在互聯(lián)基石之上的,是系統(tǒng)級的硬件解耦與大規(guī)模集群的工程化協(xié)同。
以中科曙光發(fā)布的scaleX萬卡超集群為例,它不僅是算力規(guī)模的突破,更是開放架構(gòu)理念的集大成者。據(jù)了解,該集群由16個scaleX640超節(jié)點通過全棧自主研發(fā)的原生RDMA高速網(wǎng)絡互連而成,硬件支持多品牌AI加速卡,軟件兼容主流計算生態(tài)。
![]()
需要強調(diào)的是,這種“巨型系統(tǒng)”的構(gòu)建,并非簡單的節(jié)點堆砌,而是通過國產(chǎn)自研原生RDMA高速網(wǎng)絡和“超級隧道”技術帶來的存力范式革命,實現(xiàn)存、算、傳緊耦合深度優(yōu)化,并結(jié)合BurstBuffer、XDS等技術加持,顯著降低訪問延遲、提升推理客戶端的帶寬,大幅提升大模型訓推效率。
這無疑向行業(yè)證明,在開放架構(gòu)下,通過超大規(guī)模組網(wǎng)與智能調(diào)度、存力新范式的系統(tǒng)工程創(chuàng)新,完全可以駕馭萬億參數(shù)模型訓練等頂級挑戰(zhàn),構(gòu)建出世界領先的算力基礎設施。
如果說硬件是骨骼,那么軟件就是靈魂。為此,開放架構(gòu)在軟件層推出了UPTK(通用異構(gòu)編程工具包),直指長期困擾國產(chǎn)算力生態(tài)的CUDA壁壘問題。具體體現(xiàn)在,通過對異構(gòu)計算接口的統(tǒng)一抽象,UPTK讓開發(fā)者能夠以“一套代碼、多端部署”的方式,適配多種國產(chǎn)硬件平臺,快速實現(xiàn)異構(gòu)程序的開發(fā),大幅降低應用遷移與維護成本。
而在此基礎上,科學大模型一站式開發(fā)平臺OneScience的開放共享工作,則進一步將算力、數(shù)據(jù)、模型、工具鏈整合為一體,把過去動輒數(shù)月的科研模型復現(xiàn)過程,壓縮至小時級別。以昌平實驗室為例,其依托該平臺構(gòu)建的MolSculptor分子建模體系,實現(xiàn)了全流程高效開發(fā),訓練效率提升了5倍;而中科院大氣所則構(gòu)建了下一代多模式超級集合預報系統(tǒng),在Z500大尺度技巧評估中,其性能遠超國外,達到了國際領先水平。這些真實的落地數(shù)據(jù)證明,開放架構(gòu)為AI for Science提供了真正可復制的工程化路徑。
當然,開放架構(gòu)的視野并未止步于軟硬件,而是延伸至基礎設施與數(shù)據(jù)的全鏈路賦能。
例如在基礎設施層,曙光數(shù)創(chuàng)牽頭制定了《數(shù)據(jù)中心冷板式液冷系統(tǒng)技術規(guī)范》國家標準,引導行業(yè)向標準化、高質(zhì)量方向發(fā)展;至于數(shù)據(jù)層,中科天機發(fā)布的“高分辨率氣象數(shù)據(jù)共享計劃”,為行業(yè)大模型提供了高質(zhì)量的數(shù)據(jù)“燃料”。通過共享全球12公里與中國區(qū)域3公里分辨率的氣象全要素模式數(shù)據(jù),開放架構(gòu)正在打通AI落地的“最后一公里”,賦能新能源、低空經(jīng)濟等垂直行業(yè)。
實踐見真知,從“概念”到“工程化”的生態(tài)進階
眾所周知,任何技術路線和架構(gòu),最終都要經(jīng)受工程實踐,否則就是空中樓閣。具體到本屆光合大會,先不說2500家企業(yè)代表、專家學者及行業(yè)領袖,通過200余場高密度分享與5000余平方米實景展區(qū)本身就證明了光合組織強大的產(chǎn)業(yè)號召力,更具實質(zhì)意義的是,圍繞開放架構(gòu)形成了跨芯片、跨系統(tǒng)、跨軟件的集體行動。
其中多家CPU、GPU廠商,整機與操作系統(tǒng)企業(yè),基礎軟件與行業(yè)模型團隊,在同一技術框架下對齊接口、標準與演進路徑,釋放出國產(chǎn)AI生態(tài)正在由松散并行轉(zhuǎn)向有序協(xié)同的明確信號,并具體表現(xiàn)為商湯科技、中科曙光、大曉無限機器人、麒麟軟件、華大九天、海光信息等企業(yè)達成多項戰(zhàn)略合作,涉及科學大模型、行業(yè)應用、操作系統(tǒng)等多個賽道,由此證明了不同廠商、不同技術棧的產(chǎn)品能夠在統(tǒng)一底座上高效融合。
![]()
值得關注的是,這種變化的意義,還不在于簽約數(shù)量本身,而是協(xié)作方式的轉(zhuǎn)變。例如AI計算開放架構(gòu)聯(lián)合實驗室首批項目組協(xié)同創(chuàng)新計劃,旨在匯聚頂尖力量,針對科學大模型、多元異構(gòu)算力融合、統(tǒng)一基礎軟件棧、超大規(guī)模集群優(yōu)化等共性關鍵技術開展聯(lián)合攻關,將開放協(xié)作深入研發(fā)源頭;開啟光合組織生態(tài)筑基行動、光耀百城2.0計劃,推動產(chǎn)業(yè)鏈各環(huán)節(jié)產(chǎn)品以標準接口協(xié)同工作,詮釋了開放生態(tài)從“全鏈覆蓋”到“價值閉環(huán)”的演進。
更重要的是,上述協(xié)作不再依賴某一家企業(yè)的單點推動,而是通過體系化機制降低參與門檻,使更多生態(tài)伙伴能夠以較低成本融入其中,國產(chǎn)AI也由此開始具備類似“集團軍作戰(zhàn)”的能力。畢竟單個廠商的能力或許仍有邊界,但通過體系協(xié)同,整體效能得以被持續(xù)放大,而HAIC2025所呈現(xiàn)的正是這一拐點,即國產(chǎn)AI生態(tài)已經(jīng)跨越了“喊口號”的階段,具備了“標準化接口+多架構(gòu)協(xié)同”的工程化落地能力,是從概念驗證到規(guī)模化部署的關鍵躍遷。
寫在最后:站在“十四五”收官與“十五五”蓄勢之際,人工智能正在完成從“技術工具”向“社會基礎設施”的身份轉(zhuǎn)變,此時國產(chǎn)AI生態(tài)的選擇勢必關乎未來十年的產(chǎn)業(yè)格局。而HAIC 2025則向我們展示了一個清晰的路線,即開放架構(gòu)不是權宜之計,而是國產(chǎn)AI走向體系化的技術分水嶺。盡管這條路徑未必最短,卻是在現(xiàn)實約束條件下,通向體系化與可持續(xù)發(fā)展的必經(jīng)之路。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.