![]()
當千行萬業全面邁向智能化,AI從試點一步步擴展到生產系統,出現了一個無法回避的現實挑戰:
大模型的參數量從千億級躍升至萬億級,推理時延卻要從50ms壓縮到15ms。在“越大越快”的悖論下,傳統服務器集群的堆卡模式,已無法滿足算力的線性增長,對算力、通信和存儲的協同提出了前所未有的挑戰。
相對應的是“超節點”概念的走紅,華為、百度、中科曙光等先后發布了“超節點服務器”:在超大帶寬、超低時延、內存統一編址等技術的賦能下,打破了算力協同瓶頸,讓計算集群像一臺計算機一樣高效工作。
物理上的“硬件孤島”被打破后,還需要一個匹配的“神經中樞”。對下承接硬件、對上承載應用的操作系統,被推向舞臺中央。
比如在11月14號的操作系統大會2025上,openEuler協同數十家產業伙伴向外界釋放了一個積極信號:共筑面向智能時代的超節點操作系統,讓AI能力深度融入系統底層,加速AI的創新落地。
01 面向超節點的操作系統,需要有哪些能力?
在算力基礎設施的拼圖里,操作系統歷來是承上啟下的“中樞層”,扮演了底層硬件和上層應用溝通的橋梁。
正如中國工程院院士倪光南在操作系統大會2025的主題演講中所提到的:“超節點已成為算力基礎設施建設和部署的主流形態。智能時代的操作系統將銜接智能時代的硬件和應用,成為釋放算力潛能的核心基石。”
由此產生的一個問題是:當超節點成為下一代算力基礎設施的主流形態,操作系統需要具備哪些能力?
華為公司董事、ICT BG CEO楊超斌在致辭中列出了來自產業端的“需求清單”:操作系統需要使能超節點硬件,向上層應用提供大帶寬、低時延、內存統一編址和池化等核心能力,例如在大模型訓練和推理、搜推廣等場景中,讓計算不再等待通信,從而釋放超節點集群的算力潛能。
![]()
我們來翻譯下這段“行話”。
大模型訓練、實時推理、搜推廣等極度依賴時延的場景下,通信延遲可能占到任務耗時的60%以上,計算單元已經處理完了“手頭的活”,發現下一批數據“還堵在路上”,或者在遙遠的另一塊內存里。
通過內存統一編址、超大帶寬、超低時延等能力,超節點將過去分散在不同物理節點上的資源,“整合”到了一臺計算機里。但硬件協同只是“半程”,另一半的落在了操作系統:通信調度要“像內存訪問一樣快”,資源視圖要足夠統一,內存池化要做到可控、可見、可信……同樣是決定算力是否可用的“樞紐”。
產業端的需求已經明確,操作系統該怎么進化?
開放原子開源歐拉委員會主席熊偉提出了“供給側”的解題思路,認為面向超節點的操作系統,應該具備三個關鍵特征:
![]()
第一,全局資源抽象、內存統一編址、設備池化管理。不再像管家一樣只管自己的“一畝三分地”(單臺服務器),而是作為“集群總司令”把所有算力、內存、設備等看作一個統一的資源池。
第二,異構資源融合、大帶寬低時延通信,實現平等互聯。操作系統需要將GPU、CPU、NPU等不同算力“融合”起來,利用大帶寬、低時延的通信能力,將不同計算單元“平等互聯”、協同作戰。
第三,全局資源視圖,以及兼容性接口、原生接口等。對上層的AI框架和大模型開發者來說,操作系統提供的是一個清爽的“全局資源視圖”,包括兼容性接口和原生接口,進一步降低適配門檻。
不應該忽略的,還有一個確切的時間表:全球首個面向超節點的操作系統openEuler 24.03 LTS SP3,將于2025年12月30日在社區上線。也就是說,2026年將是“超節點”操作系統的商業化元年。
02 “超節點+大模型”時代,國產操作系統越級
不管是“超節點”架構的出現,還是面向超節點的操作系統創新,都是產業需求驅動的“果”。
就在操作系統大會2025現場,開放原子開源基金會、華為與中國電信天翼云公布了聯合發展倡議,將聯手促進技術共建、生態共筑和業務共贏,共同構建操作系統在AI和超節點等前沿技術領域的競爭力,推進天翼云和開源歐拉生態繁榮發展。
![]()
在openEuler社區,像中國電信這樣的產業參與者還有很多,某種程度上已成為一股股產業級力量的匯聚點。
可以佐證的一組數據是:目前openEuler社區已吸引2100多家頭部企業、研究機構和高校加入,擁有超過2.3萬名開源貢獻者,全球下載量突破550萬,在全球部署42個鏡像節點,為178個國家和地區提供服務。到2025年底,openEuler系操作系統的累計裝機量預計將超過1600萬套。
嗅覺敏銳的產業參與者,用行動揭示了——“超節點”改變的不單單是計算架構,潛移默化地重構了算力新秩序。
一是企業獲取智能算力的方式。
很長一段時間里,企業要想訓練大模型,面臨的是一種“手工作坊式”的困境——需要花費數月的時間去調試,試圖讓一堆昂貴的硬件協同工作。而通信墻、內存墻、復雜度墻等像一道道閘門,截斷了數據的流動。
兩個月前的HC 2025上,華為宣布將開放靈衢2.0技術規范、開放超節點參考架構、開放超節點基礎硬件、開源操作系統靈衢組件等等,允許產業界基于技術規范自研相關產品或部件,自主設計基于靈衢的各種產品。
面向超節點的操作系統openEuler 24.03 LTS SP3,則在操作系統層面實現了內存統一編址、資源池化、異構協同等能力,原本只有頂級科技公司才能掌握的復雜系統調優能力,變成了一種“普惠技術”。
企業不需要關心底層插的是A廠的卡還是B廠的卡,不需要擔心跨節點的通信延遲,操作系統自動完成了資源的全局抽象和調度。大模型訓練與推理的效率提升,智能化的普及周期將被大幅縮短。
二是“國產操作系統”的越級式崛起。
提到國產操作系統,不少人腦海里冒出來的可能是安全、“備胎”等詞匯,為了自主可控,往往需要犧牲一部分性能或易用性。
但在操作系統大會2025上, Intel、Arm、 AMD三大芯片企業均成為openEuler社區的捐贈人,數十家操作系統廠商成為開源歐拉社區的首批全球化先鋒伙伴,openEuler的全球化進程如火如荼。
![]()
原因并不難解釋:超節點架構天然需要CPU/GPU/NPU的多架構協同,全球芯片企業和產業客戶在openEuler上找到了統一的接口層。背后折射出了一個關鍵的產業信號,即以openEuler為代表的國產操作系統生態,已經走過追求“替代”的階段,進入“基礎設施創新”的新周期。
在超節點、大模型等前沿領域,openEuler和伙伴們正在無人區探索,去解決產業需要的難題,不僅僅是為了“安全兜底”,正在對高性能計算、資源管理方式、數智底座等進行系統性重構。
就像我們所看到的:在數千家企業、數萬開發者的共同推動下,openEuler已經成為“算力新范式的制定者”。
03 寫在最后
把視角拉得更長遠一些,openEuler完成了一次又一次身份躍遷。
2019年末剛開源時,在外界眼中還是CentOS的一個替代選項;
四年前演進到社區自治,openEuler躋身中國操作系統市場的主流玩家;
到了2024年底,在中國新增服務器操作系統領域,openEuler的市場份額已達50%。
現在,openEuler正向全世界示范——在物理邊界被打破、智能無處不在的新世界里,操作系統應該長什么樣。甚至可以篤定:未來五年,面向超節點的操作系統將成為智能算力競爭的分水嶺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.