![]()
一位很久未聯系的朋友,突然問了我們一個問題:最近總是刷到超節點的帖子,這到底是個什么技術?
一個星期前的華為HC 2025上,正式拋出了“超節點”的概念,朋友圈、行業群乃至資本市場,幾乎都在一夜之間都被“超節點”刷屏。原本只在算力行業討論的話題,迅速走進了大眾視野。
進一步翻看過去兩個月的新聞,和“超節點”概念有關聯的不只是華為,百度、浪潮、騰訊、字節跳動等都官宣了超節點服務器的布局,已然成了算力產業的新風向,演變為一種新的產業敘事。
問題來了:為什么“超節點”能一夜走紅?到底是什么樣的創新?又將怎么改變AI產業的格局?
讓我們來一一回答。
01 一場應用驅動的架構革命
回答超節點概念走紅的原因前,先來梳理下大模型的現狀:
在大模型訓練層面,正沿著“規模定律”不斷演進,參數與集群規模實現了“雙萬”跨越,即大模型參數從億級躍遷至萬億級,訓練集群從“萬卡”走向“十萬卡”,呈現出了驚人的倍數級增長趨勢。
在大模型推理層面,當前中國的日均Token消耗量已經超過30萬億,考慮到Agentic AI、Physical AI的演變趨勢,推理需求還將指數級增長,要求計算集群同時滿足低時延、高吞吐的需求。
這些變化和“超節點”有什么關系呢?
9月18日舉辦的昇騰AI人工智能產業峰會上,中國信息通信研究院、中國電子技術標準化研究院、全球計算聯盟GCC、國家信息中心攜手產業界正式發布了《超節點發展報告》,給出了專業的解釋。
傳統的服務器集群主要采用“橫向擴展”的架構,能夠很好地適配松耦合的計算負載,但不同機柜間由于線性度的影響會有算力性能損失,導致1+1<2。確切地說,面臨著三重系統性挑戰:
首先是通信墻,千億級模型一次梯度同步就有TB級的數據,傳統以太網難以承受;其次是功耗與散熱墻,為破通信墻而提升密度,促使液冷、48V供電成標配;以及復雜度墻,萬卡集群進一步抬升了運維復雜度。
時間回到2025年4月,“超節點”成了技術圈的熱門話題,原因是華為實現了業界最大規模的384卡高速總線互聯。
和傳統集群的最大區別,昇騰采用了“以網聯算”的技術路徑,基于高速互聯總線突破了算力協同瓶頸,讓計算集群像一臺計算機一樣高效工作,并可實現“一卡一專家”并行推理。
昇騰驗證了超節點技術的可行性,這場架構革命激起的漣漪,迅速在產業中擴散,算力廠商紛紛擁抱“超節點”。
02 “超節點”的三個技術特征
怎么判斷什么是真正的“超節點“呢?最直觀的指標無疑是性能。《超節點發展報告》歸納了三個技術特征:
![]()
一是超大帶寬。
傳統計算集的卡間互聯依賴PCIe或以太網,目前跨服務器互聯帶寬多為50Gb/s上下。在千億級模型訓練的并行計算場景中,頻繁的GB級數據傳輸造成的通信阻塞,會導致計算等待通信,浪費算力資源。
“超節點”的高速互聯協議打破了傳統的架構限制,可實現更大范圍、更高流量的數據傳輸。以昇騰384超節點為例,通信帶寬提升了15倍,即使是千卡集群也能像“單機多卡”一樣高效協同,告別“等數傳”的現象。
二是超低時延。
跨服務器互聯帶寬的時延普遍高達數十微秒,同樣是制約算力利用率的誘因。特別是MoE模型,要求在不同專家間頻繁調度數據,如果互聯帶寬和時延跟不上,模型規模越大就越難跑起來。
還是以昇騰384超節點為例,單跳通信時延從2微秒做到了200納秒,降低了整整10倍。比性能指標更有說服力的,是實戰中的表現,比如在DeepSeek、Qwen等多模態、MoE模型的并行計算中,昇騰384超節點的通信效率實現了3倍以上的提升。
三是內存統一編址。
傳統集群的每個節點有獨立的內存池,而“超節點”實現了跨設備的統一尋址與靈活訪問,大模型訓練中頻繁的參數同步操作,不再需要“序列化—網絡傳輸—反序列化”流程,直接通過內存語義通信完成,大幅提升了小包傳輸與離散隨機訪存的效率。
在訪問模式上,超節點還應支持異步與同步兩種機制,滿足客戶在不同場景下的需求:批量數據的快速傳輸與處理,采用能夠高效進行大塊數據搬移的異步模式;對小塊數據的精細化處理,則采用同步模式。
不難發現,“超節點”最大的技術挑戰在于互聯技術,如何做到長距離且高可靠、如何做到大帶寬且低時延,都不是一朝一夕可以解決的。相對樂觀的是,走開源開放模式的昇騰,在互聯技術上沒有“藏私”。
在HC 2025上,華為正式發布了靈衢——一個面向超節點的互聯協議,并宣布將開放靈衢2.0技術規范。
![]()
“靈衢”的命名,可以追溯到“九省通衢”,寄托了大規模算力聯通的愿景,也是華為從2019年就開始研究的技術。無論是前面提到的昇騰384超節點,還是支持8192張卡的Atlas 950超節點,都是基于“靈衢”開創的。在業內人士看來,靈衢的革命意義不亞于AI基礎設施的再造。
不只是互聯協議的開放,華為還將全面開放超節點技術,包括開放超節點參考架構、開放超節點基礎硬件、開源操作系統靈衢組件等,允許產業界基于技術規范自研相關產品或部件,自主設計基于靈衢的各種產品。
同時也意味著,堅持硬件開放、軟件開源的華為,希望和伙伴打造面向行業的超節點場景化解決方案,讓超大帶寬、超低時延、內存統一編址成為一種算力新范式。
03 來自產業側的認可與回應
最能回答“超節點”價值的,無疑是需求最強烈、嗅覺最敏銳、行動最迅捷的大中型企業,他們處在AI落地的第一線,既是大模型應用的生力軍和探路者,也是檢驗創新成敗和成效的風向標。
比如昇騰AI人工智能產業峰會和《超節點發展報告》提及的幾個行業案例。
第一個是制造業。
家電作為典型的高頻使用場景,早在2015年前后就開始探索AI語音交互、智能感知等功能的應用。到了大模型時代,涵蓋研發、制造、渠道、服務全鏈條的家電廠商,為AI的全面落地提供了天然土壤。
其中昇騰超節點為某家電巨頭開展模型訓練提供了堅實支撐,雙方聯合優化算力利用率,加速了AIGC戰略落地。目前AI已經在158個核心場景中落地應用,包括企業經營提效、業務模式創新和商業模式升級。
第二個是金融行業。
如果說家電是“場景驅動+終端規模”的AI應用先鋒,金融就是“數據驅動+風險導向”的AI應用深水區,對提升金融安全性、提升效率、提升決策力,有著毋庸置疑的剛需,也是最早試水AI的行業。
某銀行攜手昇騰構建了高性能千卡訓推算力集群,并部署了大規模專家并行推理方案,相比傳統方案實現了3倍吞吐性能提升,加速了大模型的規模化應用,深度賦能智能客服、審貸助手、后訓練數據合成等業務場景。
![]()
以及更普適的落地案例。
對于業務多元的行業大型集團來說,智能化轉型的最大痛點不是怎么轉,而是業務場景需求激增、低資源算力重復建設等問題,需要構建集中化、平臺化的基礎設施,避免因算力困局拖了業務的“后腿”。
某集團型企業的做法是引入昇騰384超節點,通過超節點的大規模、高帶寬、低時延、算力切分、虛擬化、訓推一體等能力,面向企業內部提供統一的大模型API服務,滿足不同業務場景對訓、推算力的需求,目前已經服務智慧運營、智慧管理、智慧運維等核心場景。
按照昇騰官方公布的數據:昇騰384超節點自發布以來,累計部署量已經超過300套,服務了20多家客戶。
比數字更有價值的,或許是這些案例所揭示的一個事實:一旦產業一線的“頭雁們”打破了算力瓶頸,爆發往往是指數級的。在海量場景和需求的牽引下,中大型企業AI落地的深度和廣度,已然超出了許多人的想象。在“群起效應”的作用下,這些“頭雁”將帶動成千上萬家企業邁向智能化。
04 寫在最后
當我們談論超節點時,不僅是在討論一組組冷冰冰的性能指標,同時在展望一條通向未來的道路。
靈衢互聯協議的開放、軟硬件生態的共建,如同曾經的電力和互聯網一樣,將算力從“頭部企業專屬”帶向了“全產業可用”。屬于“超節點”的故事才剛剛開始,點亮的不只是算力的躍遷,還有智能化時代的序章。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.