今天,在華為中國合作伙伴大會2026現場,我采訪了華為昇騰計算基礎軟件業務總經理李守平。問到CANN已通過分層解耦實現全量開源后,在超節點集群上部署萬億參數大模型時,軟件層面怎么做到更高算力利用率和更低時延。
![]()
李守平的回答很務實:CANN面對一個完整系統時,包含計算、單元間連接等幾大塊(實際涉及四個核心組件)。關鍵在于如何把它們有效整合,實現算力價值最大化,這本身就是系統性創新。
他特別強調,華為超節點和業界傳統集群不一樣。傳統往往只是把舊節點簡單堆起來,而華為做到了統一內存、統一編址。從協議層面就減少了數據包和開銷,底層負載輕了很多。上層則通過專家并行標準化設計,充分利用高帶寬,即使萬億參數模型要切分資源,也能把帶寬優勢用足,避免浪費。
這種系統級的重構能力令人印象深刻。但更讓我觸動的,是華為在生態戰略上的“升維”與徹底兌現。過去行業談國產替代,往往還停留在“能否跑通CUDA代碼”的被動防御階段,試圖在別人的地基上修補房子;而今天,隨著CANN的全量開源和超節點協議的主動開放,華為已不再滿足于單純的“可用”,而是選擇將底層技術的定義權交還給社區。這標志著華為的戰略重心已從“構建自主能力”轉向“共建開放標準”。事實正在證明,真正的護城河不是封閉的代碼壁壘,是由全球開發者共同編織的協作網絡。
李守平提到的“統一內存編址”和“協議層減負”,本質上是在用軟件定義的思維去重塑硬件邊界。這很像當年Linux對抗Unix的路徑。當底層足夠透明,上層的應用創新才會爆發。對于國內那些苦于算力成本高昂、定制需求無法響應的AI初創公司來說,這或許是一個信號:與其在別人的花園里修修補補,不如在自己的土壤上種樹。
當然,挑戰依然巨大。CUDA二十年的積累不是靠一次開源就能抹平的,開發者的習慣遷移、工具鏈的細膩度,都需要時間打磨。但方向比速度更重要。當國產算力開始從“賣盒子”轉向“賣能力”,從“兼容者”變成“定義者”,這場關于AI基礎設施的長期主義戰役,才算真正進入了深水區。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.