![]()
![]()
中國AI算力產業,正迎來發展的關鍵節點。
隨著AI大模型及應用的加速落地,算力基礎設施建設的重要性與日俱增,但傳統服務器堆疊的模式會帶來算力利用率低、訓練中斷等挑戰。
為了解決相關難題,在近日的華為全聯接大會上,華為宣布推出創新的超節點架構。華為董事、ICT BG CEO楊超斌表示,華為超節點產品可以滿足大型數據中心、企業級數據中心和小型工作站等全場景算力需求,惠及每個行業。
硬件之外,中國AI算力產業長期面臨生態建設滯后的挑戰。中國工程院院士、清華大學計算機系教授鄭緯民曾表示,近兩年我們國內的AI芯片取得了很大進步,但問題在生態不太好,現在建成的萬卡系統大多數都不好用。
生態是用出來的,作為AI芯片的領跑者,華為將發展生態提到了前所未有的戰略高度。同樣在華為全聯接大會2025上,據華為常務董事汪濤透露,未來5年,華為計劃每年投入150億人民幣生態發展費用、1500P開源社區算力,并投入15000人進行生態平臺開發與支持。
具體來說,針對計算產業,華為宣布軟件全面開源開放的策略。今年,華為新增開源CANN、Mind系列應用使能套件、openPangu等,同時支持業界主流的開源社區和開源項目,支持用戶深度挖掘昇騰潛力,加快自主創新。
在AI芯片領域,英偉達之所以占據著如此強大的統治地位,是因為它構筑起了完整的生態壁壘。如果用戶想遷移至其他品牌,需進行不小的成本投入。而現如今隨著昇騰生態的崛起,毫無疑問為所有企業提供了更值得信賴的“新選擇”。
![]()
![]()
英偉達CUDA封閉,華為CANN開源開放
眾所周知,在底層硬件上,昇騰已經基于開放的模組和標卡,使能伙伴打造了200多款硬件產品,滿足各場景差異化需求。
在硬件開放的基礎上,華為這次全面開源開放CANN,標志著這家科技巨頭在構建開放AI生態戰略上邁出了極為關鍵的一步。
CANN的全稱是“神經網絡異構計算架構”(Compute Architecture for Neural Networks),它的角色,是把底層昇騰芯片和上層AI訓練框架(如PyTorch、TensorFlow、MindSpore等)連接起來的橋梁,讓開發者不用關心芯片細節就能調用底層算力。
與CANN發揮類似作用的,還有英偉達的CUDA、AMD的ROCm、摩爾線程的MUSA等等。CUDA讓開發者可以更高效發揮GPU性能、降低使用成本,與GPU和NVlink一起構成了英偉達的核心護城河。
CANN作為昇騰AI基礎軟硬件平臺的核心組件,于2018年推出,目前已經迭代至8.0版本。相比CUDA閉源,此次CANN開源開放,無疑加速了CANN生態圈建設,開發者也可以降低對CUDA生態的被迫依賴。
據了解,開發者普遍希望能夠更加靈活的調用CANN的各層級能力,自主的性能調優、問題定位以及算法創新。為此,華為通過分層解耦,支持開發者從模型、算子、內核以及底層資源按需調用。
比如,昇騰通過圖模式開發,可實現整圖編譯與下發,降低調度開銷;也可直接調用ATB等領域算子,完成模型的性能優化;也支持C、C++、Python和模板庫等多種編程方式,滿足開發者的各種習慣;同時,華為開源了底層Runtime能力,開發者可以細粒度使用硬件資源。
為更好地匹配開發需求,CANN構建了完備的編程體系,提供Ascend C編程語言和CATLASS模板庫。同時,通過開放AscendNPU IR,支持Triton、TileLang、FlagTree等Python前端的開源編程框架,可以讓開發者快速驗證創新的想法。
CANN開源開放籌備了兩年多,是今年華為發展昇騰生態最核心的“一步棋”。但下定如此大的決心,將核心知識資產公開,對于以通信起家的華為并不容易。
華為輪值董事長徐直軍曾透露,CANN全面開源開放,其實是在很多客戶的促進下形成的。“沒有客戶的促進,我們的研發團隊感覺還好得很,而且感覺什么都給客戶做好了挺好的。”
據他表示,華為習慣把源代碼捂得死死的,因為是核心資產。CANN全面開源開放,需要說服大家到底從哪里掙錢。最終,大家達成一致是打算變現靠昇騰硬件,開源開放是促進硬件規模和硬件的普遍使用,大家都用了、賣得多了,開源開放的錢就掙回來了。
計算產業是生態型產業,開源才能把生態做大。面對CUDA生態的強大慣性,華為堅持發展并開源CANN,不僅能讓昇騰更好用、更易用,也是在推動整個計算產業的加速前進。
CUDA生態已經發展了十幾年,如今基于昇騰NPU和昇騰CANN技術生態所能實現的AI應用性能,已經能夠看齊甚至超越CUDA,已經展現出強大的競爭力。
![]()
一場關于生態話語權的爭奪戰
除了開源開放自己的產品技術,昇騰也在不斷加強與業界開源社區、開源項目的合作。
AI框架是人工智能的操作系統,而PyTorch是全球最知名的AI框架之一,由Meta推出,在2016年已經開源。PyTorch之外,谷歌的TensorFlow、華為的昇思MindSpore也都已經開源。
早在2023年,PyTorch基金會就正式宣布華為作為Premier會員加入,這也是中國首個、全球第十個PyTorch基金會最高級別會員,這意味著華為對PyTorch的技術貢獻頗大。
為什么自己已經有了昇思MindSpore,華為也會同樣加大對PyTorch的投入力度呢?這是因為,很多開發者之前就在PyTorch上構建業務,與成熟的開源社區共建生態,可以大幅降低客戶的使用門檻。
vLLM是最受開發者歡迎的推理引擎之一,從去年下半年開始,昇騰便開始與vLLM開展技術和生態合作。vLLM社區新版本發布即支持昇騰,為開發者提供更多選擇。昇騰團隊還協助vLLM社區開發了硬件后端的插件化特性,降低社區對后端支持的維護成本。
具體來說,在最新版本的vLLM中,開發者可以基于昇騰與vLLM的全鏈功能,一條命令實現底層應用的無感切換,同時通過插件化的解決方案獲得混合并行、動態調度等更多高階特性。
與此同時,昇騰新特性、組件和開發計劃等也都將在PyTorch、vLLM、VeRL、SGLang、Triton等開源社區上首發,讓開發者第一時間獲取到最新技術。
此外,為了讓開發者快速掌握昇騰開發技能,華為在昇騰社區提供完備的知識體系,比如大家關心的模組參考設計、aclNN算子開發指導、CATLASS開發指導等10多個場景化文檔和100多專題課程。
華為還會提供分層賦能,比如DR輔導、線下沙龍和線上直播等,讓每一位開發者都能按需獲取技術指導,激發開發者技術創新。
目前,昇騰已有80多家硬件伙伴打造了200多款產品;昇騰主導開源的60多個項目,累計有6500多名核心貢獻開發者。昇騰也在50多個開源社區和開源項目中積極貢獻,累計貢獻37萬行代碼。
開源的核心是共享,開放的本質是共贏。無論是加大對業界主流的開源社區和開源項目的支持力度,還是更積極開放地建設昇騰社區、培養創新人才,都體現了華為下定決心開放生態,而不是走英偉達的封閉路線。
這一系列舉措的背后,本質實際上是生態話語權的爭奪。選擇開源開放,意味著華為能聯合更多伙伴一起制定人工智能的行業標準,共享創新成果。
為何華為要如此堅定發展昇騰AI生態?徐直軍曾解釋到,如果我們一直投資去兼容CUDA,卻無法使用最新版本,如果哪天CUDA生態兼容不了怎么辦?現在我們的AI,從達芬奇架構到昇騰芯片、再到一切包括所有軟件生態,都不依賴西方的生態和供應鏈。所以長遠來考慮的話,要把生態構建起來。
目前在硬件層面上,華為通過超節點+集群的方式,應對芯片制造工藝受限、單片芯片性能不足的挑戰,實現了算力的強大供給。
相對來說,AI生態的建設是一個更加緩慢的過程,需要千千萬萬開發者、合作伙伴一起努力。有數據顯示,英偉達聚集的開發者達800萬,而昇騰還不到100萬。
盡管道路漫長且充滿挑戰,但正如徐直軍所說,只要大家心往一處想,都來使用,國內算力生態一定會發展起來。
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.