如果說過去三年是大模型狂飆的“造夢期”,現在的AI產業,正在經歷一場亢奮與痛苦并存的“落地大考”。
當企業滿懷期待地將AI融入生產線時,卻發現動輒千萬級的投資依然填不滿萬億參數的“算力饑渴”、底層硬件與開發框架間仿佛隔著難以逾越的壁壘、實驗室里跑通的流程在產線上頻頻宕機……
越來越多企業意識到,以往暴力堆疊服務器、隨便套用開源框架等“頭痛醫頭、腳痛醫腳”式的補救方案,在行業核心業務應用面前徹底失效了。既然縫縫補補的捷徑走不通,有效的破局點又在哪呢?
日前結束的第四屆北京人工智能產業創新發展大會,以“融合、效能、安全——讓AI’+’出新活力”的主題,精準切中了當下的行業痛點。
![]()
其中在“融合·共創:產業巨擘談AI+”議題環節,華為公司副總裁、中國政企業務總裁吳輝在圓桌對話中系統闡述了華為對中國AI算力未來的核心判斷,以及從“單點突破”轉向“系統效能”的路徑。
透過吳輝在對話中的觀點,不難提煉出AI融入千行百業的路線圖。
01 融合創新,用“系統工程”打破天花板
讓我們先回到原點,正視一個跳不過的行業癥結。
為了喂飽動輒千億參數的大模型,工程師們不得不絞盡腦汁提升算力密度,把成百上千乃至上萬臺服務器塞進機房。當通信頻次隨模型層數指數級增長,微秒級的延遲在萬億次迭代中不斷累積,讓計算單元長時間處于等待狀態,導致算力利用率低下且運維成本猛增。
盲目堆砌算力,已然無法根治“算力饑渴”。
吳輝在演講中一針見血地指出:“一個芯片固然很重要,但人工智能是一個產業,也是一種新質生產力,算力更是一個系統。”華為的解題思路是“以系統性創新突破單芯片局限,用數學補物理、非摩爾補摩爾,打造創新的超節點架構,實現規模算力的全球領先。”
直接的例子就是由8192張昇騰卡打造的Atlas 950 SuperPoD超節點,憑借內存統一編址等優勢,能夠像一臺計算機一樣高效工作,算力是業界主流水平的6.7倍,訓練總吞吐提升17倍、推理總吞吐提升26.5倍,在未來多年都將是全球最強算力的超節點。
![]()
華為是怎么打破天花板的呢?答案正是吳輝提到的“系統性創新”。
在大規模AI訓練與推理中,存在海量GB級的數據通信,想要提高算力利用率,通信帶寬要足夠寬、通信時延要足夠低、內存訪問要足夠快,任何一處的瓶頸,都會導致計算與通信相互等待。
華為的超節點架構,創造性地解決了兩大挑戰。
一是將傳統以CPU為中心的架構,變成了全對等互聯,CPU、NPU/GPU等設備在統一的協議下互聯互通,整合為統一的全局地址空間,不管數據存在哪塊內存里,都只有一個“全局地址”,可以直接訪問。
二是通信協議的創新,傳輸的不再是笨重的“數據包”,而是包含內存地址、操作碼(讀/寫)和緩存狀態位的“Flit”,極大地提升了通信效率,并通過緩存一致性協議確保所有計算單元看到的信息是相同的。
相較于傳統的計算集群,華為的超節點架構實現了三個硬性指標,即大帶寬、低時延、內存統一編址,讓集群像一臺計算機一樣學習、思考和工作,從根本上解決了算力利用率低、運維復雜度高等問題。
從“單點突圍”到“全局統籌”的躍變,揭示了AI時代的核心命題:在摩爾定律失效的當下,算力供給不再是比拼單卡性能的“加法游戲”,只有掌握系統級創新的“乘法法則”,用系統工程打破物理瓶頸,才是滿足整個行業的算力剛需、邁向通用人工智能的必由之路。
02 生態共創,打造繁榮開放的“黑土地”
把算力比作AI時代的骨架,生態就是關乎長期生命力的血肉。
回顧計算產業的發展史,從不缺少性能耀眼的產品,最終決定牌局走向的,往往是生態。當前中國算力產業面臨的真實困境在于:在制造和架構創新上已經能和國外掰手腕,軟件生態一直擺脫不了外部依賴。
面對這道殘酷的“生死題”,一些玩家試圖“走捷徑”。比如在CUDA的API和芯片的底層驅動間加一個“翻譯器”,可CUDA并非開源,第三方產品很難通過指令翻譯的方式實現完美兼容,還面臨英偉達扎緊藩籬(禁止通過轉譯層運行軟件等)的風險。
吳輝一語道出了AI產業的關鍵:“構建一個芯片和系統不是最難的,最重要的是構建一個大家共同使用和運用技術的開放生態。華為在計算領域始終堅定踐行‘硬件開放、軟件開源’戰略。”
對應的行動有很多。
比如計算架構CANN的全面開源開放。
有別于CUDA的封閉,CANN將算子庫、通信庫、圖引擎、編程語言、運行時等核心組件進行全量、分層解耦的開源。企業和高校的科研團隊可以深入到圖優化、算子融合、內存調度等底層機制進行二次創新,甚至不用局限于現成的工具和框架,可以根據自身需求進行深度定制和優化,實現更高的性能和效率。
![]()
再比如靈衢2.0協議的全面開放。
作為超節點架構的“靈魂”,華為在HC 2025上開放了靈衢2.0技術規范,包括開放超節點參考架構、開放超節點基礎硬件、開源操作系統靈衢組件等等。底層技術協議和整套超節點技術的開放,意味著產業界可以基于技術規范自研相關產品或部件,自主設計基于靈衢的各種產品,實現真正意義上的AI算力自由。
原因并不難解釋。
站在企業和開發者的立場上,焦慮的不只是“好用不好用”,還涉及到是否自主創新:倘若底層機制不透明,只能依賴官方文檔,一旦業務出現性能瓶頸,往往無從下手;假如創新的節奏被單個平臺主導,像能源、制造、交通等行業,可能因為某個算子制約整個行業的效率……
時間印證了華為的選擇。
開源5年的OpenHarmony,匯聚了9200多名社區貢獻者,貢獻了1.3億行代碼;全面開源開放的CANN,不到半年就有1.3萬開發者參與進來,創新開發了420多個高性能算子。
數據是生態最好的注腳,當千千萬萬的開發者不再是單純的“使用者”,化身為生態的“架構師”與“貢獻者”,自主創新的“黑土地”將越來越肥沃。
03 提升效能,AI落地的唯一檢驗標準
技術創新的原點,終歸要回到產業的本質——生產力。
當前不少企業對AI的理解仍停留在表層,認為僅僅是一次IT系統的例行升級,或者是采購一套更聰明的軟件工具——買幾臺服務器、接幾個大模型的API,就能順理成章地貼上“數智化”標簽。
也就是說,在AI融入千行百業的過程中,不僅要提供充沛的算力、打造繁榮的生態,還需要成熟的經驗和轉型方法論。
在華為公司副總裁、中國政企業務總裁吳輝看來,“企業走向AI與業務的融合本身是一場變革,包括重構生產方式、生產關系以及商業模式等。因此,AI一定要跟企業的流程、組織、IT、數據以及業務場景深度結合,才能打造新質生產力,提升企業的效能。”
過去五年時間里,華為和伙伴協助3.3萬多家企業完成了數智化轉型,交出了一份份實打實的成績單。
在港口行業,天津港與華為共同推進港口行業大模型PortGPT的研發和落地應用,實現了近百輛無人集卡的自動駕駛、岸橋遠程操控和全流程的AI排產,港口運行效率提升了15%,正作為港口數智化的新標桿向海外復制。
在制造行業,華為在初期頂層設計時就參與了賽力斯超級工廠的建設,從網絡基礎、數字平臺、應用場景到運營管理,打造了全鏈路智能化解決方案,助力賽力斯超級工廠實現AI與數據的雙輪驅動,助其最快30秒就能下線一輛車。
![]()
隔行不隔理,華為深度參與3.3萬多家企業數智化轉型的經驗,沉淀成了一套可復制的方法論。
譬如在怎么從0到1落地AI的問題上,華為基于實踐經驗總結了“三層五階八步”方法論,把模糊的AI落地變成了清晰可執行的步驟,即從業務場景出發,沿著業務流程、組織,數據和應用指導業務如何一步步落地AI,讓企業不用再摸黑試錯,少走一些彎路。
讓我們印象深刻的是,吳輝在對話中沒有過多強調華為的經驗和方法論,而是多次提到“效能”一詞。
既是華為對自身軟硬件能力和成熟方法論的篤定,也為陷入落地焦慮的企業開出了一劑清醒的藥方:AI必須深入到業務場景,完成“技術演示”到“生產要素”的跨越,對企業的利潤表、效率曲線產生可量化的影響,蛻變為看得見的“新質生產力”,而非為了AI而AI。
特別是在AI進入“落地大考”的2026年,勢必會醞釀出各種各樣的新概念、新產品、新方案,千萬別被“名詞式創新”帶偏,唯有提升效能,才是檢驗AI落地價值的標準。
04 寫在最后
正如吳輝在對話結尾所強調的:“AI時代,我們要有緊迫感,人工智能可能是人類最后一次技術革命,我們要夜以繼日,全力以赴追趕世界領先;同時我們要能深入行業,深刻理解行業需求,協助企業把人工智能融到生產和業務中去,助力千行百業在智能時代走向世界領先。”
這場通往智能時代的“遠征”,絕不是華為一家企業的獨角戲,而是千行百業的集體答卷。
當華為通過創新的超節點架構夯實了算力底座,用“硬件開放、軟件開源”的決心培育了生態沃土,用腳踏實地的態度跑通了AI落地的路徑,誰先把AI融入生產一線,誰就能先吃到數智化轉型的紅利。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.