每經記者:涂穎浩 陳 旭
當對話式人工智能工具——ChatGPT點燃的全球AI(人工智能)訓練競賽逐漸開始白熱化,一個更深層次的產業變革悄然發生。2025年,被業界普遍視為“AI應用大爆發的元年”,智能體(Agent)正從概念走向現實。而在應用爆發的背后,是百倍增長的推理算力需求與高昂成本之間的尖銳矛盾。在這場由“訓練”轉向“推理”的算力范式革命中,中國AI芯片產業能否抓住歷史性機遇?
![]()
視覺中國圖
在日前舉辦的雪球嘉年華會議期間,云天勵飛董事長兼CEO(首席執行官)陳寧在接受《每日經濟新聞》記者專訪時表示,人工智能就像當年的第一臺蒸汽機、第一個燈泡、第一臺計算機,可以說,人工智能是未來五年科技突破的關鍵。
陳寧認為,中國在算法上已能夠將跟世界先進水平之間的差距縮短至數月,甚至在應用、數據、能源、系統集成方面更有優勢。
在陳寧看來,推理芯片賽道是中國實現“超車”的關鍵。這場關于重新定義算力的競賽才剛剛吹響號角,中國第一次與全球站在相近的起跑線。“我們有機會,也必須抓住這個機會。”
推理芯片展現巨大潛力
在陳寧看來,人工智能產業的發展可以清晰地劃分為三個階段。
第一階段是2012年至2020年的“智能感知”時代,以小模型驅動特定場景的解決方案為主,市場的特點就是碎片化,難以規模化復制。
第二階段是2020年至2025年的AIGC(人工智能生成內容)時代,大模型展現出驚人的內容生成能力,除了英偉達這個“賣鏟人”,整個行業都在尋找盈利閉環。
“2025年,我們進入了第三個階段——Agentic AI(代理式人工智能)時代。”陳寧強調,無論是豆包手機、AI眼鏡,還是人形機器人,其本質都是將大模型、操作系統與硬件載體深度融合的智能體。它們能獨立完成復雜任務,替代部分工作崗位,這才是AI引發產業革命的真正形態。這個時代的核心特征是應用爆發,而應用背后所需的算力,正從以訓練為主轉向以推理為主。
“這是根本性轉折。”陳寧表示,訓練追求極致性能和迭代速度,而推理要大規模商業化,必須講求市場經濟,追求極高的性價比。
陳寧以19世紀初英國化學家戴維發明了世界上第一個實驗性電燈為例,指出直到愛迪生通過商業化改良、降低成本并建設了電網,才真正將電力革命推向千家萬戶。
陳寧笑稱,黃仁勛可能成為AI領域的戴維,因為前者定義了訓練時代,而推理時代的“愛迪生們”正在涌現,這也從另一個角度決定了誰才能真正主導一場產業革命。
正是這一轉變,打破了英偉達憑借CUDA(英偉達給自家GPU量身打造的專屬工具)生態和GPGPU(通用圖形處理器)在訓練時代建立的壟斷格局。
陳寧表示,此前,黃仁勛長期堅持“通用計算”理念,認為算法迭代極快,專用推理芯片容易過時,主張通過GPU(圖形處理器)的通用性來覆蓋推理需求。但市場規律證明了推理芯片賽道的不可替代性。谷歌在最新的TPU(張量處理器)戰略中明確了“訓推分離”的趨勢,加碼推理專用的算力權重,博通為Meta、OpenAI定制推理芯片,都證明了獨立的推理芯片賽道崛起,并展現出巨大潛力。
對于中國而言,這意味著一場難得的“超車”機遇。陳寧坦言,在訓練賽道上,由于先進制程受限、CUDA生態壁壘高筑,中國企業追趕英偉達差距較大,風險也越來越大。但在推理芯片賽道上,全球都剛剛起步,游戲規則不同。
“推理更接近應用場景,要為用戶提供更高性價比的產品,這正是中國產業所擅長的。”陳寧判斷,推理芯片的崛起,將是中國科技復興的巨大機遇。
推理需求現爆炸性場景
面對AI推理時代的全新需求與挑戰,陳寧認為,一味簡單模仿英偉達的GPGPU架構并非出路。推理任務的計算范式發生了根本變化,尤其是Prefill(預填充)和Decode(解碼)兩個階段對算力和帶寬的需求不同,傳統架構面臨瓶頸。
為此,云天勵飛(云天勵飛U,SH688343,股價77.10元,市值276.66億元)提出了新的芯片架構——GPNPU,旨在融合三大核心能力:首先是頂層結合GPGPU的SIMT編程范式,具有通用靈活的調度架構,這樣可以更便利地兼容CUDA生態;其次是結合指令集微架構設計能力,去優化GPGPU里面的矩陣類計算的硬件;與此同時,基于國產工藝和全國產產業鏈融合一系列先進封裝技術,打破內存瓶頸,降低成本。
GPNPU的目標,是在計算算力、存儲帶寬、存儲容量三者間實現更優配比,滿足面向未來推理芯片時代多元化異構推理算力的需求。無論是單位硅芯片面積的計算性能上,還是模型迭代的遷移成本上,包括算子優化提升的硬件利用率,尤其是通過高能效、低功耗等一系列的芯片技術降低運營過程中能源成本,能真正實現全方位降低用戶的TCO(總體擁有成本)。
展望未來,陳寧描繪了推理需求的爆炸性場景。他以豆包大模型為例,其日均Token(文本處理的最小單元)處理量已達50萬億且增速驚人。陳寧給出“粗算”的假設,即便以50萬億為基準不再增長,面向大規模在線推理的資本開支與運營開支也會非常可觀。
陳寧進一步判斷,若Token規模短期繼續上行,明年上半年可能觸及100萬億,而在單位能效不發生顯著改善的情況下,電力與散熱等基礎設施壓力可能出現“千倍級”的數量級躍遷。
為支撐AI規模化、產業化,陳寧提出在較短周期內把“百萬Token”的推理綜合成本降低到“一分錢”級別。這需要通過架構革命(如存算一體)和工藝創新才能實現,這也正是中國企業的機會所在。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.