網易首頁 > 網易號 > 正文申請入駐

詞元驅動AI推理側爆發國產芯片迎替代黃金窗口

2026-04-03 22:27:07　來源: 金證研

廣東舉報

分享至

在近期舉辦的GTC 2026大會上，相關行業觀點引發了市場深思。AI產業的重心正在從“訓練模型”向“推理應用”轉移，未來每一秒鐘、每一次交互，背后都是海量Token的生成與消耗。而近期中國發展高層論壇2026年年會上，國家數據局為Token正式定名——“詞元”，并明確相關定位：“詞元”不僅是智能時代的價值錨點，更是連接技術供給與商業需求的“結算單位”。中國日均詞元調用量在2026年3月已突破140萬億，本年度三個月時間又增長40%以上。

詞元產業的應用與發展趨勢，或決定了近期半導體周期的發展態勢。當市場的焦點還停留在英偉達新一代GPU的市場表現與行業格局時，一個深刻的變化正在發生：推理側的需求，正以遠超訓練側的速度膨脹。這一變化，不僅重塑了AI算力的結構，也有望為中國半導體產業鏈及科創50相關領域，帶來了相應的發展空間。

過去兩年，AI算力的核心驅動力是“訓練”——巨頭們比拼的是誰能用最多的芯片、最快的速度，訓練出參數更大的模型。這種模式對芯片的要求近乎苛刻：最先進的制程、最高的單卡算力、CUDA生態應用較為廣泛等，英偉達在該階段占據較高市場應用份額。

但當AI進入應用爆發期，邏輯發生了根本轉變。推理，這個將模型能力轉化為實際服務的過程，開始占據算力消耗的主導地位。與訓練不同，推理場景追求的是“綜合成本最低”與“能效比最優”。在一個AI客服、視頻平臺等規模化的應用場景中，采用高成本的高端GPU開展全部推理任務，經濟性與實用性相對有限。這為國產算力提供了重要方向，推理側的芯片需求呈現出了分層的特征：在金融高頻交易、自動駕駛決策等高端場景，對芯片性能要求較高；但在占據絕對多數份額的海量推理場景——比如互聯網搜索、內容生成、企業級應用——核心訴求已轉變為“夠用、便宜、穩定”。而這恰恰是國產芯片通過架構創新（如ASIC、LPU）和成本優化具備發展潛力的領域。

更重要的是，國產芯片的“可用性”正在逐步被驗證。眾多國產算力廠商產品在FP8算力等關鍵指標上不斷優化提升，且在算力生態上正加速適配國產大模型。當推理需求開始放量，下游應用廠商為了控制成本和保障供應鏈穩定，傾向于采用性價比更優的國產方案。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.