在近期舉辦的GTC 2026大會上,相關行業觀點引發了市場深思。AI產業的重心正在從“訓練模型”向“推理應用”轉移,未來每一秒鐘、每一次交互,背后都是海量Token的生成與消耗。而近期中國發展高層論壇2026年年會上,國家數據局為Token正式定名——“詞元”,并明確相關定位:“詞元”不僅是智能時代的價值錨點,更是連接技術供給與商業需求的“結算單位”。中國日均詞元調用量在2026年3月已突破140萬億,本年度三個月時間又增長40%以上。
詞元產業的應用與發展趨勢,或決定了近期半導體周期的發展態勢。當市場的焦點還停留在英偉達新一代GPU的市場表現與行業格局時,一個深刻的變化正在發生:推理側的需求,正以遠超訓練側的速度膨脹。這一變化,不僅重塑了AI算力的結構,也有望為中國半導體產業鏈及科創50相關領域,帶來了相應的發展空間。
過去兩年,AI算力的核心驅動力是“訓練”——巨頭們比拼的是誰能用最多的芯片、最快的速度,訓練出參數更大的模型。這種模式對芯片的要求近乎苛刻:最先進的制程、最高的單卡算力、CUDA生態應用較為廣泛等,英偉達在該階段占據較高市場應用份額。
但當AI進入應用爆發期,邏輯發生了根本轉變。推理,這個將模型能力轉化為實際服務的過程,開始占據算力消耗的主導地位。與訓練不同,推理場景追求的是“綜合成本最低”與“能效比最優”。在一個AI客服、視頻平臺等規模化的應用場景中,采用高成本的高端GPU開展全部推理任務,經濟性與實用性相對有限。這為國產算力提供了重要方向,推理側的芯片需求呈現出了分層的特征:在金融高頻交易、自動駕駛決策等高端場景,對芯片性能要求較高;但在占據絕對多數份額的海量推理場景——比如互聯網搜索、內容生成、企業級應用——核心訴求已轉變為“夠用、便宜、穩定”。而這恰恰是國產芯片通過架構創新(如ASIC、LPU)和成本優化具備發展潛力的領域。
更重要的是,國產芯片的“可用性”正在逐步被驗證。眾多國產算力廠商產品在FP8算力等關鍵指標上不斷優化提升,且在算力生態上正加速適配國產大模型。當推理需求開始放量,下游應用廠商為了控制成本和保障供應鏈穩定,傾向于采用性價比更優的國產方案。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.