《科創板日報》2月1日訊(記者 黃心怡)隨著大模型行業逐漸從大規模訓練階段走向推理落地階段,業內分析普遍認為,2026年全球AI推理的需求將超過AI訓練場景。
不久前,英偉達以200億美元收購一家AI推理芯片初創企業Groq的技術授權,并把Groq核心團隊招入囊中,來補全推理算力拼圖。
在近日的采訪中,曦望董事長徐冰向《科創板日報》記者判斷稱,至2030年,預計AI推理在整個AI計算市場將占到80%的份額,而聚焦于極致推理的AI芯片,未來會有更強的爆發性,并會對現有的算力系統造成沖擊。
另有AI芯片產業鏈人士也對《科創板日報》記者表示,未來,推理請求量與并發數將大幅增加,推理算力需求呈指數級攀升。
▍推理算力需求呈指數級攀升
“現階段正處于以智能體為代表的人工智能新應用爆發初期,未來推理請求量與并發數大幅增加,推理算力需求呈指數級攀升。”一名AI產業鏈人士向《科創板日報》記者表示,“隨著推理范式變化,AI智能體將加速落地,其整體算力消耗可達同參數規模大語言模型的10倍以上,對智能算力的需求呈數量級躍遷。
目前,全球AI算力龍頭正處于由訓練轉向推理的階段。英偉達此前完成了對AI推理芯片公司Groq的收購,也是其迄今規模最大的一筆收購。
Groq是一家專注極致推理的AI芯片企業,其創始人Jonathan Ross帶領的谷歌TPU原班人馬,用七年時間打造出LPU(語言處理單元)架構,曾宣稱其推理性能是英偉達H100 GPU 10倍,而成本僅為其十分之一。
此外,美國的Etched.ai、Groq等也是主打極致推理芯片路線的企業。這類公司的核心邏輯是,大模型架構已經收斂,因此放棄通用訓練GPU,更專注于打造最快的AI推理芯片。
在國內,也有企業瞄準這一方向。
近日,從商湯科技拆分獨立的AI芯片企業——曦望Sunrise,推出了聚焦于大模型推理的GPGPU 芯片啟望 S3。在DeepSeek V3/R1滿血版等主流大模型推理場景中,S3 的單位 Token 推理成本較上一代降低約 90%。曦望的目標是把百萬 Token的推理成本降低至1分錢。為此,曦望聯合商湯科技、第四范式等,發起“百萬 Token 一分錢”推理成本計劃。
![]()
曦望聯席CEO王勇認為,AI訓練芯片賽道逐漸收斂,已經變成頭部玩家的游戲。
“如今,市場格局越來越清晰,能做預訓練大模型的公司數量是有限的,因為門檻越來越高。而推理賽道還沒有收斂。既有AI智能體,大語言模型,也有具身智能模型、世界模型等等,都會需要芯片來做推理任務。如果能把算力做到極致性價比,那么在下一代的芯片就占據了極有利的生態。”
▍AI應用或借力春節加速落地
從市場格局來看,相比英偉達在訓練端一家獨大。在推理端,由于對成本和能效的極致追求,技術路線呈現出百花齊放的態勢,為國產AI芯片廠商帶來機遇。
對于后續國產AI芯片的市場格局,曦望聯席CEO王湛認為,英偉達的市值達到4萬億美金,而中國或許將出現多家市值數千億,甚至萬億人民幣的GPU公司。
“相較于美國,中國AI產業呈現出較為明顯的區域化發展特征,國內不同GPU企業在各自優勢地域市場占據主導.而互聯網巨頭們除自研芯片外,也在采購國產芯片,并已形成各自的深度合作伙伴關系。盡管中國GPU企業的總市值可能難以達到英偉達4萬億美元的高度,但即便以4萬億人民幣計算,市場依然蘊藏著巨大的增長空間。”
當前,AI產業鏈企業的高估值,也引發了市場擔憂。曾領導瑞士銀行商品策略團隊的英國分析師朱利安·加蘭認為,美國的資本配置不當,AI泡沫的狂熱是互聯網泡沫的17倍,2008年房地產泡沫的4倍。
曾經歷過互聯網泡沫破滅的王湛認為,“當時的互聯網泡沫之所以形成,很大程度上是因為盡管市場概念火熱,實際用戶規模卻非常有限。如今,AI應用的月活用戶規模已經破億,其增長速度和行業滲透率,遠超當年的互聯網產品,也比整個互聯網浪潮來得更快、更迅猛。”
目前,百度、騰訊先后宣布旗下AI應用將在今年春節期間發放數億元紅包。阿里旗下的通義千問也計劃加入紅包促銷行列。花旗在研報中表示,回顧以往,春節活動能有效幫助互聯網大廠為其消費級應用吸引大量關注。預計在今年的一系列新春推廣活動后,中國AI應用的普及進程有望進一步加速。
![]()
王湛也看好春節對于AI應用的助推作用。“除了騰訊、百度等的紅包促銷,不少機器人也要上春晚。今年春節過完,中國的AI滲透率、使用率會進一步的提升,這也代表整個AI產業價值的提升。”
在現階段的AI產業架構中,最底層的芯片拿到了絕大部分價值。徐冰表示,AI芯片占據了整個AI產業價值70%甚至90%,這是現狀。展望未來, AI芯片或許仍會占據整體AGI(通用人工智能)價值的大頭。
“試想一下,一旦AGI時代真的到來,機器人的數量會超過人類。這些機器人需要進行7×24小時的推理,所有的這些應用,包括物理AI、多模態等,會讓推理的需求變得沒有天花板。隨著AGI時代的來臨,我們需要構建一個推理的算力網絡,讓普惠的推理算力,能夠為每一臺機器人,每一臺終端設備,每一個消費者,每一個企業所用。”
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.