《科創(chuàng)板日?qǐng)?bào)》2月15日訊 2026年馬年春節(jié),互聯(lián)網(wǎng)大廠的“紅包戰(zhàn)”如期上演。百度撒下5億,騰訊元寶豪擲10億,阿里更是祭出30億免單的“鈔能力”。不過(guò)“撒錢(qián)”只是“開(kāi)胃菜”,緊隨而來(lái)的則是參與者更多、頻率更密集的國(guó)產(chǎn)AI新品“春節(jié)檔”:
2月14日,字節(jié)跳動(dòng)發(fā)布豆包大模型2.0系列,這是繼Seedance 2.0視頻模型和Seedream 5.0 Lite圖像模型之后打出的春節(jié)“第三彈”。智譜已在2月11日發(fā)布“系統(tǒng)架構(gòu)師”級(jí)別的底座模型GLM-5;MiniMax緊隨其后,于2月12日上線并開(kāi)源文本模型M2.5;連一向低調(diào)的DeepSeek,也在幾天前進(jìn)行版本更新。在此之前,階躍星辰發(fā)布Step 3.5 Flash,阿里發(fā)布Qwen3-Coder-Next,且有望在春節(jié)期間發(fā)布Qwen 3.5。
每一次發(fā)布都是一次卡位,每一次迭代都是一次重塑行業(yè)格局的嘗試。這一波覆蓋文本、圖像、視頻多模態(tài)的AI“最強(qiáng)春節(jié)檔”已經(jīng)拉開(kāi)大幕。
▌多模態(tài)大模型接連面世 Token需求出現(xiàn)“通脹”
一年多前,字節(jié)內(nèi)部曾判斷,AI對(duì)話(huà)類(lèi)產(chǎn)品可能只是AI產(chǎn)品的“中間態(tài)”,長(zhǎng)期更理想的產(chǎn)品形式,大概率需要更視覺(jué)化的用戶(hù)體驗(yàn)、更低的用戶(hù)使用門(mén)檻。因此彼時(shí)的字節(jié)選擇提升即夢(mèng)的產(chǎn)品優(yōu)先級(jí),嘗試打造“AI時(shí)代的抖音”。
或許也正是因此,一年多以后,在字節(jié)的這次春節(jié)檔“三連彈”中,最先出場(chǎng)的不是最為大眾所熟悉的豆包,而是視頻模型Seedance 2.0。
而從曾經(jīng)和文本大模型的“聊幾秒”到如今視頻大模型的“看幾秒”,算力消耗規(guī)模正在快速膨脹——從單條視頻來(lái)看,Seedance 2.0 生成一條10秒、1080p的視頻,大致要消耗35萬(wàn)token。
Seedance 2.0的算力消耗增長(zhǎng)并非孤例。春節(jié)檔的這輪密集發(fā)布,對(duì)各家廠商而言不僅是品牌宣傳的窗口期,也是一場(chǎng)對(duì)底層算力儲(chǔ)備的極限壓力測(cè)試。隨著越來(lái)越多的多模態(tài)和長(zhǎng)文本大模型面世,勢(shì)必將進(jìn)一步推高Token需求。
國(guó)聯(lián)民生證券指出,Token需求正在發(fā)生“通脹” 。這種“通脹”并非是指Token本身變貴,而是指單位時(shí)間內(nèi)、單位用戶(hù)的Token消耗結(jié)構(gòu)性上升。
數(shù)據(jù)顯示,火山引擎的大模型日均Token調(diào)用量已從2024年底的2萬(wàn)億增長(zhǎng)至2025年底的63萬(wàn)億;阿里云外部客戶(hù)2025年日均Token調(diào)用也已接近5萬(wàn)億,2026年目標(biāo)至少15-20萬(wàn)億,內(nèi)部業(yè)務(wù)日均調(diào)用則計(jì)劃從16-17萬(wàn)億拉到100萬(wàn)億。從全行業(yè)看,中國(guó)整體日均Token消耗2024年初為1000億,2025年中突破30萬(wàn)億,2026年2月主流大模型合計(jì)日均Token消耗已到180萬(wàn)億級(jí)別。
![]()
圖|不同模型token調(diào)用量(來(lái)源:海通國(guó)際證券)
摩根大通指出,春節(jié)AI應(yīng)用推廣戰(zhàn)僅是表面,在這背后更深層的趨勢(shì)在于,消費(fèi)者獲取信息和消費(fèi)內(nèi)容的方式正在經(jīng)歷結(jié)構(gòu)性變革,這一進(jìn)程實(shí)際上推升了推理量,將驅(qū)動(dòng)Token消耗量步入一個(gè)長(zhǎng)達(dá)數(shù)年的高速增長(zhǎng)期。
其預(yù)測(cè),中國(guó)的AI推理Token消耗量預(yù)計(jì)將從2025年的約10千萬(wàn)億增長(zhǎng)至2030年的約3900千萬(wàn)億,五年間增長(zhǎng)約370倍。
▌Token成為“計(jì)量單位” 產(chǎn)業(yè)鏈開(kāi)啟漲價(jià)
今年以來(lái),全球云計(jì)算市場(chǎng)進(jìn)入密集漲價(jià)周期。先是亞馬遜云宣布上調(diào)EC2機(jī)器學(xué)習(xí)容量塊價(jià)格約15%;之后谷歌云宣布北美、歐洲、亞洲地區(qū)全部漲價(jià);國(guó)內(nèi)廠商迅速跟進(jìn):優(yōu)刻得宣布全線產(chǎn)品與服務(wù)價(jià)格上浮。
隨后,智譜打響了年內(nèi)大模型漲價(jià)“第一槍”。2月12日,其宣布GLM Coding Plan套餐價(jià)格體系結(jié)構(gòu)性調(diào)整,取消首購(gòu)優(yōu)惠,保留按季按年訂閱優(yōu)惠,套餐價(jià)格整體漲幅30%起。官方解釋是“市場(chǎng)需求持續(xù)強(qiáng)勁增長(zhǎng),用戶(hù)規(guī)模與調(diào)用量快速提升,為保障高負(fù)載下的穩(wěn)定性與服務(wù)質(zhì)量,同步加大算力與模型優(yōu)化投入”。之后GLM Coding Plan上線即售罄。
國(guó)聯(lián)民生證券指出,智譜此前正因?yàn)橛脩?hù)增長(zhǎng)導(dǎo)致算力階段性緊張,對(duì)Coding Plan做過(guò)“限量發(fā)售”安排,這與其后續(xù)漲價(jià)形成了一個(gè)非常典型的“供需鏈條”:需求在短期內(nèi)大幅增長(zhǎng)→資源呈現(xiàn)剛性約束(導(dǎo)致限流/限量)→漲價(jià)。
在分析師看來(lái),當(dāng)行業(yè)依舊處在“模型價(jià)格戰(zhàn)”時(shí),智譜給出的漲價(jià)信號(hào),意味著大模型時(shí)代的“計(jì)量單位”從流量(DAU/時(shí)長(zhǎng))轉(zhuǎn)向Token(推理消耗),而Token消耗在越來(lái)越多場(chǎng)景里是剛需。綜合來(lái)看,Token需求“通脹”不僅利好云端算力,也讓模型廠商擁有了議價(jià)權(quán);同時(shí)產(chǎn)業(yè)定價(jià)邏輯也發(fā)生改變,當(dāng)推理消耗變成生產(chǎn)資料,模型廠商有機(jī)會(huì)把“算力稀缺”通過(guò)分層定價(jià)與訂閱化產(chǎn)品轉(zhuǎn)化為毛利與現(xiàn)金流。
落實(shí)到投資方向上,券商建議關(guān)注:
第一,云廠商與算力基礎(chǔ)設(shè)施:AI拉動(dòng)的IT支出與基礎(chǔ)設(shè)施投入仍處上行周期,云側(cè)將受益于GPU算力、存儲(chǔ)與網(wǎng)絡(luò)I/O等“伴隨型消耗”的持續(xù)增長(zhǎng)。
第二,大模型廠商:當(dāng)它們能在編程、Agent、企業(yè)流程等高ROI場(chǎng)景中維持訂閱留存與企業(yè)席位擴(kuò)張,能把“Token用量”穩(wěn)定轉(zhuǎn)成“省人省時(shí)省返工”的交付價(jià)值時(shí),就具備了穿越開(kāi)源與價(jià)格戰(zhàn)的能力。
第三,安全治理與運(yùn)行時(shí)的防護(hù)工具:隨著企業(yè)把AI嵌入工作流,數(shù)據(jù)泄露、代理越權(quán)等風(fēng)險(xiǎn)將推動(dòng)“AI安全平臺(tái)/治理平臺(tái)”成為剛需層。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.