網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI遇上最強(qiáng)春節(jié)檔 Token通脹已成必然？

2026-02-15 17:23:09　來(lái)源: 財(cái)聯(lián)社

上海舉報(bào)

分享至

《科創(chuàng)板日?qǐng)?bào)》2月15日訊 2026年馬年春節(jié)，互聯(lián)網(wǎng)大廠的“紅包戰(zhàn)”如期上演。百度撒下5億，騰訊元寶豪擲10億，阿里更是祭出30億免單的“鈔能力”。不過(guò)“撒錢(qián)”只是“開(kāi)胃菜”，緊隨而來(lái)的則是參與者更多、頻率更密集的國(guó)產(chǎn)AI新品“春節(jié)檔”：

2月14日，字節(jié)跳動(dòng)發(fā)布豆包大模型2.0系列，這是繼Seedance 2.0視頻模型和Seedream 5.0 Lite圖像模型之后打出的春節(jié)“第三彈”。智譜已在2月11日發(fā)布“系統(tǒng)架構(gòu)師”級(jí)別的底座模型GLM-5；MiniMax緊隨其后，于2月12日上線并開(kāi)源文本模型M2.5；連一向低調(diào)的DeepSeek，也在幾天前進(jìn)行版本更新。在此之前，階躍星辰發(fā)布Step 3.5 Flash，阿里發(fā)布Qwen3-Coder-Next，且有望在春節(jié)期間發(fā)布Qwen 3.5。

每一次發(fā)布都是一次卡位，每一次迭代都是一次重塑行業(yè)格局的嘗試。這一波覆蓋文本、圖像、視頻多模態(tài)的AI“最強(qiáng)春節(jié)檔”已經(jīng)拉開(kāi)大幕。

▌多模態(tài)大模型接連面世 Token需求出現(xiàn)“通脹”

一年多前，字節(jié)內(nèi)部曾判斷，AI對(duì)話(huà)類(lèi)產(chǎn)品可能只是AI產(chǎn)品的“中間態(tài)”，長(zhǎng)期更理想的產(chǎn)品形式，大概率需要更視覺(jué)化的用戶(hù)體驗(yàn)、更低的用戶(hù)使用門(mén)檻。因此彼時(shí)的字節(jié)選擇提升即夢(mèng)的產(chǎn)品優(yōu)先級(jí)，嘗試打造“AI時(shí)代的抖音”。

或許也正是因此，一年多以后，在字節(jié)的這次春節(jié)檔“三連彈”中，最先出場(chǎng)的不是最為大眾所熟悉的豆包，而是視頻模型Seedance 2.0。

而從曾經(jīng)和文本大模型的“聊幾秒”到如今視頻大模型的“看幾秒”，算力消耗規(guī)模正在快速膨脹——從單條視頻來(lái)看，Seedance 2.0 生成一條10秒、1080p的視頻，大致要消耗35萬(wàn)token。

Seedance 2.0的算力消耗增長(zhǎng)并非孤例。春節(jié)檔的這輪密集發(fā)布，對(duì)各家廠商而言不僅是品牌宣傳的窗口期，也是一場(chǎng)對(duì)底層算力儲(chǔ)備的極限壓力測(cè)試。隨著越來(lái)越多的多模態(tài)和長(zhǎng)文本大模型面世，勢(shì)必將進(jìn)一步推高Token需求。

國(guó)聯(lián)民生證券指出，Token需求正在發(fā)生“通脹” 。這種“通脹”并非是指Token本身變貴，而是指單位時(shí)間內(nèi)、單位用戶(hù)的Token消耗結(jié)構(gòu)性上升。

數(shù)據(jù)顯示，火山引擎的大模型日均Token調(diào)用量已從2024年底的2萬(wàn)億增長(zhǎng)至2025年底的63萬(wàn)億；阿里云外部客戶(hù)2025年日均Token調(diào)用也已接近5萬(wàn)億，2026年目標(biāo)至少15-20萬(wàn)億，內(nèi)部業(yè)務(wù)日均調(diào)用則計(jì)劃從16-17萬(wàn)億拉到100萬(wàn)億。從全行業(yè)看，中國(guó)整體日均Token消耗2024年初為1000億，2025年中突破30萬(wàn)億，2026年2月主流大模型合計(jì)日均Token消耗已到180萬(wàn)億級(jí)別。

圖|不同模型token調(diào)用量（來(lái)源：海通國(guó)際證券）

摩根大通指出，春節(jié)AI應(yīng)用推廣戰(zhàn)僅是表面，在這背后更深層的趨勢(shì)在于，消費(fèi)者獲取信息和消費(fèi)內(nèi)容的方式正在經(jīng)歷結(jié)構(gòu)性變革，這一進(jìn)程實(shí)際上推升了推理量，將驅(qū)動(dòng)Token消耗量步入一個(gè)長(zhǎng)達(dá)數(shù)年的高速增長(zhǎng)期。

其預(yù)測(cè)，中國(guó)的AI推理Token消耗量預(yù)計(jì)將從2025年的約10千萬(wàn)億增長(zhǎng)至2030年的約3900千萬(wàn)億，五年間增長(zhǎng)約370倍。

▌Token成為“計(jì)量單位” 產(chǎn)業(yè)鏈開(kāi)啟漲價(jià)

今年以來(lái)，全球云計(jì)算市場(chǎng)進(jìn)入密集漲價(jià)周期。先是亞馬遜云宣布上調(diào)EC2機(jī)器學(xué)習(xí)容量塊價(jià)格約15%；之后谷歌云宣布北美、歐洲、亞洲地區(qū)全部漲價(jià)；國(guó)內(nèi)廠商迅速跟進(jìn)：優(yōu)刻得宣布全線產(chǎn)品與服務(wù)價(jià)格上浮。

隨后，智譜打響了年內(nèi)大模型漲價(jià)“第一槍”。2月12日，其宣布GLM Coding Plan套餐價(jià)格體系結(jié)構(gòu)性調(diào)整，取消首購(gòu)優(yōu)惠，保留按季按年訂閱優(yōu)惠，套餐價(jià)格整體漲幅30%起。官方解釋是“市場(chǎng)需求持續(xù)強(qiáng)勁增長(zhǎng)，用戶(hù)規(guī)模與調(diào)用量快速提升，為保障高負(fù)載下的穩(wěn)定性與服務(wù)質(zhì)量，同步加大算力與模型優(yōu)化投入”。之后GLM Coding Plan上線即售罄。

國(guó)聯(lián)民生證券指出，智譜此前正因?yàn)橛脩?hù)增長(zhǎng)導(dǎo)致算力階段性緊張，對(duì)Coding Plan做過(guò)“限量發(fā)售”安排，這與其后續(xù)漲價(jià)形成了一個(gè)非常典型的“供需鏈條”：需求在短期內(nèi)大幅增長(zhǎng)→資源呈現(xiàn)剛性約束（導(dǎo)致限流/限量）→漲價(jià)。

在分析師看來(lái)，當(dāng)行業(yè)依舊處在“模型價(jià)格戰(zhàn)”時(shí)，智譜給出的漲價(jià)信號(hào)，意味著大模型時(shí)代的“計(jì)量單位”從流量（DAU/時(shí)長(zhǎng)）轉(zhuǎn)向Token（推理消耗），而Token消耗在越來(lái)越多場(chǎng)景里是剛需。綜合來(lái)看，Token需求“通脹”不僅利好云端算力，也讓模型廠商擁有了議價(jià)權(quán)；同時(shí)產(chǎn)業(yè)定價(jià)邏輯也發(fā)生改變，當(dāng)推理消耗變成生產(chǎn)資料，模型廠商有機(jī)會(huì)把“算力稀缺”通過(guò)分層定價(jià)與訂閱化產(chǎn)品轉(zhuǎn)化為毛利與現(xiàn)金流。

落實(shí)到投資方向上，券商建議關(guān)注：

第一，云廠商與算力基礎(chǔ)設(shè)施：AI拉動(dòng)的IT支出與基礎(chǔ)設(shè)施投入仍處上行周期，云側(cè)將受益于GPU算力、存儲(chǔ)與網(wǎng)絡(luò)I/O等“伴隨型消耗”的持續(xù)增長(zhǎng)。

第二，大模型廠商：當(dāng)它們能在編程、Agent、企業(yè)流程等高ROI場(chǎng)景中維持訂閱留存與企業(yè)席位擴(kuò)張，能把“Token用量”穩(wěn)定轉(zhuǎn)成“省人省時(shí)省返工”的交付價(jià)值時(shí)，就具備了穿越開(kāi)源與價(jià)格戰(zhàn)的能力。

第三，安全治理與運(yùn)行時(shí)的防護(hù)工具：隨著企業(yè)把AI嵌入工作流，數(shù)據(jù)泄露、代理越權(quán)等風(fēng)險(xiǎn)將推動(dòng)“AI安全平臺(tái)/治理平臺(tái)”成為剛需層。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.