文 | 巨潮WAVE,作者|小盧魚,編輯|楊旭然
詞元(Token)調(diào)用量的指數(shù)級增長,正在帶來一批公司估值的飆升。
被稱為“Token第一股”的迅策科技,上市僅108天,股價較發(fā)行價上漲近6倍,最新總市值已經(jīng)達(dá)到1050億港元。
今年1月8日登陸港股的智譜,上市首日市值約580億港元,交出首份年度成績單后股價迅速,突破1000港元大關(guān),市值也沖破4000億港元。
智譜CEO張鵬將2026年的關(guān)鍵詞定義為“Token量”,認(rèn)為智能上界突破與Token消耗的指數(shù)級增長一起,共同構(gòu)成了AGI時代的商業(yè)價值。
![]()
尚未上市的公司之中,月之暗面上個月剛完成新一輪超10億美金融資,估值達(dá)到180億美元,而在去年底的一輪5億美元融資中,其估值僅為43億美元。
這種估值的短時間躍遷,與今年2月OpenClaw宣布將Kimi K2.5設(shè)為其官方主力模型有著直接聯(lián)系。K2.5發(fā)布僅一個月,月之暗面ARR(年度經(jīng)常性收入)即突破1億美元,業(yè)績增速不僅支撐了估值提升,也打開了公司IPO的可能性。
無論國內(nèi)國外,資本市場都在以驚人的熱情為Token經(jīng)濟(jì)的騰飛定價,未來幾個月里,我們將有機(jī)會聽到各種各樣的財富神話。這場轟轟烈烈的Token經(jīng)濟(jì)大繁榮,正在以“大躍進(jìn)”的方式完成對所有人的認(rèn)知普及,以及對風(fēng)險的累積。
01 增長
聊天Bot剛問世的時候,很少有人能想到2年之后,僅僅豆包這一款大模型的日均Token使用量就可以突破120萬億。即便按照每百萬Token兩塊錢這個有點便宜的價格來計算,這也意味著每天有3億元的真實經(jīng)費在豆包上空燃燒。
事實上,國內(nèi)外各家大模型公司都在上演著類似的劇本,全球范圍內(nèi)的Token日均消耗量都在以指數(shù)級規(guī)模增長。
工信部旗下中國信息通信研究院發(fā)布的數(shù)據(jù)顯示,截至2026年3月,中國日均Token調(diào)用量已突破140萬億,較2024年初暴漲超過1000倍。
![]()
全球最大的AI模型API聚合平臺OpenRouter則統(tǒng)計到,其平臺每周處理的Token數(shù)量從2025年3月的1.62萬億飆升至2026年3月的16.90萬億,一年之內(nèi)增長超過10倍。
OpenRouter連接著Anthropic、OpenAI、谷歌、Meta等幾乎所有主流模型廠商的API接口,它的周度Token消耗曲線,本質(zhì)上就是全球AI應(yīng)用活躍度的實時監(jiān)測圖。
這條Token消耗曲線幾乎是垂直向上的,既不像GDP的線性增長,也不像互聯(lián)網(wǎng)用戶滲透率的S型曲線,完全走出了人工智能經(jīng)濟(jì)自己的發(fā)展趨勢。
是什么在驅(qū)動Token需求的大爆發(fā)?答案是人工智能的技術(shù)演進(jìn)。
早期AI應(yīng)用以聊天機(jī)器人(Bot)為主,用戶輸入一句話,模型返回一段回答,一個來回消耗幾百到幾千Token,完事即止。
但從去年下半年開始,以Agent和Claw為代表的新型應(yīng)用范式以更快的速度、更廣的范圍流行開來。它們的共同特征是讓AI不再只是“一問一答”的對話工具,而是一個能夠自主規(guī)劃、調(diào)用工具、長周期執(zhí)行任務(wù)的數(shù)字員工。這種技術(shù)架構(gòu)底層的變化,讓Token消耗量以很多用戶意想不到的方式大幅增長。
行業(yè)內(nèi)部測算表明,完成同一個業(yè)務(wù)目標(biāo)的情況下,Agent模式消耗的Token大約是Bot模式的50到200倍。
這是因為,Agent在執(zhí)行任務(wù)時需要將整個歷史對話上下文全量攜帶,一個復(fù)雜任務(wù)動輒累積數(shù)十萬Token的上下文窗口。
而且Agent每次思考都需要經(jīng)過多輪推理,都會觸發(fā)API請求,還需要持續(xù)加載系統(tǒng)配置文件和記憶庫,以維持任務(wù)的一致性和個性化體驗。這導(dǎo)致Agent模式下的Token消耗,更像是個不受用戶主觀控制的黑箱操作。
更值得警惕的是,這個階段Token表面的消耗量,并不等同于真實的需求量。
當(dāng)AI轉(zhuǎn)型成為企業(yè)的政治正確,當(dāng)Token消耗量被越來越多的公司納入員工的考核指標(biāo),一種“Token偽需求”的情況就誕生了。
![]()
Meta內(nèi)部已經(jīng)有團(tuán)隊將Token消耗量作為AI滲透率的衡量標(biāo)尺,部分員工為了“顯得自己很懂AI”,會故意運行大量冗余的模型調(diào)用任務(wù);國內(nèi)騰訊等大廠也被爆料存在類似現(xiàn)象,一些業(yè)務(wù)線甚至發(fā)明了“Token刷量”的灰色操作。
這種為了不被時代拋棄而制造多余的消耗、夸大不存在的業(yè)績的行為,充滿了大躍進(jìn)式的荒誕。
02 核心
當(dāng)Token消耗量以指數(shù)級增長,一個嚴(yán)肅的產(chǎn)業(yè)問題也浮出水面——誰來買單,誰會受益?
4月15日,國家數(shù)據(jù)局就《關(guān)于推進(jìn)行業(yè)高質(zhì)量數(shù)據(jù)集建設(shè)行動的實施方案(征求意見稿)》公開征求意見,首次在官方政策文件中提出“探索詞元交易等新型交易模式,構(gòu)建以詞元為基礎(chǔ),可量化、可定價的數(shù)據(jù)集價值體系”。
從“詞元交易”被寫入國家頂層設(shè)計的那一刻起,Token就不再僅僅是一個技術(shù)概念,而是會逐漸成為人工智能經(jīng)濟(jì)的法定計價單位。某種意義上來說,Token化收費是人工智能經(jīng)濟(jì)的核心。
![]()
迅策科技被稱為“Token第一股”,就是因為其率先在商業(yè)模式上做出了調(diào)整,全面轉(zhuǎn)向了按Token消耗付費與分成的新模式,構(gòu)建了“收入=Token價格×調(diào)用次數(shù)×模塊應(yīng)用數(shù)”的增長模型。
目前,Token付費收入占迅策科技總營收的5%左右,公司預(yù)計到年底這一比例將快速提升至20%至30%。市場對迅策的估值邏輯也因此發(fā)生了重大變化,脫離了傳統(tǒng)市銷率的限制,有了更大的想象空間。
迅策科技的模式也說明,在人工智能經(jīng)濟(jì)中,大模型廠商大概率會扮演“精煉廠”的角色,即將底層的算力與數(shù)據(jù),加工成可以被直接消費、以Token計價的“成品”、“結(jié)果”,并掌握著價值分配體系中的關(guān)鍵生態(tài)位。
而云服務(wù)廠商大概會扮演著“發(fā)電廠”和“電網(wǎng)”的角色,它們不直接定價Token,卻決定了Token的底層成本。
以阿里云為例,截至2026年2月底,阿里云2026財年累計外部商業(yè)化收入突破1000億元,AI相關(guān)產(chǎn)品收入延續(xù)高增長態(tài)勢,實現(xiàn)連續(xù)第十個季度三位數(shù)同比增長。
緊隨需求而來的就是漲價,上周阿里云四天連發(fā)三條產(chǎn)品漲價公告,調(diào)整百煉部分模型單元服務(wù)價格及DataWorks部分API免費額度——云服務(wù)廠商對Token成本的影響力,可見一斑。
云服務(wù)廠商在傳統(tǒng)架構(gòu)中主要收入來自虛擬機(jī)、存儲與網(wǎng)絡(luò)等基礎(chǔ)設(shè)施計費,進(jìn)入Agent時代后,它們完全可以推動按資源(Token)使用量計費,并通過Agent平臺訂閱、開發(fā)者生態(tài)套件、行業(yè)級解決方案等獲得長期合同收入。
![]()
算力廠商則像是更上游的原材料、燃料供應(yīng)方,英偉達(dá)的高端GPU至今仍然處于產(chǎn)業(yè)鏈中最核心位置,高帶寬內(nèi)存(HBM)如今更是供應(yīng)緊張,三星、SK海力士及美光三大存儲原廠一邊產(chǎn)能受限,一邊毛利率抬高。
也許有人會擔(dān)心算力實際已經(jīng)過剩,英偉達(dá)和存儲廠商的股價已經(jīng)過高,但是這都不影響Token化收費的歷史進(jìn)程。
Token收費,讓整條產(chǎn)業(yè)鏈的價值分配有了清晰的計算依據(jù)。
就像千瓦時的確立讓電力市場得以形成,流量/曝光量成為抖音和視頻號的收費標(biāo)準(zhǔn)單位一樣,Token正在讓人工智能經(jīng)濟(jì)從“感覺有用”走向“可以算賬、可以收稅”,成為一種真實存在的經(jīng)濟(jì)構(gòu)成。
03 狂歡
Token化收費,讓人工智能經(jīng)濟(jì)運轉(zhuǎn)的邏輯變得清晰起來,但是人工智能作為一種劃時代的技術(shù)革命,其經(jīng)濟(jì)運轉(zhuǎn)的邏輯,是否與傳統(tǒng)的經(jīng)濟(jì)學(xué)規(guī)律一致呢?
至少傳統(tǒng)經(jīng)濟(jì)學(xué)的供需平衡理論,在人工智能經(jīng)濟(jì)中并不完全適用。
傳統(tǒng)模型中,供給和需求是兩條獨立的曲線相交,而在人工智能經(jīng)濟(jì)中,供給本身會通過數(shù)據(jù)飛輪改進(jìn)供給質(zhì)量。需求曲線向右移動不是因為外部收入變化,而是因為供給曲線本身向下、向右移動了。
![]()
目前這個階段,我們更可能看到蒸汽時代的“杰文斯悖論”在人工智能時代重演。所謂的杰文斯悖論是指,當(dāng)蒸汽機(jī)效率提升、單位馬力耗煤量下降時,煤炭的總消耗量反而暴增,因為更便宜的蒸汽動力催生了更多工廠、火車和輪船。
現(xiàn)在Token的單位生產(chǎn)成本越低,愿意消耗Token的群體就越多,舍得使用Token而非人力的場景就越多,最后Token的總成本就越高,或者說人工智能經(jīng)濟(jì)的總價值就越大。
根據(jù)國內(nèi)媒體的數(shù)據(jù)統(tǒng)計,過去兩年多,Token生產(chǎn)成本下降了超過99%,GPT-4每百萬Token的成本已經(jīng)從37.5美元下降到了2025年的0.14美元。但根據(jù)硅谷知名風(fēng)投Menlo Ventures,全球企業(yè)2025年在AI上的支出反而比2024年增長了3.2倍。
如果這種趨勢延續(xù)下去,那么哪怕單位 Token的價格趨近于零,全人類消耗的 Token 總價值(總量 × 單價)以及它撬動的 GDP 比重,也可以成百上千倍的增長。
這正是智譜、MiniMax等公司在巨額虧損的情況下,仍然被資本市場賦予超過許多傳統(tǒng)互聯(lián)網(wǎng)企業(yè)估值的深層原因——市場定價的不是今天的利潤,而是未來Token經(jīng)濟(jì)總價值。
更何況,用Token生產(chǎn)出來的東西,本身也會越來越有價值。
同一百萬個Token,在不同場景下創(chuàng)造的價值差距可達(dá)十萬倍,其價值完全因執(zhí)行的任務(wù)而異——用于閑聊的Token只值幾分錢,用于寫代碼的Token值幾百幾千元,用于量化投資、企業(yè)并購的Token完全可以價值幾萬元。
斯坦福大學(xué)2026年AI指數(shù)報告估算,僅2024年生成式AI就為美國消費者創(chuàng)造了約1720億美元的消費者剩余,而用戶獲得的價值遠(yuǎn)超實際支付的費用。
值得警惕的是,在AI代替了大量人類的腦力勞動后,傳統(tǒng)的勞動力供給理論也會面臨挑戰(zhàn)。傳統(tǒng)的需求曲線會因為購買力萎縮而整體坍塌,而供給端因為自動化依然強(qiáng)勁,這就是凱恩斯所說的“技術(shù)性失業(yè)導(dǎo)致的有效需求不足”。
只不過在這個階段,圍繞著Token消耗量指數(shù)級增長的一切都還披著繁榮的外衣,引領(lǐng)著產(chǎn)業(yè)鏈上下游和資本市場的狂歡。
但是歷史已經(jīng)反復(fù)證明了,每當(dāng)一種新技術(shù)被資本市場賦予無限想象空間,泡沫總是比價值更先抵達(dá)終點。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.