![]()
作者 | 褚杏娟
“未來,我們公司的每一位工程師都需要有一份年度 token 預(yù)算。他們年薪大概幾十萬美元,我可能還會額外給他們配上一筆相當于年薪一半價值的 token,因為這能讓他們的效率提升 10 倍。”黃仁勛在 GTC 上的這番話,點出了硅谷正在出現(xiàn)的一個新現(xiàn)實:token,正在成為吸引人才的新籌碼。
“這已經(jīng)成了硅谷招聘中的一種新工具:這份工作會配多少 token?原因很清楚:每一個能拿到 token 的工程師,生產(chǎn)力都會更高。”他補充道。
類似的趨勢,也開始在國內(nèi)涌現(xiàn)。社交媒體上有消息稱,阿里內(nèi)部已經(jīng)開始向員工發(fā)放 token 額度,悟空、Qoder 可以免費使用,外部 AI 開發(fā)工具的費用也可以報銷。
Levels.fyi 數(shù)據(jù)專家 Hakeem Shibly 還注意到,在一份軟件工程師的薪酬申報中,“Copilot 訂閱”已經(jīng)被列入員工福利。這看起來只是一個很小的變化,卻有很強的象征意義:過去硅谷吸引人才,主要靠工資、獎金和期權(quán);而現(xiàn)在,AI 訪問權(quán)限,正在逐漸成為第四項標準化福利。
要拿 token 發(fā)工資了?
Token 之所以變得越來越重要,原因并不復(fù)雜。隨著生成式 AI 工具越來越深地嵌入軟件開發(fā)流程,底層模型的調(diào)用成本,正逐漸成為影響生產(chǎn)力的關(guān)鍵變量。
那么,一個重度 AI 用戶到底會花掉多少錢?
根據(jù) Theory Ventures 的 Tomasz Tunguz 分享的數(shù)據(jù),他個人的 AI 推理成本,按年化計算,已經(jīng)沖到了 10 萬美元。
一開始,他的使用量并不高。六個月前,他每個月在 Claude 上只花 200 美元;后來又增加了三個 agent 訂閱:Codex、Gemini 和 Claude Code,月支出上升到 600 美元。再往后,他開始用 AI 系統(tǒng)化處理待辦事項,每天完成的任務(wù)數(shù)提升到 31 個,隨之而來的,是每天 92 美元的推理賬單。此后,他在瀏覽器 agent 上又額外增加了每月 400 美元的花費。短短兩個季度里,他的推理支出年化水平,就從 7200 美元漲到 4.3 萬美元,最終突破 10 萬美元。
最后,為了控制成本,Tunguz 花了一個周末遷移到開源模型上。經(jīng)過一輪調(diào)優(yōu)后,新方案的表現(xiàn)已經(jīng)與原方案幾乎沒有差別,但成本只剩原來的 12%。
按照 Levels.fyi 的數(shù)據(jù),收入位于前 25% 的軟件工程師,年薪大約是 37.5 萬美元。Tunguz 估算,如果再疊加每年 10 萬美元的推理成本,那么一個工程師的完全成本就會上升到 47.5 萬美元。換句話說,未來一個工程師超過 20% 的總成本,可能都來自 AI 使用本身。
這意味著,對 CFO 來說,AI 開支很快就會變成一項必須被單獨追蹤的新型人力成本。隨著員工對 AI 的使用越來越深,這筆錢已經(jīng)不只是“軟件訂閱費”,而是會直接影響公司的整體現(xiàn)金消耗。
而對公司管理層來說,最核心的問題則變成了:這筆 AI 支出到底換來了多少回報?如果云基礎(chǔ)設(shè)施通常用“每小時 GPU 使用帶來的毛利潤”來衡量,那么在員工側(cè),Tunguz 認為對應(yīng)的指標應(yīng)該是:每一美元推理成本,到底換來了多少有效產(chǎn)出。
Tunguz 給出的答案是:一年花 1.2 萬美元,可以換來每天完成 31 個任務(wù)的能力提升。
他最近在 LinkedIn 上寫道:“如果一個工程師一年要燒掉 10 萬美元算力成本,那他最好能把生產(chǎn)力提升到 8 倍以上。”
模型評估公司 Arena 的 AI 能力負責人 Peter Gostev 甚至提出,OpenAI 和 Anthropic 或許應(yīng)該建立專門的招聘網(wǎng)站,讓客戶在發(fā)布崗位時,除了標注薪資區(qū)間,還能直接寫明這個崗位對應(yīng)的 token 預(yù)算。
“如果這一趨勢繼續(xù)下去,那么2026 年很可能會成為一個標志性年份:工程師在談判薪酬時,不再只談美元和股權(quán),而是會把 token 一起談進去。”Tomasz 說,“未來會不會真的出現(xiàn)‘拿 token 發(fā)工資’的情況?到了 2026 年,你大概率就會開始遇到這種事。”
你有沒有資格多用 AI?
token 之所以越來越重要,還因為它背后所對應(yīng)的是更底層的資源爭奪:算力。
隨著生成式 AI 工具越來越深入軟件開發(fā)、產(chǎn)品運營乃至組織協(xié)作流程,模型運行成本已經(jīng)不只是一個財務(wù)問題,更成為生產(chǎn)力分配問題。
現(xiàn)在,許多公司都在內(nèi)部強力推動 AI 使用,甚至以裁員、重組等方式倒逼員工提升 AI 協(xié)作能力。硅谷資深開發(fā)者 Steve Yegge 就認為,如今衡量一家公司的一個關(guān)鍵指標,或許就是 token 的消耗量。因為這個數(shù)字代表著公司的工程師在主動嘗試新工作流,非技術(shù)崗位也在摸索如何使用 AI。只要大家還在嘗試,就一定會經(jīng)歷失敗,也會在失敗中學(xué)習(xí)。
為了推動內(nèi)部采用,一些公司已經(jīng)開始直接給員工發(fā)放 AI 補貼。例如,據(jù) InfoQ 獨家了解到,領(lǐng)英每月提供了 2000 美元的額度,國內(nèi)昆侖萬維此前也宣布提供每月 100 美元的支持。
但更早之前,軟件工程師和 AI 研究人員之間,其實就已經(jīng)圍繞 GPU 資源展開過長期爭奪。這類 AI 算力往往會按照項目優(yōu)先級被精細化分配。而到了今天,這種爭奪正在進一步外顯:一些求職者在面試時,已經(jīng)會主動詢問,如果加入公司,自己究竟能分到多少 AI 算力預(yù)算。
此前,Meta 就曾被曝出,不同模型團隊之間因為算力資源發(fā)生過激烈沖突,甚至有員工因此離職。國內(nèi)阿里千問核心負責人林俊旸的離職也有部分該原因。Google 的情況更能說明問題:即便是掌握全球頂級 AI 基礎(chǔ)設(shè)施的公司,也因為內(nèi)部算力緊張,不得不由專門的算力分配委員會來協(xié)調(diào)。這意味著,算力分配已經(jīng)不再只是工程調(diào)度問題,而是升級為了組織治理問題。
“現(xiàn)在越來越多候選人在面試中會問,如果加入團隊,他們能獲得多少專屬推理算力來使用 Codex。”O(jiān)penAI Codex AI 編程工程負責人 Thibault Sottiaux 最近就在 X 上寫道。他還補充說,單個用戶的使用量增長速度,遠快于整體用戶數(shù)量的增長,這說明 AI 算力正變得越來越稀缺,也越來越有價值。
這種稀缺性,正在改變工程師對工作和報酬的理解。OpenAI 總裁 Greg Brockman 的說法非常直接:“你能獲得多少推理算力,正越來越直接地決定整體的軟件生產(chǎn)力。”
換句話說,大廠內(nèi)部真正稀缺的,已經(jīng)不只是 GPU 本身,而是“誰有資格優(yōu)先使用 GPU”。在不遠的未來,獲得 AI 資源的重要性,可能會和拿到高薪、厚股權(quán)一樣重要。對于 AI 時代的程序員來說,如果拿不到足夠多的算力支持,你能夠?qū)懗鰜淼能浖⑴艹鰜淼膶嶒灐⑼七M的項目,可能都會遠遠落后于那些擁有更大預(yù)算的人,這會直接影響你的職業(yè)前景。
而這背后最值得警惕的,是一種新的不平等正在形成。
過去,工程師之間的差距,主要來自經(jīng)驗、執(zhí)行力、行業(yè)知識、架構(gòu)能力和業(yè)務(wù)理解。現(xiàn)在,另一種分化正在迅速出現(xiàn):同樣都是高級工程師,同樣都懂如何與 AI 協(xié)作,但一個人可以高頻調(diào)用最強模型,擁有更高的 token 上限、更低的調(diào)用延遲、更少的審批限制;另一個人卻只能在有限額度、受限模型和受限工作流里勉強發(fā)揮。那么,兩個人的實際產(chǎn)出,很可能會在極短時間內(nèi)被迅速拉開。
這意味著,“會不會用 AI”,正在轉(zhuǎn)變?yōu)椤坝袥]有資格多用 AI”。
這已經(jīng)不再是單純的技術(shù)問題,而是組織資源配置問題。誰的項目更重要,誰更接近核心業(yè)務(wù),誰更值得被投資,未來可能不只是體現(xiàn)在團隊規(guī)模和獎金上,也會體現(xiàn)在推理預(yù)算和模型訪問權(quán)上。
Token 價格,已經(jīng)開始漲了
在“token 故事”不斷升溫的背景下,很多用戶最直接的擔憂是:未來 token 會不會越來越貴?
如果以 OpenClaw 帶來的 token 消耗激增為例,至少從短期看,價格上漲趨勢已經(jīng)很明顯。
OpenRouter 平臺數(shù)據(jù)顯示,OpenClaw 的 token 消耗量從 2026 年 2 月 3 日的 806 億,在一個月內(nèi)飆升到 3 月 4 日的 3580 億,增長約 4.4 倍;截至 3 月 2 日當周,OpenRouter 平臺周度 token 調(diào)用量已達到 14.8 萬億,兩個月內(nèi)增長約 160%,而 OpenClaw 貢獻了其中絕大部分增量。根據(jù) Anthropic 的數(shù)據(jù),AI Agent 的 token 消耗量最高可達普通聊天交互的 15 倍。
Token 消耗的快速上升,最直接的后果就是:大模型廠商開始漲價。
騰訊云智能體開發(fā)平臺自 2026 年 3 月 13 日起調(diào)整部分模型計費策略,GLM5、MiniMax2.5、Kimi2.5 等模型結(jié)束免費公測,轉(zhuǎn)為正式商用并按調(diào)用量收費。與此同時,混元系列模型 Tencent HY2.0Instruct 與 Tencent HY2.0Think 的價格也進行了調(diào)整。其中,Tencent HY2.0Instruct 的輸入、輸出價格漲幅超過 450%,Tencent HY2.0Think 的輸入、輸出價格也有所上調(diào),套餐用戶則可以通過套餐抵扣部分費用。
智譜在兩個月內(nèi)也已經(jīng)兩次提價。2 月 12 日,智譜推出新一代旗艦?zāi)P?GLM-5,并在第二天上調(diào) GLM Coding Plan 套餐價格,漲幅 30% 起。3 月 16 日,智譜又發(fā)布面向 OpenClaw 的基座模型 GLM-5-Turbo,并將 API 價格進一步上調(diào) 20%。有媒體統(tǒng)計,相較于 GLM-4.7,GLM-5 平均漲價約 50%;在此基礎(chǔ)上,GLM-5-Turbo 又比 GLM-5 提高 20%,相對 GLM-4.7 的平均漲幅已達到 83%。
![]()
3 月 18 日,阿里云也宣布 AI 算力、存儲等產(chǎn)品最高漲價 34%,其中包括:平頭哥真武 810E 等算力卡產(chǎn)品上漲 5%-34%,文件存儲產(chǎn)品 CPFS(智算版)上漲 30%。此前 1 月份,海外云廠商已經(jīng)有了一輪漲價。
有網(wǎng)友總結(jié)自己最近“養(yǎng)小龍蝦”的體驗時說得很直白:“token 消耗量不是線性增長,而是指數(shù)型放大。agent 一旦成熟,拼的就不再是聊天,而是持續(xù)干活。所以,真正可怕的是睡后 token。睡后 token 可能是 AI 投資里最重要、也最容易被低估的變量。”
長期看,如果 token 這套故事真的要走向大眾化,那么價格最終大概率必須像“水電煤”一樣足夠便宜。反過來,這也會逼著大廠持續(xù)尋找方法壓縮模型成本、提升推理效率。但在短期內(nèi),價格究竟會上漲還是下跌,關(guān)鍵取決于議價權(quán)在誰手里。
大廠正試圖把 token 變成新的價值單位
從更宏觀的視角看,token 敘事的興起,也非常符合 AI 供應(yīng)鏈上游大廠的利益。
今年以來,英偉達股價表現(xiàn)持續(xù)強于其他超大市值科技公司,仍然是 AI 浪潮中最大的受益者之一。在黃仁勛的邏輯里,一個新的等式已經(jīng)成立:在 AI 世界里,算力就是營收。因為沒有算力,就無法生成 token;沒有 token,就無法帶來收入增長。因此,算力本身就等于營收能力。
換句話說,算力其實是在替這個世界“印” token,而 token 正在被塑造成 AI 時代真正的貨幣。
Sam Altman 這些年反復(fù)兜售的,也是一套類似的構(gòu)想:未來發(fā)放的未必是錢,而是 tokens。
在 2024 年 5 月的 All-In 播客里,Altman 曾提出一個設(shè)想:未來更合理的分配方式,也許不是“全民基礎(chǔ)收入”,而是“全民基礎(chǔ)算力”。在他的描述里,每個人都可以分到一部分 GPT-7 的算力份額,既可以自己使用,也可以轉(zhuǎn)賣,甚至可以捐出去用于癌癥研究。你擁有的不再只是美元,而是生產(chǎn)力本身的一部分。
這顯然并不是他一時興起的想法。在同年 5 月的 Theo Von 播客里,Altman 進一步描繪了相似的藍圖:如果全世界每年可以生成天文數(shù)字級別的 token,那么其中一部分進入傳統(tǒng)資本分配體系,另一部分則平均分給全球 80 億人,讓每個人都擁有一筆屬于自己的 token 份額。這幾乎就是某種“全球版全民基本財富”的想象。
本質(zhì)上,他是在嘗試把 OpenAI 所創(chuàng)造的虛擬額度,包裝成一種新的財富形式。
也正因如此,外界開始出現(xiàn)不少質(zhì)疑。有人認為,所謂“用 AI token 當錢發(fā)”的想法,某種程度上反映了一種焦慮:當外部融資環(huán)境變化、內(nèi)部現(xiàn)金消耗居高不下時,企業(yè)天然會希望找到一種更輕、更靈活、也更有利于自身的補償貨幣。
有網(wǎng)友的評價就很尖銳:“聽起來很新潮,但說穿了,這根本不是什么創(chuàng)新。它不過是 company scrip 的數(shù)字化翻版——公司自己發(fā)行、只能在自己體系內(nèi)部流通的‘錢’。這種東西在人類商業(yè)史上早就不陌生了,結(jié)局也一向不體面:它本質(zhì)上就是一種剝削工具。在美國,用 company scrip 給工人發(fā)工資,早在 1938 年就已經(jīng)被認定為違法。”
而在國內(nèi),類似思路也開始被更正式地制度化。阿里已經(jīng)成立 Alibaba Token Hub(ATH)事業(yè)群,由 CEO 吳泳銘親自掛帥,目標是建立一個以“創(chuàng)造 Token、輸送 Token、應(yīng)用 Token”為核心的統(tǒng)一調(diào)度中心。摩根士丹利也第一時間發(fā)布點評,指出 ATH 事業(yè)群的財務(wù)驅(qū)動邏輯,與 Minimax、智譜等純模型公司高度相似,未來有可能在現(xiàn)有分部估值框架之外,成為獨立的估值組成部分。
阿里背后的判斷是:未來大量數(shù)字化工作將由數(shù)以百億計的 AI Agent 支撐,而 token 正是驅(qū)動這些 Agent 運轉(zhuǎn)的基礎(chǔ)燃料,也是人類與數(shù)字世界交互的重要載體。
雖然角度略有不同,但國內(nèi)外大廠如今正在做的事情,都指向了同一個方向:圍繞 token,改寫生產(chǎn)力關(guān)系并為其套上金融邏輯。
https://tomtunguz.com/inference-as-compensation/?utm_source=chatgpt.com
https://www.businessinsider.com/ai-compute-compensation-software-engineers-greg-brockman-2026-3?utm_source=chatgpt.com
https://www.youtube.com/watch?v=KLERkM2TJbw
聲明:本文為 InfoQ 前線整理,不代表平臺觀點,未經(jīng)許可禁止轉(zhuǎn)載。
會議推薦
OpenClaw 出圈,“養(yǎng)蝦”潮狂熱,開年 Agentic AI 這把火燒得不可謂不旺。在這一熱潮下,自托管 Agent 形態(tài)迅速普及:多入口對話、持久記憶、Skills 工具鏈帶來強大生產(chǎn)力。但這背后也暴露了工程化落地的真實難題——權(quán)限邊界與隔離運行、Skills 供應(yīng)鏈安全、可觀測與可追溯、記憶分層與跨場景污染、以及如何把 Agent 納入團隊研發(fā) / 運維流程并形成穩(wěn)定收益。
針對這一系列挑戰(zhàn),在 4 月 16-18 日即將舉辦的 QCon 北京站上,我們特別策劃了「OpenClaw 生態(tài)實踐」專題,將聚焦一線實踐與踩坑復(fù)盤,分享企業(yè)如何構(gòu)建私有 Skills、制定安全護欄、搭建審計與回放機制、建立質(zhì)量 / 效率指標體系,最終把自托管 Agent 從可用的 Demo 升級為可靠的生產(chǎn)系統(tǒng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.