發(fā) token 當工資？工程師不只拿現(xiàn)金和期權(quán)，開始按 token 分身價了

2026-03-18 15:14:38　來源: InfoQ

北京舉報

分享至

作者 | 褚杏娟

“未來，我們公司的每一位工程師都需要有一份年度 token 預(yù)算。他們年薪大概幾十萬美元，我可能還會額外給他們配上一筆相當于年薪一半價值的 token，因為這能讓他們的效率提升 10 倍。”黃仁勛在 GTC 上的這番話，點出了硅谷正在出現(xiàn)的一個新現(xiàn)實：token，正在成為吸引人才的新籌碼。

“這已經(jīng)成了硅谷招聘中的一種新工具：這份工作會配多少 token？原因很清楚：每一個能拿到 token 的工程師，生產(chǎn)力都會更高。”他補充道。

類似的趨勢，也開始在國內(nèi)涌現(xiàn)。社交媒體上有消息稱，阿里內(nèi)部已經(jīng)開始向員工發(fā)放 token 額度，悟空、Qoder 可以免費使用，外部 AI 開發(fā)工具的費用也可以報銷。

Levels.fyi 數(shù)據(jù)專家 Hakeem Shibly 還注意到，在一份軟件工程師的薪酬申報中，“Copilot 訂閱”已經(jīng)被列入員工福利。這看起來只是一個很小的變化，卻有很強的象征意義：過去硅谷吸引人才，主要靠工資、獎金和期權(quán)；而現(xiàn)在，AI 訪問權(quán)限，正在逐漸成為第四項標準化福利。

要拿 token 發(fā)工資了？

Token 之所以變得越來越重要，原因并不復(fù)雜。隨著生成式 AI 工具越來越深地嵌入軟件開發(fā)流程，底層模型的調(diào)用成本，正逐漸成為影響生產(chǎn)力的關(guān)鍵變量。

那么，一個重度 AI 用戶到底會花掉多少錢？

根據(jù) Theory Ventures 的 Tomasz Tunguz 分享的數(shù)據(jù)，他個人的 AI 推理成本，按年化計算，已經(jīng)沖到了 10 萬美元。

一開始，他的使用量并不高。六個月前，他每個月在 Claude 上只花 200 美元；后來又增加了三個 agent 訂閱：Codex、Gemini 和 Claude Code，月支出上升到 600 美元。再往后，他開始用 AI 系統(tǒng)化處理待辦事項，每天完成的任務(wù)數(shù)提升到 31 個，隨之而來的，是每天 92 美元的推理賬單。此后，他在瀏覽器 agent 上又額外增加了每月 400 美元的花費。短短兩個季度里，他的推理支出年化水平，就從 7200 美元漲到 4.3 萬美元，最終突破 10 萬美元。

最后，為了控制成本，Tunguz 花了一個周末遷移到開源模型上。經(jīng)過一輪調(diào)優(yōu)后，新方案的表現(xiàn)已經(jīng)與原方案幾乎沒有差別，但成本只剩原來的 12%。

按照 Levels.fyi 的數(shù)據(jù)，收入位于前 25% 的軟件工程師，年薪大約是 37.5 萬美元。Tunguz 估算，如果再疊加每年 10 萬美元的推理成本，那么一個工程師的完全成本就會上升到 47.5 萬美元。換句話說，未來一個工程師超過 20% 的總成本，可能都來自 AI 使用本身。

這意味著，對 CFO 來說，AI 開支很快就會變成一項必須被單獨追蹤的新型人力成本。隨著員工對 AI 的使用越來越深，這筆錢已經(jīng)不只是“軟件訂閱費”，而是會直接影響公司的整體現(xiàn)金消耗。

而對公司管理層來說，最核心的問題則變成了：這筆 AI 支出到底換來了多少回報？如果云基礎(chǔ)設(shè)施通常用“每小時 GPU 使用帶來的毛利潤”來衡量，那么在員工側(cè)，Tunguz 認為對應(yīng)的指標應(yīng)該是：每一美元推理成本，到底換來了多少有效產(chǎn)出。

Tunguz 給出的答案是：一年花 1.2 萬美元，可以換來每天完成 31 個任務(wù)的能力提升。

他最近在 LinkedIn 上寫道：“如果一個工程師一年要燒掉 10 萬美元算力成本，那他最好能把生產(chǎn)力提升到 8 倍以上。”

模型評估公司 Arena 的 AI 能力負責人 Peter Gostev 甚至提出，OpenAI 和 Anthropic 或許應(yīng)該建立專門的招聘網(wǎng)站，讓客戶在發(fā)布崗位時，除了標注薪資區(qū)間，還能直接寫明這個崗位對應(yīng)的 token 預(yù)算。

“如果這一趨勢繼續(xù)下去，那么2026 年很可能會成為一個標志性年份：工程師在談判薪酬時，不再只談美元和股權(quán)，而是會把 token 一起談進去。”Tomasz 說，“未來會不會真的出現(xiàn)‘拿 token 發(fā)工資’的情況？到了 2026 年，你大概率就會開始遇到這種事。”

你有沒有資格多用 AI？

token 之所以越來越重要，還因為它背后所對應(yīng)的是更底層的資源爭奪：算力。

隨著生成式 AI 工具越來越深入軟件開發(fā)、產(chǎn)品運營乃至組織協(xié)作流程，模型運行成本已經(jīng)不只是一個財務(wù)問題，更成為生產(chǎn)力分配問題。

現(xiàn)在，許多公司都在內(nèi)部強力推動 AI 使用，甚至以裁員、重組等方式倒逼員工提升 AI 協(xié)作能力。硅谷資深開發(fā)者 Steve Yegge 就認為，如今衡量一家公司的一個關(guān)鍵指標，或許就是 token 的消耗量。因為這個數(shù)字代表著公司的工程師在主動嘗試新工作流，非技術(shù)崗位也在摸索如何使用 AI。只要大家還在嘗試，就一定會經(jīng)歷失敗，也會在失敗中學(xué)習(xí)。

為了推動內(nèi)部采用，一些公司已經(jīng)開始直接給員工發(fā)放 AI 補貼。例如，據(jù) InfoQ 獨家了解到，領(lǐng)英每月提供了 2000 美元的額度，國內(nèi)昆侖萬維此前也宣布提供每月 100 美元的支持。

但更早之前，軟件工程師和 AI 研究人員之間，其實就已經(jīng)圍繞 GPU 資源展開過長期爭奪。這類 AI 算力往往會按照項目優(yōu)先級被精細化分配。而到了今天，這種爭奪正在進一步外顯：一些求職者在面試時，已經(jīng)會主動詢問，如果加入公司，自己究竟能分到多少 AI 算力預(yù)算。

此前，Meta 就曾被曝出，不同模型團隊之間因為算力資源發(fā)生過激烈沖突，甚至有員工因此離職。國內(nèi)阿里千問核心負責人林俊旸的離職也有部分該原因。Google 的情況更能說明問題：即便是掌握全球頂級 AI 基礎(chǔ)設(shè)施的公司，也因為內(nèi)部算力緊張，不得不由專門的算力分配委員會來協(xié)調(diào)。這意味著，算力分配已經(jīng)不再只是工程調(diào)度問題，而是升級為了組織治理問題。

“現(xiàn)在越來越多候選人在面試中會問，如果加入團隊，他們能獲得多少專屬推理算力來使用 Codex。”O(jiān)penAI Codex AI 編程工程負責人 Thibault Sottiaux 最近就在 X 上寫道。他還補充說，單個用戶的使用量增長速度，遠快于整體用戶數(shù)量的增長，這說明 AI 算力正變得越來越稀缺，也越來越有價值。

這種稀缺性，正在改變工程師對工作和報酬的理解。OpenAI 總裁 Greg Brockman 的說法非常直接：“你能獲得多少推理算力，正越來越直接地決定整體的軟件生產(chǎn)力。”

換句話說，大廠內(nèi)部真正稀缺的，已經(jīng)不只是 GPU 本身，而是“誰有資格優(yōu)先使用 GPU”。在不遠的未來，獲得 AI 資源的重要性，可能會和拿到高薪、厚股權(quán)一樣重要。對于 AI 時代的程序員來說，如果拿不到足夠多的算力支持，你能夠?qū)懗鰜淼能浖⑴艹鰜淼膶嶒灐⑼七M的項目，可能都會遠遠落后于那些擁有更大預(yù)算的人，這會直接影響你的職業(yè)前景。

而這背后最值得警惕的，是一種新的不平等正在形成。

過去，工程師之間的差距，主要來自經(jīng)驗、執(zhí)行力、行業(yè)知識、架構(gòu)能力和業(yè)務(wù)理解。現(xiàn)在，另一種分化正在迅速出現(xiàn)：同樣都是高級工程師，同樣都懂如何與 AI 協(xié)作，但一個人可以高頻調(diào)用最強模型，擁有更高的 token 上限、更低的調(diào)用延遲、更少的審批限制；另一個人卻只能在有限額度、受限模型和受限工作流里勉強發(fā)揮。那么，兩個人的實際產(chǎn)出，很可能會在極短時間內(nèi)被迅速拉開。

這意味著，“會不會用 AI”，正在轉(zhuǎn)變?yōu)椤坝袥]有資格多用 AI”。

這已經(jīng)不再是單純的技術(shù)問題，而是組織資源配置問題。誰的項目更重要，誰更接近核心業(yè)務(wù)，誰更值得被投資，未來可能不只是體現(xiàn)在團隊規(guī)模和獎金上，也會體現(xiàn)在推理預(yù)算和模型訪問權(quán)上。

Token 價格，已經(jīng)開始漲了

在“token 故事”不斷升溫的背景下，很多用戶最直接的擔憂是：未來 token 會不會越來越貴？

如果以 OpenClaw 帶來的 token 消耗激增為例，至少從短期看，價格上漲趨勢已經(jīng)很明顯。

OpenRouter 平臺數(shù)據(jù)顯示，OpenClaw 的 token 消耗量從 2026 年 2 月 3 日的 806 億，在一個月內(nèi)飆升到 3 月 4 日的 3580 億，增長約 4.4 倍；截至 3 月 2 日當周，OpenRouter 平臺周度 token 調(diào)用量已達到 14.8 萬億，兩個月內(nèi)增長約 160%，而 OpenClaw 貢獻了其中絕大部分增量。根據(jù) Anthropic 的數(shù)據(jù)，AI Agent 的 token 消耗量最高可達普通聊天交互的 15 倍。

Token 消耗的快速上升，最直接的后果就是：大模型廠商開始漲價。

騰訊云智能體開發(fā)平臺自 2026 年 3 月 13 日起調(diào)整部分模型計費策略，GLM5、MiniMax2.5、Kimi2.5 等模型結(jié)束免費公測，轉(zhuǎn)為正式商用并按調(diào)用量收費。與此同時，混元系列模型 Tencent HY2.0Instruct 與 Tencent HY2.0Think 的價格也進行了調(diào)整。其中，Tencent HY2.0Instruct 的輸入、輸出價格漲幅超過 450%，Tencent HY2.0Think 的輸入、輸出價格也有所上調(diào)，套餐用戶則可以通過套餐抵扣部分費用。

智譜在兩個月內(nèi)也已經(jīng)兩次提價。2 月 12 日，智譜推出新一代旗艦?zāi)Ｐ?GLM-5，并在第二天上調(diào) GLM Coding Plan 套餐價格，漲幅 30% 起。3 月 16 日，智譜又發(fā)布面向 OpenClaw 的基座模型 GLM-5-Turbo，并將 API 價格進一步上調(diào) 20%。有媒體統(tǒng)計，相較于 GLM-4.7，GLM-5 平均漲價約 50%；在此基礎(chǔ)上，GLM-5-Turbo 又比 GLM-5 提高 20%，相對 GLM-4.7 的平均漲幅已達到 83%。

3 月 18 日，阿里云也宣布 AI 算力、存儲等產(chǎn)品最高漲價 34％，其中包括：平頭哥真武 810E 等算力卡產(chǎn)品上漲 5%-34%，文件存儲產(chǎn)品 CPFS（智算版）上漲 30%。此前 1 月份，海外云廠商已經(jīng)有了一輪漲價。

有網(wǎng)友總結(jié)自己最近“養(yǎng)小龍蝦”的體驗時說得很直白：“token 消耗量不是線性增長，而是指數(shù)型放大。agent 一旦成熟，拼的就不再是聊天，而是持續(xù)干活。所以，真正可怕的是睡后 token。睡后 token 可能是 AI 投資里最重要、也最容易被低估的變量。”

長期看，如果 token 這套故事真的要走向大眾化，那么價格最終大概率必須像“水電煤”一樣足夠便宜。反過來，這也會逼著大廠持續(xù)尋找方法壓縮模型成本、提升推理效率。但在短期內(nèi)，價格究竟會上漲還是下跌，關(guān)鍵取決于議價權(quán)在誰手里。

大廠正試圖把 token 變成新的價值單位

從更宏觀的視角看，token 敘事的興起，也非常符合 AI 供應(yīng)鏈上游大廠的利益。

今年以來，英偉達股價表現(xiàn)持續(xù)強于其他超大市值科技公司，仍然是 AI 浪潮中最大的受益者之一。在黃仁勛的邏輯里，一個新的等式已經(jīng)成立：在 AI 世界里，算力就是營收。因為沒有算力，就無法生成 token；沒有 token，就無法帶來收入增長。因此，算力本身就等于營收能力。

換句話說，算力其實是在替這個世界“印” token，而 token 正在被塑造成 AI 時代真正的貨幣。

Sam Altman 這些年反復(fù)兜售的，也是一套類似的構(gòu)想：未來發(fā)放的未必是錢，而是 tokens。

在 2024 年 5 月的 All-In 播客里，Altman 曾提出一個設(shè)想：未來更合理的分配方式，也許不是“全民基礎(chǔ)收入”，而是“全民基礎(chǔ)算力”。在他的描述里，每個人都可以分到一部分 GPT-7 的算力份額，既可以自己使用，也可以轉(zhuǎn)賣，甚至可以捐出去用于癌癥研究。你擁有的不再只是美元，而是生產(chǎn)力本身的一部分。

這顯然并不是他一時興起的想法。在同年 5 月的 Theo Von 播客里，Altman 進一步描繪了相似的藍圖：如果全世界每年可以生成天文數(shù)字級別的 token，那么其中一部分進入傳統(tǒng)資本分配體系，另一部分則平均分給全球 80 億人，讓每個人都擁有一筆屬于自己的 token 份額。這幾乎就是某種“全球版全民基本財富”的想象。

本質(zhì)上，他是在嘗試把 OpenAI 所創(chuàng)造的虛擬額度，包裝成一種新的財富形式。

也正因如此，外界開始出現(xiàn)不少質(zhì)疑。有人認為，所謂“用 AI token 當錢發(fā)”的想法，某種程度上反映了一種焦慮：當外部融資環(huán)境變化、內(nèi)部現(xiàn)金消耗居高不下時，企業(yè)天然會希望找到一種更輕、更靈活、也更有利于自身的補償貨幣。

有網(wǎng)友的評價就很尖銳：“聽起來很新潮，但說穿了，這根本不是什么創(chuàng)新。它不過是 company scrip 的數(shù)字化翻版——公司自己發(fā)行、只能在自己體系內(nèi)部流通的‘錢’。這種東西在人類商業(yè)史上早就不陌生了，結(jié)局也一向不體面：它本質(zhì)上就是一種剝削工具。在美國，用 company scrip 給工人發(fā)工資，早在 1938 年就已經(jīng)被認定為違法。”

而在國內(nèi)，類似思路也開始被更正式地制度化。阿里已經(jīng)成立 Alibaba Token Hub（ATH）事業(yè)群，由 CEO 吳泳銘親自掛帥，目標是建立一個以“創(chuàng)造 Token、輸送 Token、應(yīng)用 Token”為核心的統(tǒng)一調(diào)度中心。摩根士丹利也第一時間發(fā)布點評，指出 ATH 事業(yè)群的財務(wù)驅(qū)動邏輯，與 Minimax、智譜等純模型公司高度相似，未來有可能在現(xiàn)有分部估值框架之外，成為獨立的估值組成部分。

阿里背后的判斷是：未來大量數(shù)字化工作將由數(shù)以百億計的 AI Agent 支撐，而 token 正是驅(qū)動這些 Agent 運轉(zhuǎn)的基礎(chǔ)燃料，也是人類與數(shù)字世界交互的重要載體。

雖然角度略有不同，但國內(nèi)外大廠如今正在做的事情，都指向了同一個方向：圍繞 token，改寫生產(chǎn)力關(guān)系并為其套上金融邏輯。

https://tomtunguz.com/inference-as-compensation/?utm_source=chatgpt.com

https://www.businessinsider.com/ai-compute-compensation-software-engineers-greg-brockman-2026-3?utm_source=chatgpt.com

https://www.youtube.com/watch?v=KLERkM2TJbw

聲明：本文為 InfoQ 前線整理，不代表平臺觀點，未經(jīng)許可禁止轉(zhuǎn)載。

會議推薦

OpenClaw 出圈，“養(yǎng)蝦”潮狂熱，開年 Agentic AI 這把火燒得不可謂不旺。在這一熱潮下，自托管 Agent 形態(tài)迅速普及：多入口對話、持久記憶、Skills 工具鏈帶來強大生產(chǎn)力。但這背后也暴露了工程化落地的真實難題——權(quán)限邊界與隔離運行、Skills 供應(yīng)鏈安全、可觀測與可追溯、記憶分層與跨場景污染、以及如何把 Agent 納入團隊研發(fā) / 運維流程并形成穩(wěn)定收益。

針對這一系列挑戰(zhàn)，在 4 月 16-18 日即將舉辦的 QCon 北京站上，我們特別策劃了「OpenClaw 生態(tài)實踐」專題，將聚焦一線實踐與踩坑復(fù)盤，分享企業(yè)如何構(gòu)建私有 Skills、制定安全護欄、搭建審計與回放機制、建立質(zhì)量 / 效率指標體系，最終把自托管 Agent 從可用的 Demo 升級為可靠的生產(chǎn)系統(tǒng)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.