Agent 時代,我們需要正確的計費和工程設(shè)計哲學(xué),這是 Xiaomi MiMo 大模型負(fù)責(zé)人羅福莉剛剛在 X 上發(fā)表的觀點。
![]()
前兩天,我們報道了——Anthropic 宣布,即日起,Claude Pro 和 Max 訂閱用戶,不得再將訂閱額度用于 OpenClaw 等第三方 Agent 框架。想繼續(xù)用?那就必須切換到按用量付費的 API。這讓很多用訂閱模式玩「龍蝦」的 Claude 用戶瞬間懵了。
Anthropic 官方解釋稱,訂閱制的定價模型原本是基于「個人用戶正常使用強度」設(shè)計的,但 OpenClaw 這類自動化代理工具的使用強度遠(yuǎn)超預(yù)期 —— 有重度用戶每月僅支付 200 刀訂閱費,卻消耗了價值 5000 刀的算力資源,給 Anthropic 帶來巨大成本壓力。
消息一出,各方反應(yīng)不一,有人大呼「被背刺」,覺得訂閱模式瞬間失去了吸引力;也有人拍手叫好,認(rèn)為這是在清理低效使用,保護整個平臺的可持續(xù)性。
無論哪種聲音,核心問題都暴露了出來:現(xiàn)在的 token 計費模式已經(jīng)很難應(yīng)對挑戰(zhàn),我們需要更聰明、更可持續(xù)的算力使用方式。
在帖子中,羅福莉首先指出,Anthropic 的訂閱制本來就是虧本在跑。
Claude Code 的訂閱制是一套設(shè)計精良的算力均衡分配系統(tǒng)。我的判斷是 —— 它大概率不賺錢,甚至可能在虧錢,除非他們的 API 利潤率有 10-20 倍,但我對此存疑。第三方框架接入造成多大虧損,我沒法精確計算,但我近距離看過 OpenClaw 的 context 管理 —— 寫得很差。一個用戶請求之內(nèi),它會觸發(fā)多輪低價值的工具調(diào)用,每次都作為獨立 API 請求發(fā)出,每次都攜帶一個很長的上下文窗口(往往超過 10 萬 token)—— 即便緩存命中,也極度浪費,極端情況下還會拉高其他請求的緩存未命中率。
折算下來,每個用戶請求實際觸發(fā)的 API 調(diào)用次數(shù),是 Claude Code 自身框架的好幾倍。換算成 API 定價,真實成本大概是訂閱價格的幾十倍。這不是差距 —— 這是一個坑。
對于此次訂閱用戶被切斷的陣痛,她認(rèn)為,這次陣痛長期來看是有好處的,會倒逼工程進步。
OpenClaw、OpenCode 這類第三方框架仍然可以通過 API 調(diào)用 Claude,只是不能再搭訂閱的便車了。短期內(nèi),這些 Agent 用戶會很痛 —— 成本輕松跳漲幾十倍。但這種壓力,恰恰是推動這些框架認(rèn)真改進 context 管理、最大化 prompt 緩存命中率以復(fù)用已處理的上下文、削減無效 token 消耗的動力。痛苦終將轉(zhuǎn)化為工程紀(jì)律。
同時,她發(fā)出警告,勸大模型公司別盲目價格戰(zhàn),低價賣 Token 卻放任第三方工具薅羊毛是陷阱。
我想勸大模型廠商們,在沒想清楚如何給 coding 訂閱定價、不至于大出血之前,不要盲目卷到價格底部。把 token 賣得極便宜、同時對第三方框架敞開大門,表面上對用戶友好,實則是個陷阱 ——Anthropic 剛剛從這個陷阱里爬出來。更深的問題在于:如果用戶把時間和精力耗在質(zhì)量低劣的 Agent 框架上、耗在極不穩(wěn)定又慢的推理服務(wù)上、耗在為降本而縮水的模型上,最后發(fā)現(xiàn)還是什么事都做不成 —— 這對用戶體驗和留存都是惡性循環(huán)。
接下來,她還介紹了小米最近推出的 MiMo Token Plan,并強調(diào)她們「追求的是長期穩(wěn)定地交付高質(zhì)量的模型和服務(wù)」。
關(guān)于 MiMo Token Plan—— 它支持第三方框架接入,按 token 配額計費,邏輯和 Claude 新推出的 extra usage 包一致。因為我們追求的是長期穩(wěn)定地交付高質(zhì)量的模型和服務(wù) —— 不是讓你沖動付款,然后棄船而去。
![]()
![]()
她最后指出,當(dāng)前全球算力供給已經(jīng)跟不上 Agent 創(chuàng)造的 token 需求。真正的出路不是更便宜的 token,而是協(xié)同進化 ——「更省 token 的 Agent 框架」 × 「更強大、更高效的模型」。Anthropic 這次的行動,不管他們是否有意為之,都在把整個生態(tài)系統(tǒng) —— 開源和閉源 —— 往這個方向推。這大概是件好事。
對于羅福莉的觀點,開發(fā)者社區(qū)反應(yīng)強烈,并且討論的焦點迅速從「Anthropic 對不對」升級到了幾個更根本的問題:
1、這不是一場定價爭議,而是 AI 經(jīng)濟學(xué)的結(jié)構(gòu)性重寫。
就像羅福莉所說,AI 服務(wù)的單位成本,從來就不是由模型單獨決定的,而是由「模型 × 框架 × context 管理」三者疊加決定。Anthropic 這次行動,無意中對 Agent 框架制造了一次自然選擇壓力。
![]()
更有人直接說:Anthropic 此舉真正傳遞的信號是 —— 編排層才是產(chǎn)品,而不僅僅是模型本身。訂閱制與 API 計費之間的張力,不過是這個更深層邏輯的表面癥狀。
![]()
2、別急著罵定價,先看看算力是怎么被燒掉的。
羅福莉說的「算力浪費」,在從業(yè)者那里得到了強烈共鳴。有人一針見血:這根本不是「AI 太貴」的問題,而是「算力被糟蹋」的問題 —— 粗糙的框架設(shè)計加上龐大的上下文窗口加上不必要的冗余調(diào)用,燒掉的錢換不來任何真實產(chǎn)出。
![]()
更深的洞察來自一位開發(fā)者,他指出:Claude Code 里對 context 的處理決策,從來不是什么默認(rèn)參數(shù),而是對「保留什么、丟棄什么、何時壓縮」反復(fù)推敲后烘焙進架構(gòu)里的判斷力。第三方框架缺的不是功能,是這種內(nèi)置的工程意見。
![]()
另一位開發(fā)者則用自身經(jīng)歷印證了這一點:他上個月花了大量時間清理為客戶搭建的舊編排層里的冗余邏輯,「清理爛攤子,比當(dāng)初搭的時候費力多了」。
![]()
3、市場淘汰已經(jīng)開始,但結(jié)局未定。
羅福莉認(rèn)為成本壓力會倒逼框架進化,但開發(fā)者們提出了一個更殘酷的問題:第三方框架能不能足夠快地把效率差距補上,讓 API 定價在經(jīng)濟上仍然說得過去?還是大多數(shù)用戶發(fā)現(xiàn)成本太慘烈,直接默認(rèn)回到 Claude Code?
![]()
這兩條路通向截然不同的生態(tài)格局。有開發(fā)者補充說:框架開發(fā)者真正需要的,不是「包含在內(nèi)」的接入權(quán),而是清晰可預(yù)期的 token 配額限制 —— 明確的邊界反而會催生更好的產(chǎn)品行為,模糊的灰色地帶只會制造混亂。
![]()
羅福莉這個帖子是一個非常具有前瞻性的技術(shù)演進信號,相關(guān)討論也切中了當(dāng)前 AI 軟件工程的核心痛點。接下來,就看整個市場如何從「粗放燃燒算力」轉(zhuǎn)向「精細(xì)化工程架構(gòu)」了。
文章來源:機器之心。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.