![]()
新智元報(bào)道
編輯:KingHZ
【新智元導(dǎo)讀】從「緩存蒸發(fā)」到「12倍成本爆炸」,Claude智商一降再降。Anthropic辯解「不是懲罰是架構(gòu)耦合」,但數(shù)據(jù)不會(huì)說謊:2月高效緩存讓用戶爽翻,3月靜默回退后人人喊貴。這場(chǎng)隱私與性能的拉鋸戰(zhàn),只有用戶是真正的輸家?
就在4月13日,一條推文在開發(fā)者群體中炸鍋。
開發(fā)者Can Vardar甩出一句:
Claude Code居然因?yàn)槟汴P(guān)閉遙測(cè)而懲罰你?
關(guān)閉它,Anthropic就把緩存從1小時(shí)砍到5分鐘,隱私讓你多付12倍性能代價(jià)……我沒看錯(cuò)吧?
![]()
轉(zhuǎn)發(fā)量瞬間破萬。
這不是Bug,這是Anthropic用隱私換性能的隱形懲罰。
你以為關(guān)掉數(shù)據(jù)收集只是保護(hù)自己?
錯(cuò)!Claude Code直接把你的長(zhǎng)上下文會(huì)話打回原形。Pro用戶5小時(shí)只剩2條prompt,月付200刀的Max訂閱者1.5小時(shí)就把額度燒光。
![]()
瘋狂。太瘋狂了。
Claude一降再降!
從「緩存蒸發(fā)」到「12倍成本爆炸」
事實(shí)擺在眼前。
開發(fā)者們發(fā)現(xiàn),只要在環(huán)境變量里加一句DISABLE_TELEMETRY=1,Claude Code的prompt cache TTL就從1小時(shí)瞬間回退到5分鐘。
數(shù)據(jù)就在這里,緩存直接縮水了12倍。
GitHub里,Claude Code用戶貼出真實(shí)日志:開啟telemetry時(shí),ephemeral_1h_input_tokens輕松破3萬;一關(guān)telemetry,1h直接歸零,全走5m緩存。同一段代碼,緩存miss率直接飆12倍。
![]()
大上下文會(huì)話中,緩存就是命脈。
當(dāng)你啟用提示詞緩存發(fā)請(qǐng)求時(shí),系統(tǒng)先檢查:從你指定的緩存分隔點(diǎn)往前的提示詞開頭部分,是不是最近請(qǐng)求里已經(jīng)被存過。
如果命中緩存,直接調(diào)用現(xiàn)成版本,時(shí)間和成本瞬間砍掉大半。
沒命中?那就完整處理整個(gè)提示詞,然后在生成回復(fù)那一刻,把開頭部分塞進(jìn)緩存。
而緩存一旦過期,系統(tǒng)就得全量重建,寫入成本是讀取的12.5倍。5分鐘的TTL意味著你稍微停下來想個(gè)思路、泡杯咖啡,回來就是一次全量重建。
更狠的還在后面。
另一位開發(fā)者Sean Swanson貼出了更扎實(shí)的證據(jù)。
他分析了從2026年1月11日到4月11日的119,866次API調(diào)用日志,清晰地展示了緩存策略的變遷軌跡:
2月,1小時(shí)TTL全面生效,緩存浪費(fèi)率僅1.1%;
3月6日前后,系統(tǒng)靜默回退到5分鐘TTL,浪費(fèi)率飆升至25.9%。
結(jié)果呢?同一會(huì)話里,cache_create操作頻率暴增5-12倍。
![]()
cache_create寫成本更高,5m寫1.25倍base input,1h寫2倍,但頻繁重建讓總token消耗直接起飛。
![]()
Pro用戶哭了:以前一天輕松跑滿,現(xiàn)在1.5小時(shí)就見底。Max計(jì)劃200刀/月,修兩個(gè)bug、寫個(gè)計(jì)劃,就把額度干到零。
![]()
![]()
企業(yè)團(tuán)隊(duì)更慘。
Hacker News上有人說,3月底后Claude性能「肉眼可見下滑」,長(zhǎng)會(huì)話動(dòng)不動(dòng)就卡,token額度下降像開了閘的水。
![]()
4月13日,國(guó)外科技媒體報(bào)道更直接:《Anthropic在削弱Claude嗎?》
![]()
Anthropic的辯護(hù)
不是懲罰,是管道斷了
面對(duì)排山倒海的質(zhì)疑,Anthropic的回應(yīng)來自兩個(gè)關(guān)鍵人物。
Claude Code的創(chuàng)造者Boris Cherny親自在回帖。
他承認(rèn)遙測(cè)關(guān)閉確實(shí)會(huì)導(dǎo)致experiment gates失效,使緩存回退到5分鐘默認(rèn)值。
機(jī)制拆開看,其實(shí)就一句話:
1小時(shí)緩存是「實(shí)驗(yàn)性」優(yōu)化,通過客戶端experiment gates推送。只有telemetry開著,gates才能拉取最新策略。
但他強(qiáng)調(diào)這不是刻意的懲罰,而是架構(gòu)設(shè)計(jì)中的耦合問題。
Cherny同時(shí)解釋了緩存策略的設(shè)計(jì)邏輯:Anthropic在后臺(tái)持續(xù)測(cè)試不同的緩存策略組合,目標(biāo)是優(yōu)化整體的緩存命中率、Token消耗和延遲表現(xiàn)。
![]()
你一關(guān)telemetry,客戶端直接讀默認(rèn)值——5分鐘。
不是惡意,是「技術(shù)副作用」。
5分鐘緩存在某些場(chǎng)景下確實(shí)更經(jīng)濟(jì)——比如子智能體(subagent)調(diào)用,這類請(qǐng)求通常是一次性的,緩存很少被重復(fù)讀取,用1小時(shí)TTL反而浪費(fèi)了2倍的寫入成本。
不過,他也承認(rèn):「大量技能(skills)、多個(gè)Agent或后臺(tái)自動(dòng)化任務(wù)同時(shí)運(yùn)行,token消耗確實(shí)大,特別是在使用大量插件時(shí)。」
令人驚訝的是,受影響的用戶數(shù)量相當(dāng)大,Anthropic正在改進(jìn):
(a) 優(yōu)化UX,讓用戶更清楚地看到這些情況;
(b) 更智能地截?cái)唷⒓糁驼{(diào)度非主任務(wù),避免意外的token消耗。
![]()
Anthropic另一位工程師、Bun運(yùn)行時(shí)的創(chuàng)造者Jarred Sumner則回應(yīng)了3月的TTL回退問題。
他認(rèn)為5分鐘TTL對(duì)整體而言「更便宜而不是更貴」,因?yàn)椤赶喈?dāng)一部分Claude Code請(qǐng)求是一次性調(diào)用,緩存上下文只用一次就不再訪問」。
![]()
坦白講,這個(gè)解釋在技術(shù)層面說得通,但用戶不買賬。
問題在于,Swanson的數(shù)據(jù)直接打了臉:2月份1小時(shí)TTL下的浪費(fèi)率只有1.1%,如果大多數(shù)請(qǐng)求真的是一次性的,那2月應(yīng)該出現(xiàn)大量寫入浪費(fèi)才對(duì)。
![]()
真正的行業(yè)問題
AI的Token計(jì)價(jià)是一個(gè)黑箱
把視角拉遠(yuǎn)一點(diǎn),這不僅僅是Anthropic一家公司的問題。
目前,AI編碼工具的按使用量計(jì)費(fèi)純粹是一種信任考驗(yàn)。
開發(fā)者看不到計(jì)費(fèi)表的跳動(dòng),無法審計(jì)每個(gè)請(qǐng)求的Token用量,無法驗(yàn)證緩存狀態(tài),無法確認(rèn)應(yīng)用了哪個(gè)定價(jià)層級(jí),也無法檢查高峰期倍數(shù)因子是否生效。
![]()
與其他開發(fā)者付費(fèi)使用的基礎(chǔ)設(shè)施對(duì)比一下:
AWS EC2:按秒計(jì)費(fèi),完整的實(shí)例可見性,CloudWatch指標(biāo),賬單警報(bào),成本分析工具
Stripe:按交易計(jì)費(fèi),每筆費(fèi)用都有日志記錄且可審計(jì),實(shí)時(shí)儀表盤
Vercel:按調(diào)用計(jì)費(fèi),函數(shù)級(jí)指標(biāo),支出限額,自動(dòng)警報(bào)
Claude Code:按Token計(jì)費(fèi),無單次請(qǐng)求的用量明細(xì),無緩存命中可見性,無支出警報(bào),無實(shí)時(shí)成本跟蹤
這種信息不對(duì)稱令人震驚。在這個(gè)價(jià)格區(qū)間內(nèi)的所有其他開發(fā)者工具,都能讓用戶詳細(xì)了解他們支付的費(fèi)用。而AI編程助手給用戶的,只是一個(gè)限額進(jìn)度條和一聲祈禱。
這種不對(duì)稱在平時(shí)有利于服務(wù)提供商,一旦出現(xiàn)問題,就會(huì)給用戶帶來毀滅性打擊。
AI計(jì)費(fèi)沒有第三方審計(jì),沒有Token用量報(bào)告的開源標(biāo)準(zhǔn),也沒有針對(duì)提示詞經(jīng)濟(jì)學(xué)的云端成本分析工具。
這不是一個(gè)計(jì)費(fèi)模式,這是一場(chǎng)把別人的錢包綁在自己身上的信任盲跳。
參考資料:
https://x.com/icanvardar/status/2043652025339023845
https://github.com/anthropics/claude-code/issues/45381
https://x.com/bcherny/status/2043715713551212834
https://platform.claude.com/docs/en/build-with-claude/prompt-caching#pricing
https://www.theregister.com/2026/04/13/claude_code_cache_confusion/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.