
“大模型成本每年降 10 倍”這句咒語,救不了你的 AI 付費(fèi)訂閱。
本文編譯自 Hacking News 熱榜文章《tokens are getting more expensive》。
作者 | Ethan Ding
編譯 | 王啟隆
出品丨AI 科技大本營(ID:rgznai100)
想象一下,你開了家 AI 公司,心里清楚得很:用戶最多只肯掏 20 美元一個(gè)月。
行,你心想,這不就是風(fēng)投圈的經(jīng)典劇本嘛——先虧本賺吆喝,用利潤換增長。你也把什么獲客成本、用戶終身價(jià)值之類的黑話算得明明白白。
但好戲登場了:你肯定看過那張刷屏的 a16z 神圖,說大模型的成本正以每年 10 倍的速度跳水。
![]()
于是你盤算著:今年我 20 美元/月能打平,等明年模型便宜 10 倍,Boom!90% 的利潤率到手。虧損只是暫時(shí)的,盈利是必然的。
這套算盤,簡單到剛?cè)胄械耐顿Y經(jīng)理都能一眼看懂:
第一年:20 美元/月,勉強(qiáng)收支平衡。
第二年:算力成本降 10 倍,利潤率飆到 90%。
第三年:可以開始挑游艇了。
這策略聽著沒毛病:“大模型推理成本每半年降 3 倍,我們死不了。”
然而 18 個(gè)月過去了,利潤率還是負(fù)得觸目驚心……有些公司已經(jīng)倒閉清算,連 Anthropic(Claude 的公司)本周都不得不撤回了他們最初那個(gè)“200 美元/月不限量”的旗艦套餐。
所有公司,依舊在流血。
模型的確變便宜了——GPT-3.5 的價(jià)格只有過去的十分之一。但不知怎的,利潤反而更差了。
事情不對勁了,對吧?
![]()
沒人想要昨天的報(bào)紙
GPT-3.5 是便宜了 10 倍。但它現(xiàn)在的吸引力,就像在 iPhone 15 發(fā)布會(huì)現(xiàn)場兜售諾基亞。
當(dāng)一個(gè)新模型頂著“地表最強(qiáng)”(SOTA)的光環(huán)發(fā)布時(shí),99% 的需求會(huì)瞬間涌向它。用戶對他們付費(fèi)的產(chǎn)品,也是同樣的期待。
現(xiàn)在,我們來看看那些“地表最強(qiáng)”模型——也就是在任何時(shí)間點(diǎn)都占據(jù) 99% 需求的模型的真實(shí)定價(jià)歷史:
![]()
發(fā)現(xiàn)什么了嗎?
當(dāng) GPT-4 以 60 美元的“天價(jià)”發(fā)布時(shí),盡管上一代王者 GPT-3.5 已經(jīng)便宜了 26 倍,但所有人還是撲向了 GPT-4。
當(dāng) Claude 3 Opus 以同樣的價(jià)格登場時(shí),即便 GPT-4 已經(jīng)降價(jià),人們還是紛紛“叛逃”。
所謂的“成本下降 10 倍”是真的,但僅限于那些跟“小霸王學(xué)習(xí)機(jī)”一個(gè)年代感的舊模型。
所以,“成本會(huì)下降”這個(gè)策略的第一個(gè)支柱就塌了:市場的需求永遠(yuǎn)只追逐“當(dāng)下最好的那款模型”。而最好的模型,價(jià)格永遠(yuǎn)都差不多,因?yàn)樗痛砹私裉祉敿馑懔λ苓_(dá)到的成本極限。
這就像指著一輛 95 年的老本田說“這車現(xiàn)在真便宜!”,完全沒抓住重點(diǎn)。是,那輛特定的車是便宜了。但 2025 款的豐田凱美瑞,建議零售價(jià)還是 3 萬美元。
當(dāng)你花時(shí)間與一個(gè) AI 相處時(shí)——無論是編程、寫作還是思考——你總是本能地追求最高質(zhì)量。沒人會(huì)打開 Claude 然后想:“要不……我換個(gè)爛點(diǎn)的版本,幫老板省點(diǎn)錢?”
我們是認(rèn)知上的“貪婪”生物。我們想要能搞到手的最好的“大腦”,尤其是在天平的另一端是我們自己寶貴的時(shí)間。
![]()
模型的“胃口”,比我們想的要大得多
“好吧,那也還能接受,對吧?我們永遠(yuǎn)保持收支平衡不就行了?”
呵,少年,你還是太天真了。
雖然每一代頂尖模型的“單價(jià)”(per token)沒有變得更貴,但另一件更可怕的事情發(fā)生了。
它們消耗的“算力單位”(token)數(shù)量,發(fā)生了核爆炸。
過去,你問 ChatGPT 一個(gè)問題,它回你一句話。現(xiàn)在,一個(gè)“深度研究”任務(wù),它會(huì)花 3 分鐘做計(jì)劃,20 分鐘閱讀資料,再花 5 分鐘為你重寫報(bào)告。而最新的 Claude 3 Opus,你跟它說句“你好”,它都能自己“思考”上 20 分鐘。
模型的進(jìn)化,帶來了一個(gè)誰也沒預(yù)料到的結(jié)果:AI 能完成的任務(wù)的“長度”,每六個(gè)月就翻一番。過去返回 1000 個(gè) token 的任務(wù),現(xiàn)在能返回 10 萬個(gè)。
![]()
把這個(gè)趨勢推演下去,數(shù)學(xué)模型會(huì)變得相當(dāng)瘋狂:
今天,一個(gè) 20 分鐘的“深度研究”任務(wù)成本大約是 1 美元。到 2027 年,我們將擁有可以連續(xù)運(yùn)行 24 小時(shí)而“不掉線”的智能體(Agent)……再結(jié)合頂尖模型那雷打不動(dòng)的價(jià)格?
這意味著,一個(gè)用戶,一天,光是一個(gè)任務(wù),就要花掉 72 美元。而且,你還能同時(shí)開好幾個(gè)。
一旦我們能部署這種可以異步運(yùn)行 24 小時(shí)的智能體,我們就不會(huì)只給它一個(gè)指令然后傻等。我們會(huì)成批地下達(dá)任務(wù)。整個(gè)“AI 工人大軍”會(huì)并行解決問題,燒起 token 來,就像燒柴火一樣。
顯而易見——我必須強(qiáng)調(diào)這一點(diǎn)——每月 20 美元的訂閱費(fèi),連一個(gè)用戶每天跑一次 1 美元的“深度研究”任務(wù)都撐不住。但這恰恰是我們正在狂奔的方向。模型能力的每一次提升,都意味著它們能有意義地、在同一時(shí)間消耗掉更多算力。
這就像你費(fèi)老大勁兒,造了個(gè)更省油的發(fā)動(dòng)機(jī),結(jié)果轉(zhuǎn)頭就用它去驅(qū)動(dòng)一輛巨無霸卡車。沒錯(cuò),每加侖油是能跑更遠(yuǎn)了,但你現(xiàn)在要用掉比以前多 50 倍的油。
這就是那個(gè)把無數(shù) AI 公司逼入絕境的“成本陷阱”——任何采用“固定月費(fèi) + 高強(qiáng)度算力消耗”商業(yè)模式的創(chuàng)業(yè)公司,都感覺自己正被人用槍指著腦袋。
![]()
Anthropic 的悲壯嘗試
Claude那個(gè)“不限量”套餐的實(shí)驗(yàn),是我們見過應(yīng)對這場風(fēng)暴的最精妙嘗試。他們幾乎用盡了所有招數(shù),但最終還是被碾得粉碎。
他們的劇本,說實(shí)話非常聰明:
定 10 倍的價(jià)格:別人收 20 美元,我收 200 美元/月。給自己留足流血前的緩沖墊。
根據(jù)負(fù)載自動(dòng)切換模型:任務(wù)重的時(shí)候,從昂貴的 Opus 切換到便宜的 Sonnet;讀資料這種小事,就用最便宜的 Haiku。這就像給大腦裝了個(gè)自動(dòng)降頻省電的開關(guān)。
把計(jì)算任務(wù)甩給用戶的電腦:既然用戶的 CPU 閑著也是閑著,干嘛要花錢用我自己的服務(wù)器?
盡管有這么多天才的工程設(shè)計(jì),token 的消耗量還是如超新星爆發(fā)一般。
![]()
一百億個(gè) tokens。一個(gè)月。
這相當(dāng)于一個(gè)人在一個(gè)月里讀了 125 萬遍《戰(zhàn)爭與和平》。
怎么做到的?即便是連續(xù)跑 10-20 分鐘的任務(wù),怎么能消耗掉這么多?
事實(shí)證明,10-20 分鐘的連續(xù)運(yùn)行,剛好足夠讓用戶發(fā)現(xiàn)“for 循環(huán)”的妙用。一旦 token 的消耗與用戶在屏幕前的時(shí)間脫鉤,物理定律就開始接管一切了。
讓 Claude 執(zhí)行一個(gè)任務(wù),檢查自己的工作,重構(gòu),優(yōu)化,再來一遍……直到公司破產(chǎn)。
用戶在一夜之間,從聊天者變成了 API 的指揮官,在 Anthropic 的服務(wù)器上 7x24 小時(shí)地跑著代碼轉(zhuǎn)換引擎。從聊天到智能體(Agent)的進(jìn)化,一夜之間就完成了。消耗量暴增 1000 倍。這不是漸變,是相變。
所以 Anthropic 撤回了“不限量”。他們本可以試試 2000 美元/月,但教訓(xùn)不在于他們收費(fèi)不夠高,而在于:
在這個(gè)新世界里,任何訂閱制的“固定價(jià)格”,都無法承載“不限量”的使用。
這盤數(shù),已經(jīng)從根本上算不通了。
![]()
所有人的“囚徒困境”
這就把其他所有人都推到了一個(gè)絕境。
每家 AI 公司都知道,按使用量計(jì)費(fèi)能救命。他們也知道,這會(huì)要了他們的命。當(dāng)你老老實(shí)實(shí)地按 $0.01/1k tokens 收費(fèi)時(shí),你那被風(fēng)投喂飽的競爭對手,正用 20 美元/月“不限量”的口號(hào)搶走你所有用戶。
猜猜用戶會(huì)去哪?
經(jīng)典的囚徒困境:
所有人都按量計(jì)費(fèi)→ 行業(yè)可持續(xù)發(fā)展
所有人都包月→ 一起卷向深淵
你按量,別人包月→ 你一個(gè)人先死
你包月,別人按量→ 你贏了(然后晚點(diǎn)再死)
所以,每個(gè)人都選擇了“背叛”。每個(gè)人都在補(bǔ)貼那些“超級(jí)用戶”。每個(gè)人都在畫著那條漂亮的“曲棍球桿式”增長曲線。每個(gè)人也最終都會(huì)發(fā)布那篇“關(guān)于定價(jià)的重要更新”的公告。
那些頭部的 AI 編程公司,他們都懂這筆賬。他們選擇了要今天的增長,明天的利潤,以及未來的破產(chǎn)——但那是下一任 CEO 要頭疼的事。
說實(shí)話?這可能是對的。在圈地運(yùn)動(dòng)中,市場份額比利潤率更重要。只要 VC 們還愿意繼續(xù)開支票來掩蓋這糟糕的單位經(jīng)濟(jì)模型……
不信?去問問 Jasper(曾經(jīng)的 AI 寫作獨(dú)角獸),當(dāng)音樂停止時(shí)會(huì)發(fā)生什么。
![]()
如何逃離這場“死亡擠壓”?
難道就真的無路可逃了嗎?
有三 條路可走:
1. 從第一天起就按使用量計(jì)費(fèi)
沒有補(bǔ)貼,沒有“先圈人后變現(xiàn)”,只有誠實(shí)的經(jīng)濟(jì)模型。理論上很美。
但現(xiàn)實(shí)是,你找一個(gè)正在爆發(fā)式增長的、面向消費(fèi)者的、按量計(jì)費(fèi)的 AI 公司給我看看?消費(fèi)者討厭計(jì)價(jià)器。他們寧愿為“無限”多付錢,也不愿收到一張意料之外的賬單。所有成功的消費(fèi)者訂閱服務(wù)——Netflix、Spotify、ChatGPT——都是固定費(fèi)率。計(jì)價(jià)器一開,增長就死。
2. 用超高的“轉(zhuǎn)換成本”來鎖定高利潤
這就是 Devin(那個(gè)爆火的 AI 程序員)正在賭的。他們最近宣布了與花旗和高盛的合作,向這兩家公司的數(shù)萬名軟件工程師部署 Devin。
問個(gè)問題:你寧愿從高盛那里拿到 1000 萬美元的年收入,還是從 50 萬個(gè)開發(fā)者那里拿到 5 億美元?
答案顯而易見:那 1000 萬美元意味著長達(dá)六個(gè)月的部署、合規(guī)審查、安全審計(jì)和采購地獄。這種合同極難贏得——但一旦贏了,就幾乎不可能流失。
當(dāng)競爭對手出現(xiàn)時(shí),你已經(jīng)深深地嵌入了對方的官僚體系中,換掉你的成本高到讓 CFO 寧愿去死。因?yàn)檗D(zhuǎn)換成本足夠高,客戶對價(jià)格也就不那么敏感了,這才能帶來 80-90% 的驚人利潤。
3. 垂直整合:在基礎(chǔ)設(shè)施上賺錢
這是 Replit 的玩法:把 AI 編程助手和應(yīng)用托管、數(shù)據(jù)庫管理、部署監(jiān)控等服務(wù)打包在一起。我在每個(gè) token 上都虧錢,但我從新一代開發(fā)者使用的其他所有服務(wù)層上把錢賺回來。
![]()
把 AI 當(dāng)作“鉤子”,用來拉動(dòng)其他能跟 AWS 競爭的服務(wù)的消費(fèi)。你賣的不是 AI 算力,你賣的是算力之外的一切。AI 只是你的市場營銷費(fèi)用。
這招的絕妙之處在于,代碼生成天然地會(huì)創(chuàng)造對托管、數(shù)據(jù)庫、監(jiān)控的需求。讓 OpenAI 和 Anthropic 去把 AI 算力的價(jià)格卷到零吧,你擁有了除此之外的一切。
至于那些還在玩“固定費(fèi)率、不惜一切代價(jià)增長”游戲的公司?
他們是行尸走肉。只是葬禮定在了今年第四季度,而且會(huì)辦得非常風(fēng)光。
![]()
前路何方
我總能看到創(chuàng)始人們指著那句“明年的模型會(huì)便宜 10 倍!”的口號(hào),仿佛抓住了救命稻草。
是啊,沒錯(cuò)。
但你的用戶,會(huì)對它有 20 倍的期待。
終點(diǎn)線,正在以比你奔跑更快的速度遠(yuǎn)離你。
即使是像 Anthropic 這樣擁有全球最頂級(jí)應(yīng)用層的公司,也無法讓“固定月費(fèi)+不限量使用”的模式運(yùn)轉(zhuǎn)下去。
雖然“早起的鳥兒有蟲吃”這句老話沒錯(cuò),但如果你只是起得早,卻沒有任何計(jì)劃,那你也只是第一個(gè)趕到墓地而已。
這個(gè)世界,不會(huì)再有谷歌開出 24 億美元的支票來收購一個(gè)負(fù)利潤的公司了。當(dāng)你的云服務(wù)賬單已經(jīng)超過了你的總收入時(shí),根本不存在“以后再想辦法”這回事。
那么,在這個(gè)世界里,你到底該如何建立一家公司?
答案,或許是成為一個(gè)“新云商”(Neocloud)——但這是后話了。
不過,至少,明年的模型,確實(shí)會(huì)便宜 10 倍的。:)
原文鏈接:
https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed
(投稿或?qū)で髨?bào)道:zhanghy@csdn.net)
AI 產(chǎn)品爆發(fā),但你的痛點(diǎn)解決了嗎?
2025 全球產(chǎn)品經(jīng)理大會(huì)
8 月 15–16 日
北京·威斯汀酒店
互聯(lián)網(wǎng)大廠、AI 創(chuàng)業(yè)公司、ToB/ToC 實(shí)戰(zhàn)一線的產(chǎn)品人
12 大專題分享,洞察趨勢、拆解路徑、對話未來。
立即掃碼領(lǐng)取大會(huì)PPT
搶占 AI 產(chǎn)品下一波紅利
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.