<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      AI 的「成本」,正在把所有人都拖下水

      0
      分享至


      “大模型成本每年降 10 倍”這句咒語,救不了你的 AI 付費(fèi)訂閱。

      本文編譯自 Hacking News 熱榜文章《tokens are getting more expensive》。

      作者 | Ethan Ding

      編譯 | 王啟隆

      出品丨AI 科技大本營(ID:rgznai100)

      想象一下,你開了家 AI 公司,心里清楚得很:用戶最多只肯掏 20 美元一個(gè)月。

      行,你心想,這不就是風(fēng)投圈的經(jīng)典劇本嘛——先虧本賺吆喝,用利潤換增長。你也把什么獲客成本、用戶終身價(jià)值之類的黑話算得明明白白。

      但好戲登場了:你肯定看過那張刷屏的 a16z 神圖,說大模型的成本正以每年 10 倍的速度跳水。


      于是你盤算著:今年我 20 美元/月能打平,等明年模型便宜 10 倍,Boom!90% 的利潤率到手。虧損只是暫時(shí)的,盈利是必然的。

      這套算盤,簡單到剛?cè)胄械耐顿Y經(jīng)理都能一眼看懂:

      • 第一年:20 美元/月,勉強(qiáng)收支平衡。

      • 第二年:算力成本降 10 倍,利潤率飆到 90%。

      • 第三年:可以開始挑游艇了。

      這策略聽著沒毛病:“大模型推理成本每半年降 3 倍,我們死不了。”

      然而 18 個(gè)月過去了,利潤率還是負(fù)得觸目驚心……有些公司已經(jīng)倒閉清算,連 Anthropic(Claude 的公司)本周都不得不撤回了他們最初那個(gè)“200 美元/月不限量”的旗艦套餐。

      所有公司,依舊在流血。

      模型的確變便宜了——GPT-3.5 的價(jià)格只有過去的十分之一。但不知怎的,利潤反而更差了。

      事情不對勁了,對吧?


      沒人想要昨天的報(bào)紙

      GPT-3.5 是便宜了 10 倍。但它現(xiàn)在的吸引力,就像在 iPhone 15 發(fā)布會(huì)現(xiàn)場兜售諾基亞

      當(dāng)一個(gè)新模型頂著“地表最強(qiáng)”(SOTA)的光環(huán)發(fā)布時(shí),99% 的需求會(huì)瞬間涌向它。用戶對他們付費(fèi)的產(chǎn)品,也是同樣的期待。

      現(xiàn)在,我們來看看那些“地表最強(qiáng)”模型——也就是在任何時(shí)間點(diǎn)都占據(jù) 99% 需求的模型的真實(shí)定價(jià)歷史:


      發(fā)現(xiàn)什么了嗎?

      當(dāng) GPT-4 以 60 美元的“天價(jià)”發(fā)布時(shí),盡管上一代王者 GPT-3.5 已經(jīng)便宜了 26 倍,但所有人還是撲向了 GPT-4。

      當(dāng) Claude 3 Opus 以同樣的價(jià)格登場時(shí),即便 GPT-4 已經(jīng)降價(jià),人們還是紛紛“叛逃”。

      所謂的“成本下降 10 倍”是真的,但僅限于那些跟“小霸王學(xué)習(xí)機(jī)”一個(gè)年代感的舊模型。

      所以,“成本會(huì)下降”這個(gè)策略的第一個(gè)支柱就塌了:市場的需求永遠(yuǎn)只追逐“當(dāng)下最好的那款模型”。而最好的模型,價(jià)格永遠(yuǎn)都差不多,因?yàn)樗痛砹私裉祉敿馑懔λ苓_(dá)到的成本極限。

      這就像指著一輛 95 年的老本田說“這車現(xiàn)在真便宜!”,完全沒抓住重點(diǎn)。是,那輛特定的車是便宜了。但 2025 款的豐田凱美瑞,建議零售價(jià)還是 3 萬美元。

      當(dāng)你花時(shí)間與一個(gè) AI 相處時(shí)——無論是編程、寫作還是思考——你總是本能地追求最高質(zhì)量。沒人會(huì)打開 Claude 然后想:“要不……我換個(gè)爛點(diǎn)的版本,幫老板省點(diǎn)錢?”

      我們是認(rèn)知上的“貪婪”生物。我們想要能搞到手的最好的“大腦”,尤其是在天平的另一端是我們自己寶貴的時(shí)間。


      模型的“胃口”,比我們想的要大得多

      “好吧,那也還能接受,對吧?我們永遠(yuǎn)保持收支平衡不就行了?”

      呵,少年,你還是太天真了。

      雖然每一代頂尖模型的“單價(jià)”(per token)沒有變得更貴,但另一件更可怕的事情發(fā)生了。

      它們消耗的“算力單位”(token)數(shù)量,發(fā)生了核爆炸。

      過去,你問 ChatGPT 一個(gè)問題,它回你一句話。現(xiàn)在,一個(gè)“深度研究”任務(wù),它會(huì)花 3 分鐘做計(jì)劃,20 分鐘閱讀資料,再花 5 分鐘為你重寫報(bào)告。而最新的 Claude 3 Opus,你跟它說句“你好”,它都能自己“思考”上 20 分鐘。

      模型的進(jìn)化,帶來了一個(gè)誰也沒預(yù)料到的結(jié)果:AI 能完成的任務(wù)的“長度”,每六個(gè)月就翻一番。過去返回 1000 個(gè) token 的任務(wù),現(xiàn)在能返回 10 萬個(gè)。


      把這個(gè)趨勢推演下去,數(shù)學(xué)模型會(huì)變得相當(dāng)瘋狂:

      今天,一個(gè) 20 分鐘的“深度研究”任務(wù)成本大約是 1 美元。到 2027 年,我們將擁有可以連續(xù)運(yùn)行 24 小時(shí)而“不掉線”的智能體(Agent)……再結(jié)合頂尖模型那雷打不動(dòng)的價(jià)格?

      這意味著,一個(gè)用戶,一天,光是一個(gè)任務(wù),就要花掉 72 美元。而且,你還能同時(shí)開好幾個(gè)。

      一旦我們能部署這種可以異步運(yùn)行 24 小時(shí)的智能體,我們就不會(huì)只給它一個(gè)指令然后傻等。我們會(huì)成批地下達(dá)任務(wù)。整個(gè)“AI 工人大軍”會(huì)并行解決問題,燒起 token 來,就像燒柴火一樣。

      顯而易見——我必須強(qiáng)調(diào)這一點(diǎn)——每月 20 美元的訂閱費(fèi),連一個(gè)用戶每天跑一次 1 美元的“深度研究”任務(wù)都撐不住。但這恰恰是我們正在狂奔的方向。模型能力的每一次提升,都意味著它們能有意義地、在同一時(shí)間消耗掉更多算力。

      這就像你費(fèi)老大勁兒,造了個(gè)更省油的發(fā)動(dòng)機(jī),結(jié)果轉(zhuǎn)頭就用它去驅(qū)動(dòng)一輛巨無霸卡車。沒錯(cuò),每加侖油是能跑更遠(yuǎn)了,但你現(xiàn)在要用掉比以前多 50 倍的油。

      這就是那個(gè)把無數(shù) AI 公司逼入絕境的“成本陷阱”——任何采用“固定月費(fèi) + 高強(qiáng)度算力消耗”商業(yè)模式的創(chuàng)業(yè)公司,都感覺自己正被人用槍指著腦袋。


      Anthropic 的悲壯嘗試

      Claude那個(gè)“不限量”套餐的實(shí)驗(yàn),是我們見過應(yīng)對這場風(fēng)暴的最精妙嘗試。他們幾乎用盡了所有招數(shù),但最終還是被碾得粉碎。

      他們的劇本,說實(shí)話非常聰明:

      1. 定 10 倍的價(jià)格:別人收 20 美元,我收 200 美元/月。給自己留足流血前的緩沖墊。

      2. 根據(jù)負(fù)載自動(dòng)切換模型:任務(wù)重的時(shí)候,從昂貴的 Opus 切換到便宜的 Sonnet;讀資料這種小事,就用最便宜的 Haiku。這就像給大腦裝了個(gè)自動(dòng)降頻省電的開關(guān)。

      3. 把計(jì)算任務(wù)甩給用戶的電腦:既然用戶的 CPU 閑著也是閑著,干嘛要花錢用我自己的服務(wù)器?

      盡管有這么多天才的工程設(shè)計(jì),token 的消耗量還是如超新星爆發(fā)一般。


      一百億個(gè) tokens。一個(gè)月。

      這相當(dāng)于一個(gè)人在一個(gè)月里讀了 125 萬遍《戰(zhàn)爭與和平》。

      怎么做到的?即便是連續(xù)跑 10-20 分鐘的任務(wù),怎么能消耗掉這么多?

      事實(shí)證明,10-20 分鐘的連續(xù)運(yùn)行,剛好足夠讓用戶發(fā)現(xiàn)“for 循環(huán)”的妙用。一旦 token 的消耗與用戶在屏幕前的時(shí)間脫鉤,物理定律就開始接管一切了。

      讓 Claude 執(zhí)行一個(gè)任務(wù),檢查自己的工作,重構(gòu),優(yōu)化,再來一遍……直到公司破產(chǎn)。

      用戶在一夜之間,從聊天者變成了 API 的指揮官,在 Anthropic 的服務(wù)器上 7x24 小時(shí)地跑著代碼轉(zhuǎn)換引擎。從聊天到智能體(Agent)的進(jìn)化,一夜之間就完成了。消耗量暴增 1000 倍。這不是漸變,是相變。

      所以 Anthropic 撤回了“不限量”。他們本可以試試 2000 美元/月,但教訓(xùn)不在于他們收費(fèi)不夠高,而在于:

      在這個(gè)新世界里,任何訂閱制的“固定價(jià)格”,都無法承載“不限量”的使用。

      這盤數(shù),已經(jīng)從根本上算不通了。


      所有人的“囚徒困境”

      這就把其他所有人都推到了一個(gè)絕境。

      每家 AI 公司都知道,按使用量計(jì)費(fèi)能救命。他們也知道,這會(huì)要了他們的命。當(dāng)你老老實(shí)實(shí)地按 $0.01/1k tokens 收費(fèi)時(shí),你那被風(fēng)投喂飽的競爭對手,正用 20 美元/月“不限量”的口號(hào)搶走你所有用戶。

      猜猜用戶會(huì)去哪?

      經(jīng)典的囚徒困境:

      • 所有人都按量計(jì)費(fèi)→ 行業(yè)可持續(xù)發(fā)展

      • 所有人都包月→ 一起卷向深淵

      • 你按量,別人包月→ 你一個(gè)人先死

      • 你包月,別人按量→ 你贏了(然后晚點(diǎn)再死)

      所以,每個(gè)人都選擇了“背叛”。每個(gè)人都在補(bǔ)貼那些“超級(jí)用戶”。每個(gè)人都在畫著那條漂亮的“曲棍球桿式”增長曲線。每個(gè)人也最終都會(huì)發(fā)布那篇“關(guān)于定價(jià)的重要更新”的公告。

      那些頭部的 AI 編程公司,他們都懂這筆賬。他們選擇了要今天的增長,明天的利潤,以及未來的破產(chǎn)——但那是下一任 CEO 要頭疼的事。

      說實(shí)話?這可能是對的。在圈地運(yùn)動(dòng)中,市場份額比利潤率更重要。只要 VC 們還愿意繼續(xù)開支票來掩蓋這糟糕的單位經(jīng)濟(jì)模型……

      不信?去問問 Jasper(曾經(jīng)的 AI 寫作獨(dú)角獸),當(dāng)音樂停止時(shí)會(huì)發(fā)生什么。


      如何逃離這場“死亡擠壓”?

      難道就真的無路可逃了嗎?

      有三 條路可走:

      1. 從第一天起就按使用量計(jì)費(fèi)

      沒有補(bǔ)貼,沒有“先圈人后變現(xiàn)”,只有誠實(shí)的經(jīng)濟(jì)模型。理論上很美。

      但現(xiàn)實(shí)是,你找一個(gè)正在爆發(fā)式增長的、面向消費(fèi)者的、按量計(jì)費(fèi)的 AI 公司給我看看?消費(fèi)者討厭計(jì)價(jià)器。他們寧愿為“無限”多付錢,也不愿收到一張意料之外的賬單。所有成功的消費(fèi)者訂閱服務(wù)——Netflix、Spotify、ChatGPT——都是固定費(fèi)率。計(jì)價(jià)器一開,增長就死。

      2. 用超高的“轉(zhuǎn)換成本”來鎖定高利潤

      這就是 Devin(那個(gè)爆火的 AI 程序員)正在賭的。他們最近宣布了與花旗和高盛的合作,向這兩家公司的數(shù)萬名軟件工程師部署 Devin。

      問個(gè)問題:你寧愿從高盛那里拿到 1000 萬美元的年收入,還是從 50 萬個(gè)開發(fā)者那里拿到 5 億美元?

      答案顯而易見:那 1000 萬美元意味著長達(dá)六個(gè)月的部署、合規(guī)審查、安全審計(jì)和采購地獄。這種合同極難贏得——但一旦贏了,就幾乎不可能流失。

      當(dāng)競爭對手出現(xiàn)時(shí),你已經(jīng)深深地嵌入了對方的官僚體系中,換掉你的成本高到讓 CFO 寧愿去死。因?yàn)檗D(zhuǎn)換成本足夠高,客戶對價(jià)格也就不那么敏感了,這才能帶來 80-90% 的驚人利潤。

      3. 垂直整合:在基礎(chǔ)設(shè)施上賺錢

      這是 Replit 的玩法:把 AI 編程助手和應(yīng)用托管、數(shù)據(jù)庫管理、部署監(jiān)控等服務(wù)打包在一起。我在每個(gè) token 上都虧錢,但我從新一代開發(fā)者使用的其他所有服務(wù)層上把錢賺回來。


      把 AI 當(dāng)作“鉤子”,用來拉動(dòng)其他能跟 AWS 競爭的服務(wù)的消費(fèi)。你賣的不是 AI 算力,你賣的是算力之外的一切。AI 只是你的市場營銷費(fèi)用。

      這招的絕妙之處在于,代碼生成天然地會(huì)創(chuàng)造對托管、數(shù)據(jù)庫、監(jiān)控的需求。讓 OpenAI 和 Anthropic 去把 AI 算力的價(jià)格卷到零吧,你擁有了除此之外的一切。

      至于那些還在玩“固定費(fèi)率、不惜一切代價(jià)增長”游戲的公司?

      他們是行尸走肉。只是葬禮定在了今年第四季度,而且會(huì)辦得非常風(fēng)光。


      前路何方

      我總能看到創(chuàng)始人們指著那句“明年的模型會(huì)便宜 10 倍!”的口號(hào),仿佛抓住了救命稻草。

      是啊,沒錯(cuò)。

      但你的用戶,會(huì)對它有 20 倍的期待。

      終點(diǎn)線,正在以比你奔跑更快的速度遠(yuǎn)離你。

      即使是像 Anthropic 這樣擁有全球最頂級(jí)應(yīng)用層的公司,也無法讓“固定月費(fèi)+不限量使用”的模式運(yùn)轉(zhuǎn)下去。

      雖然“早起的鳥兒有蟲吃”這句老話沒錯(cuò),但如果你只是起得早,卻沒有任何計(jì)劃,那你也只是第一個(gè)趕到墓地而已。

      這個(gè)世界,不會(huì)再有谷歌開出 24 億美元的支票來收購一個(gè)負(fù)利潤的公司了。當(dāng)你的云服務(wù)賬單已經(jīng)超過了你的總收入時(shí),根本不存在“以后再想辦法”這回事。

      那么,在這個(gè)世界里,你到底該如何建立一家公司?

      答案,或許是成為一個(gè)“新云商”(Neocloud)——但這是后話了。

      不過,至少,明年的模型,確實(shí)會(huì)便宜 10 倍的。:)

      原文鏈接:
      https://ethanding.substack.com/p/ai-subscriptions-get-short-squeezed

      (投稿或?qū)で髨?bào)道:zhanghy@csdn.net)

      AI 產(chǎn)品爆發(fā),但你的痛點(diǎn)解決了嗎?

      2025 全球產(chǎn)品經(jīng)理大會(huì)

      8 月 15–16 日

      北京·威斯汀酒店

      互聯(lián)網(wǎng)大廠、AI 創(chuàng)業(yè)公司、ToB/ToC 實(shí)戰(zhàn)一線的產(chǎn)品人

      12 大專題分享,洞察趨勢、拆解路徑、對話未來。

      立即掃碼領(lǐng)取大會(huì)PPT

      搶占 AI 產(chǎn)品下一波紅利

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      17歲男生發(fā)現(xiàn)新物種筷子蛇 直接發(fā)SCI期刊封神

      17歲男生發(fā)現(xiàn)新物種筷子蛇 直接發(fā)SCI期刊封神

      快科技
      2026-03-06 12:37:06
      一舞封神后,被東莞首富收入囊中,如今已是7歲孩子的媽媽

      一舞封神后,被東莞首富收入囊中,如今已是7歲孩子的媽媽

      娛說瑜悅
      2026-03-06 18:13:06
      “不想為以色列賣命”:帝國最后的遮羞布,美式民主終成笑話

      “不想為以色列賣命”:帝國最后的遮羞布,美式民主終成笑話

      怪口歷史的K先生
      2026-03-06 15:22:51
      重力炸彈即將大規(guī)模上場,波斯面臨更大的壓力

      重力炸彈即將大規(guī)模上場,波斯面臨更大的壓力

      高博新視野
      2026-03-06 17:49:29
      四川丈夫哽咽護(hù)妻:母親沒回老家,親戚要求刪視頻,岳母出面硬剛

      四川丈夫哽咽護(hù)妻:母親沒回老家,親戚要求刪視頻,岳母出面硬剛

      離離言幾許
      2026-03-06 19:30:27
      斯里蘭卡將伊朗軍艦上200多名官兵接上岸,總統(tǒng):雖持中立立場,但斯里蘭卡把人道主義放首要位置,將對這艘軍艦展開救援

      斯里蘭卡將伊朗軍艦上200多名官兵接上岸,總統(tǒng):雖持中立立場,但斯里蘭卡把人道主義放首要位置,將對這艘軍艦展開救援

      大象新聞
      2026-03-06 12:47:06
      俄媒:蘇萊曼尼繼任者是內(nèi)鬼,確認(rèn)哈梅內(nèi)伊位置,會(huì)沒開完就溜了

      俄媒:蘇萊曼尼繼任者是內(nèi)鬼,確認(rèn)哈梅內(nèi)伊位置,會(huì)沒開完就溜了

      慕名而來只為你
      2026-03-07 03:01:33
      金價(jià)重現(xiàn)歷史了!要有心理準(zhǔn)備,下月,金價(jià)或?qū)⒅噩F(xiàn)2015年歷史!

      金價(jià)重現(xiàn)歷史了!要有心理準(zhǔn)備,下月,金價(jià)或?qū)⒅噩F(xiàn)2015年歷史!

      牛鍋巴小釩
      2026-03-06 20:23:41
      虎跳峽落水失蹤男子遺體找到 救援人員:打撈工作正在進(jìn)行

      虎跳峽落水失蹤男子遺體找到 救援人員:打撈工作正在進(jìn)行

      紅星新聞
      2026-03-06 18:25:17
      2026中國百強(qiáng)城市指數(shù)榜單發(fā)布!一線城市洗牌,江蘇13市全部入選

      2026中國百強(qiáng)城市指數(shù)榜單發(fā)布!一線城市洗牌,江蘇13市全部入選

      GYbrand
      2026-03-05 22:03:13
      盤錦一人干翻整小區(qū),叔叔蹲守后主力找監(jiān)控,小區(qū)曝光,群里炸鍋

      盤錦一人干翻整小區(qū),叔叔蹲守后主力找監(jiān)控,小區(qū)曝光,群里炸鍋

      奇思妙想草葉君
      2026-03-06 19:05:37
      伊朗軍方稱不會(huì)關(guān)閉霍爾木茲海峽

      伊朗軍方稱不會(huì)關(guān)閉霍爾木茲海峽

      國際在線
      2026-03-07 06:50:02
      李嘉誠再開金口:未來十年,中國近一半家庭,將面臨6大難題?

      李嘉誠再開金口:未來十年,中國近一半家庭,將面臨6大難題?

      巢客HOME
      2026-03-07 00:25:03
      這款伊朗的“窮人巡航導(dǎo)彈”,把美國打心疼了

      這款伊朗的“窮人巡航導(dǎo)彈”,把美國打心疼了

      樞密院十號(hào)
      2026-03-06 21:29:22
      真只死了6個(gè)?曝美軍承包商緊急招聘數(shù)名臨時(shí)工,專門處理陣亡士兵物品

      真只死了6個(gè)?曝美軍承包商緊急招聘數(shù)名臨時(shí)工,專門處理陣亡士兵物品

      不掉線電波
      2026-03-06 10:00:34
      SKP落子珠江新城,廣州頂奢商業(yè)三足鼎立,高端消費(fèi)穩(wěn)了

      SKP落子珠江新城,廣州頂奢商業(yè)三足鼎立,高端消費(fèi)穩(wěn)了

      中國房地產(chǎn)報(bào)官方號(hào)
      2026-03-05 14:16:54
      特朗普,派“蔣介石”上前線?

      特朗普,派“蔣介石”上前線?

      中國新聞周刊
      2026-03-06 15:27:37
      政府報(bào)告三提“休假”背后:一年117天假 為什么中國人還休不夠

      政府報(bào)告三提“休假”背后:一年117天假 為什么中國人還休不夠

      冷觀互聯(lián)網(wǎng)
      2026-03-06 11:48:12
      不是取消!私家車年檢迎來史上最大松綁,車主:這才是真便民

      不是取消!私家車年檢迎來史上最大松綁,車主:這才是真便民

      芭比衣櫥
      2026-03-06 14:06:42
      1979年,張國燾凍死在養(yǎng)老院,許世友:除了主席,沒人是他的對手

      1979年,張國燾凍死在養(yǎng)老院,許世友:除了主席,沒人是他的對手

      文史季季紅
      2026-03-05 13:35:03
      2026-03-07 08:31:00
      AI科技大本營 incentive-icons
      AI科技大本營
      連接AI技術(shù)的創(chuàng)造者和使用者
      2639文章數(shù) 7659關(guān)注度
      往期回顧 全部

      科技要聞

      OpenClaw爆火,六位"養(yǎng)蝦人"自述與AI共生

      頭條要聞

      伊朗大規(guī)模發(fā)射新一代導(dǎo)彈 摧毀美軍大量設(shè)施、裝備

      頭條要聞

      伊朗大規(guī)模發(fā)射新一代導(dǎo)彈 摧毀美軍大量設(shè)施、裝備

      體育要聞

      跑了24年,他終于成為英超“最長的河”

      娛樂要聞

      周杰倫社交媒體曬昆凌,夫妻感情穩(wěn)定

      財(cái)經(jīng)要聞

      關(guān)于經(jīng)濟(jì)、股市等,五部門都說了啥?

      汽車要聞

      逃離ICU,上汽通用“止血”企穩(wěn)

      態(tài)度原創(chuàng)

      健康
      本地
      時(shí)尚
      教育
      公開課

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      本地新聞

      食味印象|一口入魂!康樂烤肉串起千年絲路香

      這些才是適合普通人的穿搭!搭配腰帶、多穿牛仔褲,簡單舒適

      教育要聞

      本科擴(kuò)招10萬人!深度解析戰(zhàn)略布局

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進(jìn)入關(guān)懷版