<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Token的成本下降10倍,但大模型公司卻離盈利越來越遠

      0
      分享至

      這篇文章的作者Ethan Ding,系統性地闡明了如今正在AI行業發生的一個“詭異”現象:雖然Token的單位成本下降了,但是由于AI能做的事越來越多,越來越被更多的人自動化地執行更大的任務, Token的消耗爆炸了,大模型公司的虧損率都在不斷提高。

      不過,這對經歷過多次互聯網補貼大戰的中國用戶來說,卻也遠不算什么新鮮事了:業務發展越來越紅火,虧損額度越來越大,公司估值節節走高,直到......

      未來,大語言模型的單位成本,也許還會一次又一次地便宜10倍,但AI付費訂閱服務依然會被榨干。


      token可以理解為詞元,在大模型里,token 是分詞器把文本切分后的最小處理/計費單位,它可能是一個字、一個詞或一個標點。模型的上下文長度、生成長度、速度與費用,都按token計量。

      但是,要注意它不直接等同于“字”或“詞”,拆分規則要由具體分詞器決定。

      如若要了解token和大語言模型的具體工作原理,可參考這篇:

      如下為《ai subscriptions get short squeezed》的正文,enjoy,歡迎點贊、轉發和收藏。

      想象一下:你創立了一家公司,但你心里清楚,消費者每月最多只愿意付20美金(如今大部分AI大模型服務的月費價格)。

      沒關系,你心想,典型的VC打法——按成本價收費,為增長犧牲利潤率,CAC、LTV 之類的賬,你也都算過了。

      不過接下來就有意思了,你看過 a16z 的那張圖,顯示 LLM 的成本每年下降 10 倍。


      于是你心里盤算,今天每月20美金,可以做到收支平衡,等模型明年成本降低10 倍:砰的一下,利潤率就有 90% 了。

      虧損只是暫時的,利潤終將到來!

      這個策略,簡單到連 VC 公司新人都能懂

      • 第一年:每月20美金 實現收支平衡

      • 第二年:算力成本降低 10 倍,利潤率達到 90%

      • 第三年:買個豪華大游艇!

      這個策略,確實也說得通,因為大家都在念叨:“大模型推理的成本,每 6 個月就降至原來的三分之一,我們會沒事的。”

      但是,18個月后,你的利潤率依然負得不能再負。

      Windsurf 公司最終被拆解變賣,Claude Code 本周(25年8月初)也不得不下架了后來推出的每月200 美元但不限量的套餐。

      公司們仍在持續流血。

      模型確實更便宜了,GPT-3.5 的調用費用,已經只有原來的十分之一。但不知為何,利潤率反而更糟了。

      這是不是有哪里不對?

      一、沒人想要前天的報紙

      GPT-3.5 現在雖然便宜了 10 倍,但它的吸引力也和在 iPhone 發布會上亮相的翻蓋手機一樣低。

      當一款新模型作為 SOTA 問世時,99% 的用戶需求會立刻轉向它,消費者對所有產品都是這么做的。

      現在來看看那些前沿模型的實際定價歷史,也就是任何時候都占據 99%用戶需求的那些模型:


      看看上圖,發現什么了嗎?

      當 GPT-4 以 $60 的價格推出時,盡管 GPT-3.5(之前的SOTA)便宜 26 倍,所有人還是一窩蜂地改用 GPT-4。

      當 Claude 3 Opus 以 $60 推出時,哪怕 GPT-4 已經降價,人們還是轉向了 Claude 3 Opus。

      10 倍降成本確實存在,但體現在上一代的模型上。

      所以,這就是“成本會下降”戰略站不住腳的第一個原因:市場對“最好的語言模型”有需求,就是這么簡單。

      然而,最好的模型價格始終都差不多貴,因為那代表了當下推理所需的最大成本。

      當你和 AI 相處時——無論是在編程、寫作還是思考——你總是追求最高的質量。

      沒有人會打開 Claude 想:“嗯,要不我用那個老版本幫老板省點錢。”

      我們在認知上都是貪婪的生物,想要能獲得的最強大腦,特別是當我們拿自己的寶貴時間去換取它的時候。

      二、Tokens的消耗,比我們想象中還要多

      “好吧,但這仍然可控,對吧?我們就一直保持收支平衡不就行了?”

      哎,天真的孩子

      的確,每一代前沿模型的單個Token 成本,確實也沒有變貴。

      然而,出現更糟糕的情況:模型消耗的 Token 數量,呈現了爆炸式增長

      以前,ChatGPT 對一句話的問題,只回復一句話。

      現在,Deep Research模式要花 3 分鐘來規劃,20 分鐘來閱讀,再用 5 分鐘為你重寫一份報告。

      推理階段計算量的激增,導致了一個誰也沒預料到的結果:AI 能夠完成的單次任務長度,每六個月翻一番。

      過去返回1000 個 Token 的任務,現在返回10萬個。

      當你把趨勢往后推算,數字瘋狂得離譜。

      目前,一次 20分鐘的“深度研究”運行成本大約是1美金。

      到了 2027 年,我們將有 Agent 可以連續運行 24 小時,而不丟失上下文,再考慮前沿模型的單價并未下降,那就是一次運行要燒掉72美金。

      也就是每位用戶每天72美金,而且用戶還可以同時并行運行多個這樣的任務。

      一旦我們能部署 Agent 異步執行連續 24 小時的任務,我們就不會再一次只給它一條指令然后等反饋了。

      我們會批量調度它們,整個 AI 艦隊們并行地攻克問題,燒起Token來就跟不要錢似的。

      顯然,這一點怎么強調都不為過:每月20美金的付費訂閱,連支撐一個用戶每天跑一次成本1美金的深度研究模式都做不到。

      但,這恰恰是我們正在面對的局面。

      模型能力每提高一次,都意味著它們一次能夠有效利用的算力上限又升高了。

      這就像造出了一臺更省油的發動機,然后用省下的油去造了一輛巨型卡車。

      沒錯,你每加侖油是能跑得更遠了,但你也會一次燒掉 50 倍的油。

      這種局面,逼得Windsurf 不得不賣身,任何采用“固定費用套餐 + 高強度 Token 消耗”模式的創業公司,如今都正處于槍口之下。

      三、Anthropic奮力應對這場逼空

      Claude Code 推出的Max-Unlimited套餐,可以說是我們見過的、為抵御這場風暴所做的最精密嘗試。然而,他們用盡了一切招數,但最后仍然被擊潰了。

      他們的策略確實很巧妙:

      1、價格定高 10 倍:當 Cursor 收 $20/月 時,它定 $200/月。先留出更大的緩沖區,好讓出血開始前能多撐一陣子;

      2、按負載自動切換模型:負載高時就從 Opus 模型($75/百萬 Token)切換到 Sonnet 模型($15/百萬),閱讀時用 Haiku 模型優化。

      就像 AWS 的彈性擴容,只不過更加用在“刀刃”上。

      他們肯定把這種行為,直接寫進了模型權重里。這是一種范式轉變,后面我們大概率會更常見到。

      3、把計算量轉給用戶的機器:如果用戶的 CPU 都閑著,為什么還要自己開沙箱sandboxes呢?

      盡管用了這些高明的工程手段,Token的消耗仍然像超新星一樣爆炸了


      排名第一的用戶,消耗了100億個 Token,相當于在一個月里輸出了1.25萬本《戰爭與和平》的內容。

      怎么做到的?就算每次連續運行 10 分鐘,一個用戶又怎么能燒掉 100 億個Token呢?

      結果發現,連續運行 10~20 分鐘,剛好足夠卡詩“for loop”的妙用。

      一旦將 Token 消耗與用戶在應用中的時間解耦decouple,物理規律就接管了一切:把 Claude 丟去執行一個任務,讓它自己檢查結果、重構、優化,如此循環,直到破產為止。

      用戶變成了 API 編排者,在 Anthropic 買單的情況下,7×24 小時地運行代碼轉換引擎。

      從聊天到 Agent 的演化,一夜之間就發生了,消耗量暴增了 1000 倍。

      這是一次相變,而不是漸變。

      于是, Anthropic 下架了無限量套餐。

      他們本可以嘗試每月2000美金的訂價,但教訓不在于價格夠不夠高,而在于在這個新世界中,無論哪種訂閱模式,都不可能撐得起無限使用。

      換言之,在這個新環境下,不存在行得通的固定訂閱價。

      這筆賬已經從根本上算不平了

      四、其他人的囚徒困境
      這讓其他所有公司都陷入了一個進退兩難的處境。
      每家AI公司都知道按用量計費(而不是固定價格),就能救自己,但他們也知道那么做會要了自己的命。
      你在老老實實按 $0.01/1000Token收費,你那靠風投資金支持的競爭對手卻提供每月只需$20的無限量套餐。
      用戶會選誰,還用猜嗎?

      典型的囚徒困境:

      • 大家都按用量收費 → 行業可持續發展

      • 大家都按包月收費 → 一起卷到死

      • 你按用量收,別人包月 → 你先死

      • 你包月收,別人按用量 → 你贏了,但遲早也得死

      結果就是,人人都選擇了背叛。

      大家都去補貼重度用戶,所有人都在曬高斜率的增長曲線,但最終大家都不得不發布“重要定價更新”的公告。

      Cursor、Lovable、Replit,他們心里都清楚賬怎么回事。他們選擇了今天先拼增長、明天再談盈利,最終難免破產,但那是下任 CEO 才要操心的問題。

      老實說,也許他們最終是對的。

      在跑馬圈地階段,市場份額確實比利潤率更重要。只要 VC 們還在不斷掏錢,填補單位經濟的虧空。

      但去問問 Jasper,當音樂停止時會發生什么吧。

      五、避免死局?
      難道真的有辦法,避免這場“死局”嗎?
      據傳,Cognition 最近正以150 億美元估值融資,而它對外公布的 ARR ,還不到1 億美元(我猜也就 5000 萬左右)。
      對比之下,Cursor 在 ARR5 億美元時,融到了100 億美元的估值,增長曲線要陡峭得多。
      前者收入不到后者的八分之一,估值卻達到了后者的三分之二。
      風投們知道關于 Cognition 的什么秘密,是我們所不知道的嗎?兩家公司做的都是寫代碼的 AI Agent。
      難道 Cognition 找到了擺脫死亡螺旋的辦法?

      從邏輯上看,避開死局有三條出路:

      1、從第一天起就按使用量計費

      不補貼用戶,不搞「先拉用戶、以后再變現」,而是老老實實按經濟賬來,理論上這聽上去很不錯。

      可是,有按量計費且大獲成功的面向消費者的 AI 公司嗎?

      消費者討厭分段計費!

      他們寧愿多花錢買不限量,也不想事后收到賬單時被嚇一跳。

      每一家成功的 to C 訂閱服務——Netflix、Spotify、ChatGPT——用的都是統一套餐。

      你只要一加上計量表,增長立馬死掉。

      2、極高的切換成本 ,然后帶來高利潤率

      Devin 正是all in在這條路上。

      他們最近宣布了和花旗銀行及高盛的合作:在每家讓 4 萬名軟件工程師上手 Devin。按每人每月20美金算,這是個年收入近1000萬美金的項目。

      但問題來了:你是愿意有來自高盛的1000萬美金的ARR,還是愿意有來自發燒級開發者們的5億美金ARR?

      答案顯而易見:6 個月的部署實施、合規審核、安全審計、采購地獄……這意味著拿下高盛的單子非常困難,雖然一旦拿下,就幾乎不可能被撼動。只有當銀行里那個拍板的人,把自己的聲譽都押在你身上時,你才能簽下這些合同。而簽了約后,每個人都會想方設法把項目做成。

      這也是為什么在超大規模云廠商之外,最大的那些軟件公司全都是賣比如 CRM/ERP/EHR等系統的,它們面向的正是這些客戶。這類公司通常能做到 80-90% 的利潤率,因為客戶越是不容易走,你的買家對價格就越不敏感。

      當競爭對手趕到時,你已經在客戶的體系中扎根很深,想切換得再耗一個 6 個月的銷售周期。他們并非走不了,而是你客戶的 CFO寧死也不想再經歷一次選擇過程了。

      3、垂直整合,靠基礎架構賺錢

      這是 Replit 的游戲:把編碼 Agent 和應用托管、數據庫管理、部署監控、日志等打包提供。

      每個 Token 都在虧錢,但你在這代新開發者的技術棧中每一層其他地方都攫取了價值,以下是 Replit 是如何做到高度垂直整合的。


      把 AI 虧本賣,然后引流,來帶動那些與 AWS 競爭的服務消費。你賣的不是推理本身,你賣的是其余的一切,而推理部分只是營銷開支。

      絕妙之處在于,代碼生成,自然而然會催生托管的需求。

      每個應用都需要運行的地方,每個數據庫都需要維護,每次部署都需要監控。

      就讓 OpenAI 和 Anthropic 去把推理價格卷到歸零吧,而你擁有其余所有部分。

      那些還在玩“固定套餐、不計成本增長”的公司,都是行尸走肉,它們不過是把昂貴的葬禮安排在了第四季度而已。

      六、前路和未來

      我總是看到一些創始人,指望著“模型明年會便宜 10 倍”,把它當成救命稻草。

      沒錯,模型會更便宜,但你的用戶會期待它們多干出 20 倍的活。

      Cursor 對Windsurf 損益的壓力,讓他們找不到脫身之策。

      就連擁有地球上最垂直整合應用層的 Anthropic ,也無法讓無限量的固定訂閱模式跑通。

      雖然我常說,先發制人勝過策略聰明being early beats being smart,但是,如果只是搶先,卻沒有計劃,也意味著你只是第一個進墓地的人。

      如今,不會有 Google 給負利潤業務開出 24 億美元的支票。

      當“以后再說”意味著你的AWS 賬單已經比營收還高時,也就沒什么“以后再說”的余地了。

      完。

      歡迎關注、收藏和分享,點贊代表催稿下一篇,嘻嘻,之后我會發布黃仁勛出道以來推薦過的書,這位老哥非常神奇,現年62歲、創業32年的他,似乎一共只推薦過7本書,但是本本經典,敬請期待。)

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      史無前例!WNBA情侶狀元同隊,達拉斯飛翼連摘兩屆狀元引爆籃壇!

      史無前例!WNBA情侶狀元同隊,達拉斯飛翼連摘兩屆狀元引爆籃壇!

      田先生籃球
      2026-04-14 08:52:57
      特朗普“罕見承認”政治后果

      特朗普“罕見承認”政治后果

      陸棄
      2026-04-14 08:50:03
      迪拜富豪來中國旅游一個月,回國感嘆:中東與中國差距真的太大了

      迪拜富豪來中國旅游一個月,回國感嘆:中東與中國差距真的太大了

      千秋文化
      2026-04-11 20:15:45
      還沒解決伊朗,美國已經暴露真實意圖:打算用48架F35給中國添堵

      還沒解決伊朗,美國已經暴露真實意圖:打算用48架F35給中國添堵

      空天力量
      2026-04-14 17:58:20
      59歲王志文已準備好了后事,一切從簡,骨灰回歸自然,遺憾公開!

      59歲王志文已準備好了后事,一切從簡,骨灰回歸自然,遺憾公開!

      翰飛觀事
      2026-04-13 22:14:07
      43歲英超名帥官宣離任 率隊客勝阿森納+12輪不敗 2大豪門或成下家

      43歲英超名帥官宣離任 率隊客勝阿森納+12輪不敗 2大豪門或成下家

      我愛英超
      2026-04-14 21:49:43
      莫氏雞煲拒收溫氏千只雞,老莫:沒地放,沒罵他;溫氏股份:在溝通更多合作想法

      莫氏雞煲拒收溫氏千只雞,老莫:沒地放,沒罵他;溫氏股份:在溝通更多合作想法

      界面新聞
      2026-04-14 10:23:03
      詹姆斯:終于不用打該死的附加賽了,我可以喝喝小酒坐那看比賽

      詹姆斯:終于不用打該死的附加賽了,我可以喝喝小酒坐那看比賽

      懂球帝
      2026-04-15 04:47:12
      深圳比亞迪火災后續:官方通報定調,知情人透露起火現場更多細節

      深圳比亞迪火災后續:官方通報定調,知情人透露起火現場更多細節

      奇思妙想草葉君
      2026-04-14 19:30:57
      裘德·洛花1個月變成普京,新片預告片里連眼神都換了

      裘德·洛花1個月變成普京,新片預告片里連眼神都換了

      影視情報室
      2026-04-14 08:05:09
      鴻蒙五界3月銷量啞火,問界獨大,四界陪跑,華為難救二線車企?

      鴻蒙五界3月銷量啞火,問界獨大,四界陪跑,華為難救二線車企?

      王新喜
      2026-04-14 19:49:11
      喬致庸臨終告誡后人:一個家族想要富過三代,秘訣只有三個字

      喬致庸臨終告誡后人:一個家族想要富過三代,秘訣只有三個字

      千秋文化
      2026-03-28 21:09:01
      52歲樸樹近況:無兒無女,沒錢沒房,成了要錢不要命的“瘋子”

      52歲樸樹近況:無兒無女,沒錢沒房,成了要錢不要命的“瘋子”

      流云隨風去遠方
      2026-04-14 12:22:59
      回京第2天,馬筱梅崩潰大哭,自曝家丑,婆婆張蘭大別墅沒她房間

      回京第2天,馬筱梅崩潰大哭,自曝家丑,婆婆張蘭大別墅沒她房間

      阿纂看事
      2026-04-14 14:39:50
      從282群的錄屏看,就是陳某汐!網友:全紅嬋說活著就好,我悟了

      從282群的錄屏看,就是陳某汐!網友:全紅嬋說活著就好,我悟了

      開成運動會
      2026-04-14 18:32:59
      風向變了?馬科斯時代恐結束,小杜特就職后,菲總統決定放手一搏

      風向變了?馬科斯時代恐結束,小杜特就職后,菲總統決定放手一搏

      面包夾知識
      2026-04-14 14:17:34
      5月1日起反腐新規正式落地!普通人送禮、幫忙、牽線全踩紅線

      5月1日起反腐新規正式落地!普通人送禮、幫忙、牽線全踩紅線

      最新聲音
      2026-04-13 21:34:22
      快手搜索人員調整:王毅離職,程稷李宣平接任

      快手搜索人員調整:王毅離職,程稷李宣平接任

      申媽的朋友圈
      2026-04-13 11:09:18
      “五一”假期航班被大批取消,主要涉及東南亞、大洋洲航線

      “五一”假期航班被大批取消,主要涉及東南亞、大洋洲航線

      南方都市報
      2026-04-14 22:36:07
      明道曬2歲女兒正臉照,手長腳長顏值像爸,一家定居上海生活富足

      明道曬2歲女兒正臉照,手長腳長顏值像爸,一家定居上海生活富足

      往史過眼云煙
      2026-04-14 19:41:44
      2026-04-15 10:36:49
      柳胖胖 incentive-icons
      柳胖胖
      36氪、虎嗅、鈦媒體專欄作者
      222文章數 387關注度
      往期回顧 全部

      科技要聞

      手機無死角上網?亞馬遜砸百億硬剛馬斯克

      頭條要聞

      遼寧車牌號帶8888奔馳疑作為陪葬品下葬 當地再發聲

      頭條要聞

      遼寧車牌號帶8888奔馳疑作為陪葬品下葬 當地再發聲

      體育要聞

      帶出中超最大黑馬!他讓球迷們“排隊道歉”

      娛樂要聞

      曾志偉辦73歲生日派對,逾百藝人到場

      財經要聞

      特朗普稱美國對伊朗的戰爭已經結束

      汽車要聞

      2026廣汽科技日有哪些看點?

      態度原創

      家居
      健康
      時尚
      游戲
      房產

      家居要聞

      簡而不減 暖居之道

      干細胞抗衰4大誤區,90%的人都中招

      壞事做盡的瘋女人,集體翻紅了

      《潛行者2》更新上線 即將開啟神秘Lab X18之門

      房產要聞

      改善標桿,1.5w+起橫掃國興!海口樓市,打出最猛一張牌!

      無障礙瀏覽 進入關懷版