拿舊地圖,找不到新大陸
過去幾個月,這個感覺越來越強。互聯網時代的 DAU、SaaS、注意力經濟、免費增長、從工具到平臺的三級火箭,這些詞匯構成了過去十年所有人的認知底座,當然...這里不包括「對齊顆粒度」這種莫名其妙的黑話
而現在,底座在松動。包括我自己在內,很多人可能還在用上一局的思路去理解這一局的變化
很巧合的,這幾天許多好朋友也在思考這個問題,比如這個是橘子的:,我們之間的觀點,大致上是一樣的,但也有許多不同,畢竟...現在并沒有形成共識
然后...md 這貨又改名了:橘子汽水鋪->有機大橘子->Agent橘
先說一個具體的事:今天,GLM-5 開源,非常領先
其實,上周 OpenRouter 上匿名出現的 Pony Alpha 就是 GLM-5,我也是第一批內測用戶
拿到模型之后做的第一件事,是跑了一個 Minecraft 的工程任務。兩個小時,5000 萬個 Token,205k 的游戲文件
MineCraft:GLM 版
另一個朋友則完全做出了一個足以上線 Steam 的游戲
游戲:逃離千禧年
簡單說一下 GLM-5:Opus 4.5 級別的開源模型,744B 參數,激活 40B,Coding 對齊 Claude Opus 4.5,Artificial Analysis 全球前五、開源第一,MIT License
GLM-5 在 Artificial Analysis 的榜單成績
同一周,DeepSeek V4 進入灰度,MiniMax 發了 M2.5,再往前幾天字節放了 Seedance 2.0。這一輪中國 AI 公司的模型,都很硬
直到昨天晚上,智譜才正式對外開放 API,就想著...要不要做一個展示性的網頁...
![]()
https://showcase.z.ai/
沒錯,GLM 官方的這個 ShowCase 網頁是我做的,昨天用 GLM-5 Vibe Coding 出來的,用 AI 給 AI 做發布會...
做完上面這些之后,第一個念頭:
GLM,以及各種頭部模型,一定會漲價
在一個 AI Infra 的小群里聊,很多朋友每天的 Token 消耗量已經是十億級別的。大家達成了一個共識:
要多準備一些手機號,開始囤 GLM 的 Coding Plan 了,尤其是最大規格的
Claude 已經漲了。Opus 4.6 超過 200K 上下文之后輸入 、 輸 出 37.5,還推了 Fast 模式,2.5 倍速度 5 倍價格
漲價這件事,會蔓延到所有頂級模型:
Token 補貼大戰,即將結束
但 GLM-5 開源這件事的真正影響,不在于又多了一個強模型
在于 Opus 級別的能力,第一次以 MIT License 的方式對全世界開放。任何人、任何 Agent 都可以無限制地調用。全球 Agentic 的市場規模,會因此擴大至少兩個數量級
而當 Agent 的數量和調用量出現這種級別的躍遷,過去所有關于成本、定價、增長的假設,都得重新算
以下是最近一直在琢磨的九個判斷,每一條都跟當下的「共識」反著來
不一定全對,甚至全部都不對,僅一家之言
一、免費模式已死
互聯網時代,免費是最強的增長策略。邏輯很簡單:軟件的邊際成本趨近于零,多一個用戶幾乎不花錢,用戶越多,廣告越值錢,網絡效應越強
AI 產品的成本結構完全不同。每多一個用戶,就多消耗一份推理算力。用戶越多,燒錢越快。ChatGPT 的日活過億,OpenAI 的虧損也過億
DAU 從資產變成了負債
ChatGPT 開始用廣告邏輯擴張了。Claude 擺明態度:產品里永遠不會有廣告。兩條路,兩種判斷。免費 + 廣告這條路在 AI 時代能不能走通,還沒有人驗證過。但推理成本擺在那里,每一個免費用戶都在燒錢
貼錢換規模的窗口期快關了,行業會轉向追求為 Token 付費的用戶
二、Token 降價是假象
所有人都在慶祝 Token 單價下降。但沒人算過總賬
2022 年,一個帶搜索的復雜對話,消耗大約 3K Token。上周跑的那個 Minecraft 工程任務,兩個小時,5000 萬。從 3K 到 5000 萬,漲了一萬多倍
更關鍵的:對話任務不一定要用頂級模型,中等的就夠了。但工程任務不行,所有人都在拿最貴最強的模型去跑。消耗量在爆炸的同時,消耗的還都是最貴那一檔
單價降了,賬單炸了
包括我自己在內,用量也在按月翻倍。降價給人帶來的安全感,正在被消耗量的增速吃掉
GLM-5 開源之后,這個趨勢會加速。當 Opus 級別的模型免費可用,跑工程任務的人會從幾萬變成幾百萬。單價降到零了,但全球的 Token 總消耗量會炸
三、Token 不會一直便宜
很多人拿手機流量做類比。3G、4G 到 5G,流量單價一直在降,Token 也會一路降下去
但手機流量的使用者是人。人的數量有上限,每個人每天刷手機的時間也有上限。需求增長有天花板,供給擴容追得上
Token 的使用者正在變成 Agent。一個人可以同時跑 10 個、100 個 Agent,每個 Agent 每天調用外部接口幾千幾萬次。Agent 還會調用 Agent。需求增長沒有天花板
人的需求有頂,Agent 的需求沒有
當需求增速超過算力增速,頭部的 Token 就會漲價。拐點什么時候來不確定,但方向確定
四、規模效應反轉了
互聯網時代,公司越大越有優勢。網絡效應、規模經濟、品牌壁壘,都跟體量正相關
但仔細看一家公司的人員結構。有多少人在做「上傳下達」?寫周報、寫公文、做匯報材料、把老板的想法翻譯成執行方案、再把執行結果翻譯成老板能看的 PPT
這些崗位的本質是信息轉譯。而信息轉譯,恰好是 AI 最擅長的事
未來一家公司只需要三種人:做判斷的、做交付的、以及去解決 AI 在現實世界里搞不定的事的。中間那一大層「信息中轉站」,會被 Agent 吃掉
人多不再是優勢,人多是成本
過去看到「5000 人團隊」會覺得壁壘高。現在應該想一想:這 5000 人里,有多少會在兩年內被 Agent 替掉
對應著這次的 GLM-5,作為國產模型,能任何一個小團隊都能拿它去做工程交付。以前 10 個人干不了的事,現在 2 個人 + 一個頂級開源模型就能搞定。大公司的人數壁壘,正在被模型能力抹平
五、面向 Agent 的界面還沒有被建好
最終的人機交付還是得看 UI。而且 UI 對 AI 來說反而簡單,直接生成就好了,現在已經能做得很好
真正缺的是面向 Agent 的那一層
面向人的界面是屏幕上的按鈕和頁面。面向 Agent 的界面是文檔和 API
但現在的文檔和 API,全是給人看的。自然語言寫的說明、給人類工程師讀的 README、手動配置的鑒權流程。Agent 需要的是能直接解析、直接執行的結構化描述
更麻煩的是,各家產品自成生態,文檔格式不統一,API 規范各不相同。Agent 要調用十個服務,就得適配十套完全不同的接口。這一層的基礎設施嚴重缺失
MCP 和更早的 OpenAI Plugin 開了第一道口子。之前做過一個嘗試:讓 AI 去改 GitHub 上的 .md 和 README,改完之后 AI 能自動識別項目、自動部署。方向對了,但遠遠不夠
給 Agent 建一套統一的文檔和接口標準,是下一個基礎設施級的機會
這件事跟十年前做移動端適配一樣緊迫。但目前幾乎沒人在系統性地推。這里順道 echo 一下我之前的一個工作:給 AutoGLM 寫了一份「給 Claude Code 看的文檔」
六、AI 教育的窗口期極短
現在教人怎么寫 Prompt、怎么用 AI 工具,市場很熱,課賣得也好
但培訓 AI 使用 AI 的 ROI,遠高于培訓人使用 AI。教一個人學會用 Claude Code,要一周。讓一個 Agent 學會調用另一個 Agent,要幾分鐘
規模化效率的差距太大了。當企業發現與其花錢培訓員工用 AI,不如直接讓 AI 自己學自己用,這個市場就會迅速萎縮
教人用 AI 的生意,窗口可能只有一兩年
包括我自己在做的一些內容,可能也在這個窗口里。這一波紅利來得快,走得也會快
七、融資邏輯變了
過去 VC 看一家公司,第一個數字是 DAU,第二個是增長率,第三個是留存。這套框架跑了二十年
AI 時代應該看另外兩個數字:每天消耗多少 Token,每個 Token 能產生多少收入
一家公司日消耗 10 億 Token,每百萬 Token 產生 50 塊錢收入,商業模型就是成立的。反過來,DAU 好看但 Token 變現效率低,燒得越多虧得越多
Token 消耗曲線和變現效率,比 DAU 重要一百倍
整個評估體系的切換還需要時間。但先想清楚的人,會先找到好標的
八、產品競爭的終局變了
過去做產品,核心是搶用戶心智。讓用戶記住你、打開你、依賴你
Agent 時代,產品的核心客戶正在從人變成 Agent。你的產品能不能被 Agent 發現,能不能被 Agent 順暢調用,用了之后會不會被設為默認
讓 Agent 第一時間找到你,用了就不換
互聯網時代做 SEO 是讓人搜到你。Agent 時代做 SEO 是讓 AI 選擇你
那些還需要聯系銷售才能開通的產品,在 Agent 時代會很被動。Agent 不會打電話給銷售團隊,不會填表單,不會等三個工作日。調不通,就等于不存在
GLM-5 發布的時候,官方適配了 OpenClaw,發布當天就掛上了 Skills。這個動作本身就說明了方向:即便是模型廠商如智譜,也要先占上位置,讓 Agent 能找到
九、最終只有兩種企業
這些判斷匯到最后,指向一個很簡單的分法
能讓 Token 產生正 ROI 的企業,會越來越強。更多 Token 產生更好的結果,更好的結果產生更多的收入,更多的收入買得起更多的 Token。正循環一旦轉起來,差距只會越來越大
Token ROI 為負的企業,每燒一個 Token 都在虧錢
沒有中間地帶
GLM-5 開源,從道理上,把入場券的價格打到了零。但項目能不能活下來,取決于 Token 的 ROI(至少得把電費賺回來)。門檻降了,淘汰賽反而更殘酷
包括我自己在內,也在反復想:目前做的事情,Token 的 ROI 到底是正的還是負的
最后
這九條,很多還沒完全想清楚。有些可能半年后就被證偽
但有一件事越來越確定:過去十年建立的那套認知框架,正在整體性地失效。包括我自己,手里大概率也攥著上一局的牌
舊思考每多固化一天,新機會就多溜走一天
接下來會很有趣
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.