![]()
出品|虎嗅科技組
作者|宋思杭
編輯|苗正卿
頭圖|月之暗面
還記得2025年春節,全世界都在為DeepSeek狂歡;不出意外,2026年春節大概率也會再次上演類似的場景。
只不過,這一次行業已經有了充分的預判和心理準備。
1月27日,月之暗面重磅發布K2.5模型,而和這家公司的以往模型發布不同的是,這次創始人楊植麟親自為K2.5站臺——在視頻號發布長達4分13秒的視頻。
如果只看模型能力,K2.5 實際上是在K2基礎上的一次能力補齊和體驗升級,并稱不上“驚艷”。
但真正讓這次發布顯得不同尋常的,并不在模型本身,而是楊植麟的親自站臺。
在大模型行業,創始人走到臺前,往往并不是為了講清楚技術細節,而是在一個關鍵時間點,對外釋放信號。當然在楊植麟共4分多鐘的視頻中,他講的全是K2.5的新技術,但這本身也是一個信號。
而這個時間點,本身就很微妙,就在 DeepSeek 新一代模型被普遍認為即將發布的前夜。相比之下,Kimi 2.5 的出現,更像是一種提前落子。月之暗面必須要在DeepSeek發布V4或者R2新模型之前做點什么。這也是為了在更大的變量到來之前,先穩住位置。畢竟,從2025年的結果來看,DeepSeek發布后,月之暗面幾乎是受打擊最大的基座模型公司。
從這個角度看,這次發布,與其說是一場主動進攻,不如說更像一次在春節前完成的防守部署。
K2.5補足了什么?
經歷了 2025 年 DeepSeek 帶來的正面沖擊之后,月之暗面已經完成了全面的方向調整,不僅如此,在K2發布之后,月之暗面也得到了海內外開發者的好評。
和外界仍然習慣把 Kimi 視為“基座模型競爭者”不同,月之暗面在過去一年里,已經明確將重心從單純追逐模型能力上限,轉向編碼能力與 Agent 體系,尤其是面向海外市場的 Agent 產品形態。
但這種轉向在某種程度上來說也是一種現實選擇。因為在基座模型能力加速同質化的背景下,月之暗面需要一條不再完全依賴下一代模型一定更強的生存路徑。
也正是在這個前提下,K2.5 的定位才顯得清晰。
如果放在做最強模型的敘事里,K2.5 并不成立;但如果放在服務新主線的框架中,它更像一次工程性交付。無論是編碼相關能力的強化,還是對 Agent 場景中穩定性、可控性和執行效率的優化,K2.5 的指向性都非常明確,它不是為了證明模型領先,而是為了讓模型更好地支撐 Agent 與編碼這一條已經確定的路線。
換句話說,K2.5 更像是月之暗面在完成戰略轉向之后,對外給出的一個確認信號:月之暗面已經開始持續投入,并能夠在模型層面形成階段性成果。
但與此同時,行業真正關心的,并不只是 K2.5。
在 K2 發布之后,月之暗面其實已經預告 K3 很長時間。一個理想的狀態當然是,在 DeepSeek 推出 V4 或 R2 之前,率先發布 K3。
因為在大模型競爭中,只要能夠搶在對手之前完成代際切換,就能在很大程度上對沖下一次沖擊,至少不會在敘事和注意力層面被完全壓制。
但問題在于,這種理想狀態很難成立。
過去兩三年里,無論是 OpenAI,還是 DeepSeek,主力模型的更新周期幾乎都在一年左右。原因很簡單,當模型規模、訓練成本和系統復雜度不斷上升后,每一次真正意義上的代際躍遷,都需要更長的訓練、驗證和工程周期。這已經成為行業內的共識。
而距離 K2 發布至今,僅僅過去半年。在這樣的時間窗口內,想要交付一個足以被稱為 K3 的模型,這意味著極高的技術與交付風險。
而對于已經把重心放在編碼與 Agent 路線上的月之暗面而言,更不可能為了趕時間點,去犧牲下一代模型的完整性。
于是,現實的局面變得非常清楚:K3 仍然是月之暗面真正的關鍵變量,但它客觀上不可能出現在 DeepSeek 下一次更新之前。
在這個前提下,K2.5 的出現,和楊植麟的親自站臺也是為了,在無法提前交付 K3 的情況下,月之暗面必須先用一次可交付的升級,穩住自身在新路線上的存在感。
月之暗面在焦慮什么?
過去一年,大模型行業已經進入新一輪洗牌期。
智譜和MiniMax已經登陸資本市場,另外兩家百川智能和零一萬物也完成了方向調整,并對外明確了新的選擇;而在尚未上市的陣營中,原本并列的兩家公司里,最近階躍星辰也已經明確押注“AI + 終端”路線。
這意味著,真正仍然以“基座模型公司”自我定位的獨角獸,只剩下月之暗面。
而這背后,是一個更殘酷的現實,基礎模型的故事,已經接近階段性尾聲了。
當前的行業共識正在從“誰能做出最強模型”,轉向“誰能把模型真正用起來”,因此繼續堅持基座模型敘事,反而成了一種更高風險的選擇。
但問題在于,月之暗面并非沒有意識到這一點。它已經在嘗試轉向編碼能力與 Agent,并把重點放在海外市場。但與已經完成上市或路徑切換的同行不同,月之暗面至今仍然無法徹底擺脫對模型本身的依賴。
這正是楊植麟真正焦慮的第一層來源。
一個無法回避的前提是:即便已經上市的大模型公司,也都尚未跑通真正意義上的商業閉環。
大模型究竟該如何規模化商業化,這件事至今沒有標準答案。
而在這樣的背景下,月之暗面的商業結構顯得尤為特殊:它既不依賴 G 端訂單,也沒有以大 B 私有化部署作為主要收入來源;在國內 C 端,商業化路徑同樣尚未成立。目前支撐收入的,仍然主要來自海外市場。
這意味著,在相當長一段時間內,月之暗面的商業模式,本質上仍然高度依賴模型能力本身。
而在這種背景下,一旦模型在能力、成本或擴散速度上被對手顯著拉開,這種沖擊會比對那些已經完成轉型或綁定場景的公司來得更直接。
也正因如此,DeepSeek的下一代模型,對月之暗面而言始終是一個無法回避的變量。
這不是因為月之暗面仍想回到正面硬拼基座模型的戰場,而是因為在現有商業結構下,它還沒有真正擺脫對模型領先性的依賴。
第二層焦慮,則來自轉型路徑本身的驗證壓力。
把重心放在編碼能力與 Agent,尤其是面向海外市場的 Agent,是一次理性的選擇,但這條路徑的最大問題在于,驗證周期極長。
Agent 能否跑通,不取決于一次發布的模型能力,而取決于真實任務、復雜場景和長期使用反饋。
這使得月之暗面在輿論與市場層面,始終處在一種不對稱的位置:DeepSeek可以通過一次模型發布,迅速制造能力躍遷的沖擊;而月之暗面卻只能用更慢、更工程化的方式,去證明自己路線的正確性。
第三層焦慮,則來自 2025 年春節DeepSeek發布后留下的“陰影”。
那一年春節前后,DeepSeek 的發布不僅改變了技術對比,也迅速改寫了行業敘事。對月之暗面而言,那次沖擊的影響并不只體現在能力層面,而是在注意力、信心和位置感上,形成了持續效應。
當時間再次逼近春節節點,當 DeepSeek 的下一代模型被普遍認為即將到來,選擇提前出牌,本身就是一種對歷史經驗的回應。
因此,楊植麟真正的焦慮,并不是 K2.5 能不能在能力上壓過對手,而是在基座模型敘事逐漸退潮、Agent 路線尚未被完全驗證、而下一次外部變量又即將到來之前,月之暗面如何避免再次被推到一個被動的位置。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4830530.html?f=wyxwapp
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.