![]()
出品|虎嗅科技組
作者|宋思杭
編輯|苗正卿
頭圖|月之暗面
還記得2025年春節(jié),全世界都在為DeepSeek狂歡;不出意外,2026年春節(jié)大概率也會再次上演類似的場景。
只不過,這一次行業(yè)已經(jīng)有了充分的預(yù)判和心理準備。
1月27日,月之暗面重磅發(fā)布K2.5模型,而和這家公司的以往模型發(fā)布不同的是,這次創(chuàng)始人楊植麟親自為K2.5站臺——在視頻號發(fā)布長達4分13秒的視頻。
如果只看模型能力,K2.5 實際上是在K2基礎(chǔ)上的一次能力補齊和體驗升級,并稱不上“驚艷”。
但真正讓這次發(fā)布顯得不同尋常的,并不在模型本身,而是楊植麟的親自站臺。
在大模型行業(yè),創(chuàng)始人走到臺前,往往并不是為了講清楚技術(shù)細節(jié),而是在一個關(guān)鍵時間點,對外釋放信號。當然在楊植麟共4分多鐘的視頻中,他講的全是K2.5的新技術(shù),但這本身也是一個信號。
而這個時間點,本身就很微妙,就在 DeepSeek 新一代模型被普遍認為即將發(fā)布的前夜。相比之下,Kimi 2.5 的出現(xiàn),更像是一種提前落子。月之暗面必須要在DeepSeek發(fā)布V4或者R2新模型之前做點什么。這也是為了在更大的變量到來之前,先穩(wěn)住位置。畢竟,從2025年的結(jié)果來看,DeepSeek發(fā)布后,月之暗面幾乎是受打擊最大的基座模型公司。
從這個角度看,這次發(fā)布,與其說是一場主動進攻,不如說更像一次在春節(jié)前完成的防守部署。
K2.5補足了什么?
經(jīng)歷了 2025 年 DeepSeek 帶來的正面沖擊之后,月之暗面已經(jīng)完成了全面的方向調(diào)整,不僅如此,在K2發(fā)布之后,月之暗面也得到了海內(nèi)外開發(fā)者的好評。
和外界仍然習慣把 Kimi 視為“基座模型競爭者”不同,月之暗面在過去一年里,已經(jīng)明確將重心從單純追逐模型能力上限,轉(zhuǎn)向編碼能力與 Agent 體系,尤其是面向海外市場的 Agent 產(chǎn)品形態(tài)。
但這種轉(zhuǎn)向在某種程度上來說也是一種現(xiàn)實選擇。因為在基座模型能力加速同質(zhì)化的背景下,月之暗面需要一條不再完全依賴下一代模型一定更強的生存路徑。
也正是在這個前提下,K2.5 的定位才顯得清晰。
如果放在做最強模型的敘事里,K2.5 并不成立;但如果放在服務(wù)新主線的框架中,它更像一次工程性交付。無論是編碼相關(guān)能力的強化,還是對 Agent 場景中穩(wěn)定性、可控性和執(zhí)行效率的優(yōu)化,K2.5 的指向性都非常明確,它不是為了證明模型領(lǐng)先,而是為了讓模型更好地支撐 Agent 與編碼這一條已經(jīng)確定的路線。
換句話說,K2.5 更像是月之暗面在完成戰(zhàn)略轉(zhuǎn)向之后,對外給出的一個確認信號:月之暗面已經(jīng)開始持續(xù)投入,并能夠在模型層面形成階段性成果。
但與此同時,行業(yè)真正關(guān)心的,并不只是 K2.5。
在 K2 發(fā)布之后,月之暗面其實已經(jīng)預(yù)告 K3 很長時間。一個理想的狀態(tài)當然是,在 DeepSeek 推出 V4 或 R2 之前,率先發(fā)布 K3。
因為在大模型競爭中,只要能夠搶在對手之前完成代際切換,就能在很大程度上對沖下一次沖擊,至少不會在敘事和注意力層面被完全壓制。
但問題在于,這種理想狀態(tài)很難成立。
過去兩三年里,無論是 OpenAI,還是 DeepSeek,主力模型的更新周期幾乎都在一年左右。原因很簡單,當模型規(guī)模、訓練成本和系統(tǒng)復(fù)雜度不斷上升后,每一次真正意義上的代際躍遷,都需要更長的訓練、驗證和工程周期。這已經(jīng)成為行業(yè)內(nèi)的共識。
而距離 K2 發(fā)布至今,僅僅過去半年。在這樣的時間窗口內(nèi),想要交付一個足以被稱為 K3 的模型,這意味著極高的技術(shù)與交付風險。
而對于已經(jīng)把重心放在編碼與 Agent 路線上的月之暗面而言,更不可能為了趕時間點,去犧牲下一代模型的完整性。
于是,現(xiàn)實的局面變得非常清楚:K3 仍然是月之暗面真正的關(guān)鍵變量,但它客觀上不可能出現(xiàn)在 DeepSeek 下一次更新之前。
在這個前提下,K2.5 的出現(xiàn),和楊植麟的親自站臺也是為了,在無法提前交付 K3 的情況下,月之暗面必須先用一次可交付的升級,穩(wěn)住自身在新路線上的存在感。
月之暗面在焦慮什么?
過去一年,大模型行業(yè)已經(jīng)進入新一輪洗牌期。
智譜和MiniMax已經(jīng)登陸資本市場,另外兩家百川智能和零一萬物也完成了方向調(diào)整,并對外明確了新的選擇;而在尚未上市的陣營中,原本并列的兩家公司里,最近階躍星辰也已經(jīng)明確押注“AI + 終端”路線。
這意味著,真正仍然以“基座模型公司”自我定位的獨角獸,只剩下月之暗面。
而這背后,是一個更殘酷的現(xiàn)實,基礎(chǔ)模型的故事,已經(jīng)接近階段性尾聲了。
當前的行業(yè)共識正在從“誰能做出最強模型”,轉(zhuǎn)向“誰能把模型真正用起來”,因此繼續(xù)堅持基座模型敘事,反而成了一種更高風險的選擇。
但問題在于,月之暗面并非沒有意識到這一點。它已經(jīng)在嘗試轉(zhuǎn)向編碼能力與 Agent,并把重點放在海外市場。但與已經(jīng)完成上市或路徑切換的同行不同,月之暗面至今仍然無法徹底擺脫對模型本身的依賴。
這正是楊植麟真正焦慮的第一層來源。
一個無法回避的前提是:即便已經(jīng)上市的大模型公司,也都尚未跑通真正意義上的商業(yè)閉環(huán)。
大模型究竟該如何規(guī)模化商業(yè)化,這件事至今沒有標準答案。
而在這樣的背景下,月之暗面的商業(yè)結(jié)構(gòu)顯得尤為特殊:它既不依賴 G 端訂單,也沒有以大 B 私有化部署作為主要收入來源;在國內(nèi) C 端,商業(yè)化路徑同樣尚未成立。目前支撐收入的,仍然主要來自海外市場。
這意味著,在相當長一段時間內(nèi),月之暗面的商業(yè)模式,本質(zhì)上仍然高度依賴模型能力本身。
而在這種背景下,一旦模型在能力、成本或擴散速度上被對手顯著拉開,這種沖擊會比對那些已經(jīng)完成轉(zhuǎn)型或綁定場景的公司來得更直接。
也正因如此,DeepSeek的下一代模型,對月之暗面而言始終是一個無法回避的變量。
這不是因為月之暗面仍想回到正面硬拼基座模型的戰(zhàn)場,而是因為在現(xiàn)有商業(yè)結(jié)構(gòu)下,它還沒有真正擺脫對模型領(lǐng)先性的依賴。
第二層焦慮,則來自轉(zhuǎn)型路徑本身的驗證壓力。
把重心放在編碼能力與 Agent,尤其是面向海外市場的 Agent,是一次理性的選擇,但這條路徑的最大問題在于,驗證周期極長。
Agent 能否跑通,不取決于一次發(fā)布的模型能力,而取決于真實任務(wù)、復(fù)雜場景和長期使用反饋。
這使得月之暗面在輿論與市場層面,始終處在一種不對稱的位置:DeepSeek可以通過一次模型發(fā)布,迅速制造能力躍遷的沖擊;而月之暗面卻只能用更慢、更工程化的方式,去證明自己路線的正確性。
第三層焦慮,則來自 2025 年春節(jié)DeepSeek發(fā)布后留下的“陰影”。
那一年春節(jié)前后,DeepSeek 的發(fā)布不僅改變了技術(shù)對比,也迅速改寫了行業(yè)敘事。對月之暗面而言,那次沖擊的影響并不只體現(xiàn)在能力層面,而是在注意力、信心和位置感上,形成了持續(xù)效應(yīng)。
當時間再次逼近春節(jié)節(jié)點,當 DeepSeek 的下一代模型被普遍認為即將到來,選擇提前出牌,本身就是一種對歷史經(jīng)驗的回應(yīng)。
因此,楊植麟真正的焦慮,并不是 K2.5 能不能在能力上壓過對手,而是在基座模型敘事逐漸退潮、Agent 路線尚未被完全驗證、而下一次外部變量又即將到來之前,月之暗面如何避免再次被推到一個被動的位置。
本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4830530.html?f=wyxwapp
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.