網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

楊植麟為何親自為Kimi站臺？

2026-01-29 06:13:04　來源: 虎嗅APP

北京舉報

分享至

出品｜虎嗅科技組

作者｜宋思杭

編輯｜苗正卿

頭圖｜月之暗面

還記得2025年春節(jié)，全世界都在為DeepSeek狂歡；不出意外，2026年春節(jié)大概率也會再次上演類似的場景。

只不過，這一次行業(yè)已經(jīng)有了充分的預(yù)判和心理準備。

1月27日，月之暗面重磅發(fā)布K2.5模型，而和這家公司的以往模型發(fā)布不同的是，這次創(chuàng)始人楊植麟親自為K2.5站臺——在視頻號發(fā)布長達4分13秒的視頻。

如果只看模型能力，K2.5 實際上是在K2基礎(chǔ)上的一次能力補齊和體驗升級，并稱不上“驚艷”。

但真正讓這次發(fā)布顯得不同尋常的，并不在模型本身，而是楊植麟的親自站臺。

在大模型行業(yè)，創(chuàng)始人走到臺前，往往并不是為了講清楚技術(shù)細節(jié)，而是在一個關(guān)鍵時間點，對外釋放信號。當然在楊植麟共4分多鐘的視頻中，他講的全是K2.5的新技術(shù)，但這本身也是一個信號。

而這個時間點，本身就很微妙，就在 DeepSeek 新一代模型被普遍認為即將發(fā)布的前夜。相比之下，Kimi 2.5 的出現(xiàn)，更像是一種提前落子。月之暗面必須要在DeepSeek發(fā)布V4或者R2新模型之前做點什么。這也是為了在更大的變量到來之前，先穩(wěn)住位置。畢竟，從2025年的結(jié)果來看，DeepSeek發(fā)布后，月之暗面幾乎是受打擊最大的基座模型公司。

從這個角度看，這次發(fā)布，與其說是一場主動進攻，不如說更像一次在春節(jié)前完成的防守部署。

K2.5補足了什么？

經(jīng)歷了 2025 年 DeepSeek 帶來的正面沖擊之后，月之暗面已經(jīng)完成了全面的方向調(diào)整，不僅如此，在K2發(fā)布之后，月之暗面也得到了海內(nèi)外開發(fā)者的好評。

和外界仍然習慣把 Kimi 視為“基座模型競爭者”不同，月之暗面在過去一年里，已經(jīng)明確將重心從單純追逐模型能力上限，轉(zhuǎn)向編碼能力與 Agent 體系，尤其是面向海外市場的 Agent 產(chǎn)品形態(tài)。

但這種轉(zhuǎn)向在某種程度上來說也是一種現(xiàn)實選擇。因為在基座模型能力加速同質(zhì)化的背景下，月之暗面需要一條不再完全依賴下一代模型一定更強的生存路徑。

也正是在這個前提下，K2.5 的定位才顯得清晰。

如果放在做最強模型的敘事里，K2.5 并不成立；但如果放在服務(wù)新主線的框架中，它更像一次工程性交付。無論是編碼相關(guān)能力的強化，還是對 Agent 場景中穩(wěn)定性、可控性和執(zhí)行效率的優(yōu)化，K2.5 的指向性都非常明確，它不是為了證明模型領(lǐng)先，而是為了讓模型更好地支撐 Agent 與編碼這一條已經(jīng)確定的路線。

換句話說，K2.5 更像是月之暗面在完成戰(zhàn)略轉(zhuǎn)向之后，對外給出的一個確認信號：月之暗面已經(jīng)開始持續(xù)投入，并能夠在模型層面形成階段性成果。

但與此同時，行業(yè)真正關(guān)心的，并不只是 K2.5。

在 K2 發(fā)布之后，月之暗面其實已經(jīng)預(yù)告 K3 很長時間。一個理想的狀態(tài)當然是，在 DeepSeek 推出 V4 或 R2 之前，率先發(fā)布 K3。

因為在大模型競爭中，只要能夠搶在對手之前完成代際切換，就能在很大程度上對沖下一次沖擊，至少不會在敘事和注意力層面被完全壓制。

但問題在于，這種理想狀態(tài)很難成立。

過去兩三年里，無論是 OpenAI，還是 DeepSeek，主力模型的更新周期幾乎都在一年左右。原因很簡單，當模型規(guī)模、訓練成本和系統(tǒng)復(fù)雜度不斷上升后，每一次真正意義上的代際躍遷，都需要更長的訓練、驗證和工程周期。這已經(jīng)成為行業(yè)內(nèi)的共識。

而距離 K2 發(fā)布至今，僅僅過去半年。在這樣的時間窗口內(nèi)，想要交付一個足以被稱為 K3 的模型，這意味著極高的技術(shù)與交付風險。

而對于已經(jīng)把重心放在編碼與 Agent 路線上的月之暗面而言，更不可能為了趕時間點，去犧牲下一代模型的完整性。

于是，現(xiàn)實的局面變得非常清楚：K3 仍然是月之暗面真正的關(guān)鍵變量，但它客觀上不可能出現(xiàn)在 DeepSeek 下一次更新之前。

在這個前提下，K2.5 的出現(xiàn)，和楊植麟的親自站臺也是為了，在無法提前交付 K3 的情況下，月之暗面必須先用一次可交付的升級，穩(wěn)住自身在新路線上的存在感。

月之暗面在焦慮什么？

過去一年，大模型行業(yè)已經(jīng)進入新一輪洗牌期。

智譜和MiniMax已經(jīng)登陸資本市場，另外兩家百川智能和零一萬物也完成了方向調(diào)整，并對外明確了新的選擇；而在尚未上市的陣營中，原本并列的兩家公司里，最近階躍星辰也已經(jīng)明確押注“AI + 終端”路線。

這意味著，真正仍然以“基座模型公司”自我定位的獨角獸，只剩下月之暗面。

而這背后，是一個更殘酷的現(xiàn)實，基礎(chǔ)模型的故事，已經(jīng)接近階段性尾聲了。

當前的行業(yè)共識正在從“誰能做出最強模型”，轉(zhuǎn)向“誰能把模型真正用起來”，因此繼續(xù)堅持基座模型敘事，反而成了一種更高風險的選擇。

但問題在于，月之暗面并非沒有意識到這一點。它已經(jīng)在嘗試轉(zhuǎn)向編碼能力與 Agent，并把重點放在海外市場。但與已經(jīng)完成上市或路徑切換的同行不同，月之暗面至今仍然無法徹底擺脫對模型本身的依賴。

這正是楊植麟真正焦慮的第一層來源。

一個無法回避的前提是：即便已經(jīng)上市的大模型公司，也都尚未跑通真正意義上的商業(yè)閉環(huán)。

大模型究竟該如何規(guī)模化商業(yè)化，這件事至今沒有標準答案。

而在這樣的背景下，月之暗面的商業(yè)結(jié)構(gòu)顯得尤為特殊：它既不依賴 G 端訂單，也沒有以大 B 私有化部署作為主要收入來源；在國內(nèi) C 端，商業(yè)化路徑同樣尚未成立。目前支撐收入的，仍然主要來自海外市場。

這意味著，在相當長一段時間內(nèi)，月之暗面的商業(yè)模式，本質(zhì)上仍然高度依賴模型能力本身。

而在這種背景下，一旦模型在能力、成本或擴散速度上被對手顯著拉開，這種沖擊會比對那些已經(jīng)完成轉(zhuǎn)型或綁定場景的公司來得更直接。

也正因如此，DeepSeek的下一代模型，對月之暗面而言始終是一個無法回避的變量。

這不是因為月之暗面仍想回到正面硬拼基座模型的戰(zhàn)場，而是因為在現(xiàn)有商業(yè)結(jié)構(gòu)下，它還沒有真正擺脫對模型領(lǐng)先性的依賴。

第二層焦慮，則來自轉(zhuǎn)型路徑本身的驗證壓力。

把重心放在編碼能力與 Agent，尤其是面向海外市場的 Agent，是一次理性的選擇，但這條路徑的最大問題在于，驗證周期極長。

Agent 能否跑通，不取決于一次發(fā)布的模型能力，而取決于真實任務(wù)、復(fù)雜場景和長期使用反饋。

這使得月之暗面在輿論與市場層面，始終處在一種不對稱的位置：DeepSeek可以通過一次模型發(fā)布，迅速制造能力躍遷的沖擊；而月之暗面卻只能用更慢、更工程化的方式，去證明自己路線的正確性。

第三層焦慮，則來自 2025 年春節(jié)DeepSeek發(fā)布后留下的“陰影”。

那一年春節(jié)前后，DeepSeek 的發(fā)布不僅改變了技術(shù)對比，也迅速改寫了行業(yè)敘事。對月之暗面而言，那次沖擊的影響并不只體現(xiàn)在能力層面，而是在注意力、信心和位置感上，形成了持續(xù)效應(yīng)。

當時間再次逼近春節(jié)節(jié)點，當 DeepSeek 的下一代模型被普遍認為即將到來，選擇提前出牌，本身就是一種對歷史經(jīng)驗的回應(yīng)。

因此，楊植麟真正的焦慮，并不是 K2.5 能不能在能力上壓過對手，而是在基座模型敘事逐漸退潮、Agent 路線尚未被完全驗證、而下一次外部變量又即將到來之前，月之暗面如何避免再次被推到一個被動的位置。

本文來自虎嗅，原文鏈接：https://www.huxiu.com/article/4830530.html?f=wyxwapp

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.