我很喜歡 K2.5,本文會非常主觀
以及,本文使用 Kimi 配色,用以致敬
昨天下午,Kimi 的朋友跟我說:K2.5 發了。開始沒當回事,想當成個快訊發一下,這是原生多模態
當我看完楊植麟那個 4 分鐘的視頻(這個沒推送)之后,愣了好一會
有一種很難言說的感動,好像...我喜歡的那個 Kimi,回來了
先從客觀的角度來說,我覺得:K2.5 是 Kimi 的一個分水嶺
具體來說,是在兩個維度:
行業
國產頭部旗艦模型里,Kimi 首先突破了多模態這一關,并且實踐得非常好
質感
Kimi 用這張答卷,回歸到了那個有品位、有藝術、更有技術的天才少年形象
而這篇文章,會摻雜很多我的主觀成分,因為我真的很喜歡
像音樂家一樣優雅,像程序員一樣可靠
多模態
從多模態說起吧
在過去的半年中,國內持續發旗艦模型的「非大廠」「非 DeepSeek」就三家:智譜、MiniMax、Kimi。它們的最新模型里,只有 Kimi 真正支持了多模態
K2.5 在 K2 基礎上繼續訓練了約 15T 混合視覺-文本 tokens,原生多模態架構。能直接從視頻輸入生成代碼,不需要額外的視覺 MCP
注意:原生多模態架構,不是額外調用
官方 Tech Report 里有一句話:At scale, the trade-off between vision and text capabilities disappears — they improve in unison.
規模夠大之后,視覺和文本能力的權衡消失了,它們同步提升
在多模態這一關上,Kimi 的旗艦模型先過了。具體 Benchmark 我就不展開了。Agent、代碼、視覺理解,都是對標 GPT-5.2 和 Claude 4.5 Opus
![]()
K2.5 Benchmark
具體如果想了解,可以在 Tech Blog 里找到完整數據:kimi.com/blog/kimi-k2-5.html
天才少年回歸
我公眾號里寫的第一篇教程,是關于如何配合 AI 進行編程學習
那篇文章用的就是 Kimi 的 API 作為示例,因為真的喜歡當時的質感,就是一種...難以名狀的...學術偶像?
楊植麟,93 年生人,清華本科年級第一,CMU 四年讀完博士,Google Scholar 引用量中國 35 歲以下 NLP 領域最高。公司名字取自 Pink Floyd 的《The Dark Side of The Moon》
那時候覺得,這家公司有點意思,或者說...很有意思!
但后來,慢慢的,質感變了。海量廣告投放、各種 Marketing 狠活....我有點疏遠了。不是說營銷不好,只是覺得那不太像最開始認識的那個 Kimi
K2.5 把那種曾經的質感,帶了回來
同時帶來的,還有更好的性能,以及更具競爭力的價格
![]()
![]()
從發布頁說起
這個與模型無關,但在我看來,是這種氣質回歸的一個最典型的特征,現在打開 moonshot.cn 網站,它顯示的內容和 GitHub 開源的網站是完全一樣的:moonshotai.github.io
![]()
月之暗面官網
黑色背景,極簡排版,技術派美學。GitHub 發布頁和公司官網合二為一
一家公司能把主頁做成這樣,讓開發者、讓專業人員感到舒服,這在全世界都少見
然后,就看到了吾等開發者們,無論小齒佬還是大技霸,都興奮了起來,Twitter Tech 榜一騎絕塵
![]()
Twitter 報錯信息
我用 Agent 調用的時候報錯了。打開 F12 找報錯記錄,準備聯系 Kimi 的朋友看看是不是通路問題
然后發現,報錯信息里直接標出了當前訪問場景的 ID
這種細節,讓人感覺他們是真的在用心干事
![]()
報錯信息截圖 產品里的小巧思
在 Kimi 的 Agent 產品里,最近更新了一個「Agent 集群」,說白了就是一堆 Agent 一起干活。技術上叫 Agent Swarm,最多 100 個子智能體,1500 個并行工具調用,運行時間最高縮短 4.5 倍。目前是 Beta,會逐步開放
對于虛擬出來的 Agent,我總覺得有點惡趣味,比如給我寫代碼的程序員叫「狄柯」
或許...只有「狄柯」,才能讓代碼「吊炸天」
![]()
狄柯,Web Developer,正在初始化 Next.js 項目
還有一個細節:在 Agent 模式下,如果它需要一張圖片作為背景或插圖,會自己畫一個。不知道具體用的什么模型,但這個功能確實順滑
![]()
官方給了一個更復雜的例子:投喂 40 篇心理學和 AI 的論文,Kimi 先通讀一遍,然后衍生出幾個子 agent 分別負責不同章節,最后主 agent 把關驗收,生成一份幾十頁的 PDF 綜述
品味
用 AI 生成的網站往往都是同一種風格。你一眼就能看出來這是 AI 做的。配色、布局、動效,有一種很難形容的「AI 味」
并且,非常喜歡用 Tailwind 紫
![]()
Tailwind 的老哥,還發了個「悔罪書」
K2.5 生成的東西不太一樣,舉個例子:我拿它給 AGI Bar 做了個品牌網站
給它的 prompt(大致上):
溫暖的科技感,充滿智識上的玩味但絕不冰冷。深炭灰主導,琥珀金黃強調,氣泡泡沫圖案充當數據可視化的隱喻
![]()
還加了點惡趣味:
AGI Bar(酒吧)也是 AGI Bar(門檻)。鼠標在線上方顯示「You're above the bar」,在線下方顯示「You're near the bar」
最后,效果超預期,真的實際可用,然后我真的把它部署到了 agi.bar (考慮到 DNS 緩存,有些地區可能現在就能刷到了,最遲 24小時)
這里再放幾個官方 Case,我都很喜歡,以下這些,都是僅憑單條 Prompt 實現的
比如這個看著就很炸裂的開場
這種很有 style 的美妝
這種可交互的網站
還有這種,講道理,我覺得這都是可以直接上發布會的
然后也可以傳個錄屏進去,K2.5 用干凈專業的代碼,從頭到尾復現,講道理,「從視頻,直接到完美網頁」,這種體驗在其他模型上,是前所未有的
問題也有
長程 Agent 場景下,指令遵循經常出問題。整體體感依然無法達到海外主流模型的水平
與海外的代差在這里,這個誰也否認不了。可能再給 3 到 6 個月,能追上現在的海外主流
但我還是充值了他們最貴的會員,向探索者致敬
![]()
表達一下敬意
公眾號后臺的光標,走走停停
中間還專門給這篇文章,寫了個樣式,讓它更像 MoonShot 的風格
昨天下午開始用,直到這里才寫完
一邊寫就會有新的想法,一邊嘗試又在 Kimi 里找到了更多印證,真的,滿懷期待,將話筒交給未來吧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.