![]()
船長糾結了一下午,要不要寫Kimi K2.5。。。
1月27日,也就是昨天,月之暗面正式發布并開源了最新的大模型Kimi K2.5。
官方技術報告的第一句話,就是自信滿滿的:
The most powerful open-source model to date.(迄今為止最強大的開源模型。)
![]()
究竟有多強大呢?
用數據說話。
比如,全網都在熱轉的這張,有關Kimi K2.5的benchmark的圖。
![]()
如上圖所示,Kimi K2.5在包括HLE、BrowseComp和DeepSearchQA等極具挑戰性的Agent評測中都拿到了SOTA(當前表現最有的模型)。尤其是在HLE(人類最后考試)上,Kimi K2.5拿到了50.2%。
而在編程能力方面,Kimi K2.5也不遜色。在SWE-bench Verified上拿到了76.8%,雖說不是最頂的,但也幾乎逼近了閉源的GPT和Gemini。至少這個表現,是能夠被邀請上桌,和大家一起掰掰手腕子的了。
![]()
從數據上來看非常牛X,但光紙上談兵,肯定是不行的。(狗頭.jpg)
所以,3!2!1!上體驗!!!!!!!!!
PS:本文未被Kimi充值,大家可放心食用。
![]()
要說看完Kimi K2.5的介紹視頻,滿心滿眼都是過年要放12天假的船長,就記住了兩個最核心的點:
一個是視覺編程(Visual Coding),另一個是Agent 集群。
圖片、視頻+Coding。Kimi,你是真敢想啊。
這是什么意思呢?
打個比方,咱們平時看到某某網站做得特別好,是不是會立馬下意識地產生:
我能不能也做一個同款的想法?
但是吧,沒點金剛鉆,你還真干不了的這前端的活。(特別是之前的手搓時代。)
誒,Kimi K2.5,來了。
你扔給它一張網站截圖或者是一段錄屏視頻,它能自動給你復刻一個同款網站。
PS:如果你喂的是視頻的話,效果更佳。因為你會發現,它不僅能看懂靜態的UI布局,還能理解動態的交互邏輯,比如滾動的觸發特效和卡片翻轉動畫等……
![]()
越聽越有意思,船長立馬給它扔了張B站截圖。
“Kimi,我就要這個。”
![]()
來看看效果:
![]()
網址放在這兒了:
https://34fruw3kfgr6e.ok.kimi.link/
你憋說,你憋說,效果真不錯。
只見,編輯部聽取“哇”聲一片。
除了這視頻內容簡介,又給我“胡言亂語”了以外:
![]()
但最重要的是,全程都是它在干活,最后直接一鍵部署即可搞定。
![]()
But,你要說在這個過程中,它有沒有一些小問題呢???
有的。
從使用體驗上來講,它不是100%順暢,就像在WC一待就是一小時的便秘中年人。
先帝創業未半,而中道崩殂。說人話:剛把圖發過去,它就提醒了我三次“打錢”!
“和Kimi聊天的人太多啦,訂閱會員可進入獨立的優先隊列。”
![]()
熟悉的配方,熟悉的味道。
讓我想起了Kimi最最最開始爆火的時候,也出現了類似的情況:
![]()
是的,或許這次也是下午想要體驗的人太多了,Kimi崩了會兒。
只不過,如果你是尊貴的VIP的話,這回可以走VIP專屬通道。
三種會員內容的收費標準如下:
Andante 包月為49元/月。
Moderato 包月為99元/月。
Allegretto 包月為199元/月。
![]()
咱們也可以理解,做大模型本來就燒錢,為愛發電根本不現實。
大家也逐漸被各種VIP培養出了付費意識,就是這個定價吧,你怎么看呢?
OK,Kimi K2.5被部分人吐槽的另一個點,還有速度有點慢了。
一等就是一個小時打底。
@Lena用Kimi K2.5做了個算命小網站,滿打滿算跑了一個半小時。
網址在此:
https://onwlpil5r3hxs.ok.kimi.link/
其實這個時間問題,見仁見智。
我覺得還行,挺快的了。
如果你是個急性子,我勸你還是千萬別著急。
(也有可能上班就是“度日如年”。)
![]()
除了讓Kimi K2.5生成我們想要的網站,我們還玩了玩,Kimi提供的模板庫。
事實上,在船長眼里,全場最讓我感到驚艷的壓軸部分,其實是這個做同款。
不愧是精選模板系列。
模板:
![]()
網址:
https://6slobvoh2opns.ok.kimi.link/?id=2012192466103803904&share_id=19bc7846-6132-838b-8000-0000085ee636
生成同款:
![]()
網址:https://gnct4vikvakgu.ok.kimi.link/
不!是!我真的覺得這個水平,是可以直接搬運上發布會的程度。
就這審美,確實比較有高級感那味兒啊,AI味差不多也被抖落抖落完了。
好吧,我可以暫時原諒一下Kimi K2.5的小問題。
畢竟,對于傳統VLM,它屬于降維打擊了。
對了!相比之下,我用同一套提示詞請豆老師做的耳機網頁是這樣的:
![]()
乍一看是不是還可以?
但我要說我的關鍵詞就是耳機呢?
沒有一張耳機的圖!!
阿豆,我真的要鬧了!
BTW,在KimiK2.5一個小時搭建一個網站的操作下,也有網友開始討論,以后的歪網站,不會更猖獗了吧?
蒜鳥蒜鳥,工具嘛,還是得看人怎么用了。
最后,再簡單BB兩句Kimi K2.5的Agent 集群。
你可以理解為:讓AI管理AI分身,AI界也出了一個“包工頭”。
用咱們常見的生活場景來形容的話——
抄水表。
咱們以前老式的抄水表,是不是嬢嬢一個一個上門來抄。一個人要跑一兩戶。
現在,你這棟樓里有多少戶,AI主管就派多少個“AI抄水表工人”。一人負責一戶,同步抄表后匯總給一個人。把原本一個人用一天完成的事壓縮成幾分鐘搞定。
![]()
在Kimi K2.5的演示案例中就是——
比如,求 AI 在 100 個細分領域中找出排名前三的 YouTube 創作者,或者調研過去10年的“搞笑諾貝爾獎”。
結果,Kimi會為每個領域或年份分配一個子智能體同時進行搜索,將最終結果交由一個指揮官進行整合匯總。
嘖,這就是AI界的“外包工程”嗎?(狗頭.jpg)
不得不說,Kimi K2.5這一更新,又給國內大模型整上了壓力輪了。這才2026年的第一個月,AI圈已經到了我睡一覺起來,就又不認識了的程度。。。
CPU要給干炸了啊。
借用一下網友的梗圖:
![]()
現在又多了一個Kimi K2.5。
讓子彈飛吧,就看賽得出哪匹千里馬了?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.