聞樂 發自 凹非寺
量子位 | 公眾號 QbitAI
說真的,AI圈現在恨不得睜眼閉眼就變天,產品一個接一個,難怪網友都開始“求求你們別更新了”……
![]()
△圖源:抖音hyarriver
這不,今天一睜眼就又看到個新東西。
能直接從錄屏里扒特效代碼并復現的模型你見過沒??反正我是開眼了。
隨手從相冊里挖出下面這個視頻上傳,輸入“實現這個交互特效”幾個字:

模型一通操作之后,我得到了如下成品:

只能說,春節檔的電影還沒開始預熱,中國的開源力量就已經勢如破竹了。
這是Moonshot AI新推出的最強Agentic模型Kimi K2.5,發布后就在某推上熱度起飛。
![]()
掌門人楊植麟還親自上陣,為這個新模型錄制了中英兩版介紹視頻。
![]()
從視頻內容看,Kimi K2.5的升級點不少:
- 實現視覺與文本、思考與即時、對話與Agent功能的一體化整合,主打一個All in one
- 具備設計審美,可生成帶高級動效的網頁;
- 支持visual edit可視化編輯,截圖圈選即可修改界面,上傳動效錄屏可自動拆解邏輯并生成專業代碼;
- 推出編程工具Kimi Code,可在終端運行,無縫集成VSCode、Cursor等IDE,支持圖片/視頻輸入,自動遷移用戶現有技能與MCP。
![]()
本來只是看完介紹想淺試一下,結果沒想到還真有點意思。
那咱就接著細說、接著測!
視覺能力是大招
動手實測之前,先亮一亮Kimi K2.5的基準測試成績單。
K2.5在人類最后的考試HLE、BrowseComp和DeepSearchQA等一眾高難度測試集上,拿下了SOTA的好成績;
編程方面,在SWE-bench Verified上得分高達77,以開源的姿態縮小了和頂級閉源模型的差距
視覺理解多項測試也刷出新高。值得一提的是,在多項評測中,K2.5的表現甚至優于GPT-5.2-xhigh。
![]()
Kimi K2.5這次更新了4種使用模式,適應不同場景,不管你有啥需求,都能找到適合自己的打開方式。
![]()
- 快速模式主打極速反饋,適合日常閑聊或簡單查詢;
- 思考模式專攻難題,幫你一步步拆解復雜邏輯;
- Agent模式則擅長深度挖掘,比如搞研究、生成辦公文檔或網頁;
- 最猛的是Agent集群模式,針對那些需要多線程處理的超級任務,能調動一大波智能體分身并行執行。
開頭的特效復現案例,就用的是Agent集群模式——Kimi給我分配了一個叫阿澈的開發員。
![]()
光說不練假把式,既然介紹里主打「視覺x代碼」,那咱就測一測K2.5的代碼能力。
第一個實測項目是看圖寫代碼
把一張音樂播放器網頁截圖上傳給K2.5作為參考;
![]()
然后輸入提示詞:
- 參考這個網頁,生成對應代碼
沒過多久,一套完整的代碼就新鮮出爐了。

生成的網頁不僅還原了原設計的功能,連按鈕的hover動效、音樂播放進度條的滑動效果也都做出來了。
實際上大家也能看出來,我給的參考圖清晰度不是很高,但模型也能精準識別;
網頁上展示的音樂封面是模型自己生成的,除此之外可以看出最下方的按鈕布局沒完全還原,但這個效果在我看來已經算是一張還原度超過90%的優秀答卷。

當然了,大家應該也能看到上傳的參考圖片上顯示的是紅色感嘆號,srds模型確實能識別圖片進行分析,只能說所有模型可能都有些小bug,但能干實事兒就無傷大雅(doge)。
![]()
除了能看圖寫代碼,K2.5還能截圖改代碼
拿剛才生成的音樂播放器網頁來說,我想讓它調整一下播放器的布局,于是截了個圖,圈出播放器的主體部分;
![]()
然后告訴K2.5:
- 把這部分放到左下角
![]()
模型秒懂我的意圖,2分鐘之內給出了修改后的代碼,刷新網頁一看,除了截圖部分按要求調整了布局,其余地方都沒變,主打一個精準(而且這次還沒紅色感嘆號hhh)。
而且整個過程像在用繪圖軟件涂改一樣直觀,省去了大段文字描述的麻煩。
![]()
我又反復試了幾輪,發現哪怕圈選區域模糊、不完整,它也能智能補全意圖,避免了AI常見的誤讀問題。
比如我覺得播放器的配色有點單調,于是截了個圖,只圈出了播放器左側欄部分;
![]()
告訴K2.5想要換成莫蘭迪色系:
- 這部分配色有點單調,換成莫蘭迪色系
模型再次秒懂意圖,5分鐘之內給出了修改后的代碼,刷新網頁一看,它自己選的顏色和原來的搭配起來還挺和諧,而且不止換了一種顏色,還給我來了個“偽漸變”。

就算你既沒有找到喜歡的設計圖,腦子里也暫時沒什么想法,也完全不用擔心,只要簡簡單單一句話,也能讓K2.5自由發揮。
比如我隨手輸入:
- 幫我生成一個文藝風的書籍推薦網頁

沒想到啊沒想到,它居然整了個大活兒。
青綠色的背景搭配多種字體,一股文藝氣息撲面而來;鼠標掃過書籍封面還能升起一句話簡介;

再往下拉,是讀書社區和「每周一書」活動的介紹,卡片還帶有翻轉展開的動效;

除此之外,Kimi還設計了閱讀體驗、讀者聚會、作者介紹等模塊,每一處展示都細節滿滿,完全超出了我的預期,畢竟我的輸入只有一句話……

接下來,我又讓K2.5 Thinking(下圖左)和K2 Thinking(下圖右)分別生成了一個Switch手柄:
- 設計一個Switch手柄,屏幕上顯示pygame風格的推箱子游戲
放在一起對比,明顯能看出K2.5 Thinking設計出來的游戲,不管是在畫面比例上還是像素上都優于K2 Thinking;
甚至K2.5最終的代碼行數為738,而K2一共有818行。
![]()
看到這兒,你是不是也發現了,K2.5設計出來的代碼和我們平時見到的那些AI產物,其實不太一樣——
不是一水兒的紫色調,也不是呆板的模塊化布局;而是在視覺上變得更加美觀、更多元化。
顯然,團隊的目標不止于功能實現,還想注入設計審美,讓AI輸出的創意像人類一樣有靈魂有個性。
過去AI編程往往停留在“能跑就好”,現在它能交付高質量的專業級產品,門檻低到只需一張圖或一句話。
除了「視覺x代碼」這塊兒亮眼,Kimi K2.5在Office辦公領域也玩得轉
- (上傳文件)把這個文件內容轉換為PPT,風格為簡約風格,主色調為灰白色
![]()
再看輸出的效果,顏色正確、風格正確、分析和展示的內容也非常全。
最重要的是可編輯,這樣就極大方便了普通用戶,不懂提示詞工程的人也能用好Kimi;即使AI有啥小差錯,也不用一遍遍通過Prompt糾正,自己動手隨時能改。

之前為了應對不同的工作,人需要學習不同的Office語言,比如什么公式、函數、數據格式……
現在有了Kimi K2.5,辦公軟件也開始聽人話了。
Agent Swarm是內功
如果說視覺能力是Kimi K2.5亮眼的招式,那智能體集群Agent Swarm就是支撐K2.5突破效率的內功。
Agent Swarm的核心邏輯,就是讓多個具備獨立功能的智能體協同工作,各司其職又互相配合,本質上也是對分布式AI協作的具象化表達。
這個概念很有可能成為今年Agent領域的核心敘事。
AI圈的大紅人,英偉達老黃都在2025年多次公開表示,AI Agents有望成為下一個機器人級別的萬億級產業,并且特別看好swarm/collective intelligence(集群/集體智能)的發展前景,足見這個賽道的潛力之大。
![]()
回顧Kimi的技術迭代路徑,不難發現他們早就開始布局“Agents Scaling”。
半年前他們推出首個萬億參數開源模型Kimi K2,那時的焦點在參數Scaling上。
后來Kimi K2 Thinking上線,通過延長思考鏈條,讓單Agent能獨立搞定長達300步的操作序列,提升了長程任務處理。
但這遠遠不夠,單智能體的能力終究有上限。Kimi團隊也意識到要啃下真正場景里的復雜難題,不能只靠單打獨斗,必須要讓智能體學會協作。
于是,在Kimi K2.5上,他們實現了關鍵躍進。
從單一Agent轉向Agent集群,能即時調度上百個分身并發協作。

這些Agent就像是K2.5的分身,每一個都有自己的專長,有的擅長數據分析,有的精通文案撰寫,有的專攻市場調研。
當遇到一個復雜任務時,K2.5不再讓一個Agent包攬所有工作,而是會根據任務需求,現場給這些分身分配角色、拆解子任務,整個過程沒有任何預設的規則,全靠K2.5自主決策。
![]()
舉個簡單的例子。
比如要做100家公司的市場調研,K2.5會立刻組建一個調研團隊,讓不同的Agent分別負責不同行業的公司;
有的收集財務數據,有的分析市場份額,有的整理競品動態,原本需要幾星期才能完成的工作,現在十幾分鐘就能給出一份詳盡的報告。
整個過程從串行到并行切換自如,效率提升非常明顯。
據團隊內部評測,搭載Kimi K2.5的Kimi Code在軟件工程能力上,比前代模型大幅進步。
相較于單智能體執行模式,智能體集群能將實現目標性能所需的最少關鍵步驟縮減3至4.5倍,且目標要求越高,步驟的節省幅度就越大;
同時借助并行化處理,其實際運行耗時(壁鐘時間)最多可縮短4.5倍。
![]()
讓AI“干活”,讓人“定義”
實際上這么看下來,Kimi K2.5通過視覺能力和Agent集群,極大地抹平了普通用戶與專業交付成果之間的技術鴻溝。
畢竟,連提示詞都不用反復修改潤色,只要拿圖或視頻給K2.5看,它就能交給你一個基本滿意的答卷。
辦公方面的升級,也在側面說明Kimi現在已經是被微軟認定的生產力工具;要知道,微軟之前在「Agent+Office」這方面合作的核心可是OpenAI的GPT系列。
![]()
大家總愛說AI遲早要替代人,但在K2.5這里,我們看到的是AI正在賦予每個人“指揮千軍萬馬”的超能力。
就像Kimi團隊說的那樣,要讓用戶專注于定義問題和做決策,剩下的重活兒、累活兒、雜活兒,統統交給這群“Kimi分身”就好。
總的來說,Kimi K2.5這次升級簡化了人類的工作流程,或許,在Agent時代寫簡歷都不用長篇大論了,一句“精通Kimi”就夠了(doge)。
— 完 —
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.