Kimi K2.5 帶來(lái)了一個(gè)「蜂群時(shí)刻」。
這兩天 K2.5 的更新在海內(nèi)外都賺足了討論,一個(gè)原生多模態(tài)模型,提供了最先進(jìn)的編碼和視覺(jué)功能,以及自主智能體集群范式——召喚一群 agent 過(guò)來(lái)完成任務(wù),聽(tīng)上去也太酷了。
如果你還沒(méi)體驗(yàn)過(guò),快來(lái)參與本期的福利放送:Kimi 和 APPSO 給大家準(zhǔn)備了一批 Kimi Agent 日卡福利,包括24 小時(shí)會(huì)員+ 3 次集群功能使用,專屬鏈接稍后會(huì)掉落在留言區(qū),先到先得,期待大家體驗(yàn)后回來(lái)與我們分享使用感受。
![]()
技能多 Agent,好酷炫好好玩
K2.5 目前已經(jīng)全量推出,客戶端即可使用。K2.5 Agent 有免費(fèi)體驗(yàn)次數(shù),而 K2.5 集群則是付費(fèi)功能,目前只對(duì) Allegretto 計(jì)劃。訂閱了也有點(diǎn)數(shù)限額:每個(gè)月起步 47 點(diǎn),每次任務(wù)消耗 3 點(diǎn)。
總體上是夠用的,作為 Kimi 老用戶,當(dāng)然是買,買它。正好手邊有一堆文件需要合并,懶得手動(dòng)復(fù)制粘貼了,就發(fā)給 Kimi 打開(kāi)集群模式讓它統(tǒng)一處理。
![]()
集群模型下,Kimi 還給這個(gè)地方加了個(gè)設(shè)計(jì):會(huì)有一個(gè)工牌掉落下來(lái),你可以看到是哪位「負(fù)責(zé)人」在執(zhí)行任務(wù)。
![]()
合并文檔最終的效果不錯(cuò),而且我還進(jìn)一步提出讓它整理和調(diào)整各個(gè)層級(jí)的小標(biāo)題,它可以實(shí)現(xiàn)先分析、提方案、再執(zhí)行的鏈路。不過(guò)最好是下載到本地檢查格式,Kimi 自帶的預(yù)覽功能,有時(shí)候不能準(zhǔn)確反映當(dāng)輪次的修改效果。
為了進(jìn)一步看它的多并發(fā)操作,我參考官方 demo,測(cè)試了一個(gè)任務(wù):檢索近三個(gè)月內(nèi)所有關(guān)于集群式 agent 的文獻(xiàn),然后整理到一個(gè) excel 表格里,提煉核心發(fā)現(xiàn)和研究創(chuàng)新點(diǎn)。

這次安排的「人員」就比較多了,各個(gè) agent 紛紛趕來(lái)支援,每個(gè)人都有自己分配到的任務(wù)。

這個(gè)的耗時(shí)明顯比之前要長(zhǎng)了很多,但沒(méi)關(guān)系,可以先掛機(jī)讓它自己跑。同時(shí),我又安排了一個(gè)考察多模態(tài)能力的任務(wù)。
![]()
這是上傳給 Kimi 的原始素材圖,視頻版中有更多動(dòng)效。Kimi 要做的是把這個(gè)設(shè)計(jì),轉(zhuǎn)換為網(wǎng)頁(yè),而且保留所有的設(shè)計(jì)元素、風(fēng)格。
![]()
Prompt 寫得簡(jiǎn)單,但實(shí)際工作是復(fù)雜的:既要識(shí)別、理解,又要生圖,還要寫前端。
這個(gè)任務(wù)也花了比較長(zhǎng)的時(shí)間,但最終效果很好。有一些小細(xì)節(jié)上的問(wèn)題,比如圖片排版、懸停和跳轉(zhuǎn)等 bug。不過(guò)核心的設(shè)計(jì)元素都保留了,并且網(wǎng)頁(yè)功能也完備。

再回頭來(lái)看,文獻(xiàn)檢索的任務(wù)也好了,整整齊齊列了一個(gè) excel 出來(lái):
![]()
最后一個(gè)測(cè)試任務(wù)是:上小紅書(shū)找達(dá)人,要求是數(shù)碼博主,粉絲量大于 5000,累計(jì)筆記多于 100 條。這兩個(gè)條件其實(shí)很寬松,真的找起來(lái)范圍很大。
![]()
Kimi 碰到的第一個(gè)問(wèn)題是:進(jìn)不去小紅書(shū)。其實(shí)這里可以主動(dòng)詢問(wèn)用戶,類似 GPT agent 會(huì)用的辦法。
但并沒(méi)有,Kimi 轉(zhuǎn)而去了新榜抓數(shù)據(jù),這樣既繞開(kāi)了網(wǎng)頁(yè)權(quán)限,又能直接讀取數(shù)字。這不算是個(gè)很好的策略,最后只能抓出來(lái)數(shù)量很少的博主,顯然小紅書(shū)上不可能只有這些。另外,被擋在平臺(tái)外,也無(wú)法體現(xiàn) Kimi 的視覺(jué)能力,畢竟抓取的都是現(xiàn)成的數(shù)字。
![]()
不過(guò)總體上,Swarm Agent 給人一種踏實(shí)感。這些工作單體 agent 能不能做?自然是可以,只是要花時(shí)間、錯(cuò)漏多。而一群人來(lái)做,更加的令人安心。
創(chuàng)「新」在哪里?
說(shuō)到這里,你可能會(huì)問(wèn):這不就是 Multi-Agent(多智能體)嗎?很多公司都在做啊。
關(guān)鍵區(qū)別在于「誰(shuí)來(lái)當(dāng)老板」。
在傳統(tǒng)的 Multi-Agent 系統(tǒng)中,人類需要預(yù)先設(shè)計(jì)好整個(gè)工作流程:誰(shuí)負(fù)責(zé)什么、誰(shuí)先誰(shuí)后、結(jié)果怎么匯總。就像搭積木一樣,你得先把圖紙畫好。而 Agent Swarm 的核心創(chuàng)新在于——AI 自己就是設(shè)計(jì)師。
Kimi 團(tuán)隊(duì)用了一種叫 PARL(Parallel-Agent Reinforcement Learning,并行代理強(qiáng)化學(xué)習(xí))的訓(xùn)練方法,讓模型學(xué)會(huì)了「分解任務(wù)」和「調(diào)度資源」的能力。你不需要告訴它「先派 3 個(gè)人去搜資料、再派 2 個(gè)人去寫總結(jié)」,它自己就能判斷:這個(gè)任務(wù)適合拆成幾份?每份派誰(shuí)去做?什么時(shí)候該并行、什么時(shí)候該串行?
換句話說(shuō),Multi-Agent 是「人類編排的交響樂(lè)團(tuán)」,Agent Swarm 是 AI 自己組隊(duì)的爵士樂(lè)。
![]()
還有一個(gè)容易混淆的概念是 MoE:Mixture of Experts,混合專家模型。主流大模型內(nèi)部都用了 MoE 架構(gòu),但它們和 Agent Swarm 完全是兩回事。
MoE 發(fā)生在模型內(nèi)部。你可以把它理解為:模型里住著一群「專家」,每次處理任務(wù)時(shí),模型會(huì)動(dòng)態(tài)決定激活哪幾個(gè)專家來(lái)參與。但這些專家沒(méi)有獨(dú)立的身份,也不會(huì)互相協(xié)作,它們只是模型內(nèi)部的不同計(jì)算路徑。
Agent Swarm 發(fā)生在模型外部。每個(gè)子 Agent 都是一個(gè)相對(duì)獨(dú)立的執(zhí)行單元,有自己的任務(wù)目標(biāo),可以并行運(yùn)行,甚至可以調(diào)用工具(比如搜索網(wǎng)頁(yè)、寫代碼)。它們之間是真正的「協(xié)作關(guān)系」,而不是簡(jiǎn)單的「激活關(guān)系」。
用個(gè)不太嚴(yán)謹(jǐn)?shù)谋扔鳎篗oE 像是一個(gè)人的大腦里分區(qū)工作,Agent Swarm 像是一個(gè)公司里的團(tuán)隊(duì)協(xié)作。
從實(shí)測(cè)和官方演示來(lái)看,Agent Swarm 至少在以下幾類任務(wù)上表現(xiàn)出色:
第一類是大規(guī)模信息收集。 比如官方案例中 100 個(gè)領(lǐng)域創(chuàng)作者調(diào)研,以及我們這次實(shí)測(cè)的小紅書(shū)博主檢索。處理這類任務(wù)的共同特點(diǎn)是「可并行」——每個(gè)子任務(wù)相對(duì)獨(dú)立,不需要太多中間協(xié)調(diào)。
![]()
第二類是視覺(jué)+代碼的復(fù)雜任務(wù)。 Kimi K2.5 強(qiáng)調(diào)自己是「原生多模態(tài)」模型,能看懂圖片和視頻。結(jié)合 Agent Swarm 后,它可以一邊分析 UI 截圖,一邊派不同 Agent 分別處理布局、樣式、交互邏輯,最后生成完整的前端代碼。
![]()
第三類是長(zhǎng)文檔處理。 官方提到,Kimi Agent 可以處理「1 萬(wàn)字的論文或 100 頁(yè)的文檔」,支持 Word 批注、Excel 透視表、LaTeX 公式等高級(jí)功能。Agent Swarm 可以把長(zhǎng)文檔拆成多個(gè)章節(jié),讓不同 Agent 并行處理,再匯總成統(tǒng)一格式——正如最開(kāi)始的實(shí)測(cè)案例一樣。
不過(guò),別急著興奮,Agent Swarm 并非「開(kāi)了掛」。在實(shí)際使用中,你會(huì)發(fā)現(xiàn)幾個(gè)明顯的邊界:
第一,任務(wù)本身得「可拆」。 如果任務(wù)步驟之間有強(qiáng)依賴關(guān)系——比如「先想清楚論點(diǎn),再去找證據(jù),最后才能寫結(jié)論」——強(qiáng)行并行反而會(huì)幫倒忙。
第二,成本會(huì)顯著上升。 100 個(gè) Agent 同時(shí)工作,意味著 100 倍的 API 調(diào)用。雖然總時(shí)間縮短了,但 Token 消耗是實(shí)打?qū)嵉摹?/p>
第三,質(zhì)量不一定比單 Agent 好。 在某些需要深度推理的任務(wù)上,比如數(shù)學(xué)證明、復(fù)雜編程題,單 Agent 的「深度思考模式」反而更可靠。Agent Swarm 的優(yōu)勢(shì)在于「廣度」和「速度」,而不是「深度」。實(shí)測(cè)下來(lái),部分任務(wù) Kimi 會(huì)自動(dòng)調(diào)劑成單 Agent 模型,這點(diǎn) Kimi 團(tuán)隊(duì)成員也在 reddit 的線上問(wèn)答里得到了證實(shí)。
![]()
Kimi 團(tuán)隊(duì)眼中的未來(lái)
從目前的使用體驗(yàn)來(lái)看,集群還可以繼續(xù)提升,包括但不限于:
更智能的調(diào)度:目前的 Agent Swarm 已經(jīng)能自動(dòng)分解任務(wù)和創(chuàng)建 Agent,但調(diào)度策略還比較「粗粒度」。未來(lái)有希望能建立更精細(xì)的資源分配——比如根據(jù)任務(wù)的緊急程度、復(fù)雜度、依賴關(guān)系,動(dòng)態(tài)決定「派多少人、干多久」。
更深度的協(xié)作:現(xiàn)在的子 Agent之間交流有限,主要是「各自干完活,把結(jié)果交給老大匯總」。未來(lái)可能會(huì)支持子 Agent 之間的直接協(xié)作,比如「A Agent 發(fā)現(xiàn)一個(gè)問(wèn)題,可以主動(dòng)呼叫 B Agent 來(lái)幫忙」。
更廣泛的工具集成:擴(kuò)展 Agent 可以調(diào)用的工具庫(kù),包括但不限于更多的辦公軟件、開(kāi)發(fā)環(huán)境、數(shù)據(jù)分析工具。目標(biāo)是讓 Agent Swarm 能真正「端到端」地完成復(fù)雜工作流。
在 Reddit 的 AMA(Ask Me Anything)活動(dòng)中,Kimi 團(tuán)隊(duì)也回答了大量關(guān)于技術(shù)、產(chǎn)品和愿景的問(wèn)題。透過(guò)這些回答,我們可以拼湊出他們對(duì) Agent Swarm 乃至整個(gè) AI 未來(lái)的思考。
AMA 中還有一個(gè)問(wèn)題很有意思:許多說(shuō)法稱,scaling law 已經(jīng)碰到了上限,團(tuán)隊(duì)如何看待這個(gè)問(wèn)題呢?
楊植麟的回答是:Agent 集群就是他們走出的嘗試。展望未來(lái),或許會(huì)出現(xiàn)一種幾乎不、甚至完全不需要人類先驗(yàn)信息的模型。
![]()
這個(gè)愿景聽(tīng)起來(lái)有些理想化,但細(xì)想之下頗有深意。過(guò)去兩年,AI 領(lǐng)域一直在「卷參數(shù)」——模型越來(lái)越大、算力越來(lái)越貴。而 Agent Swarm 代表了一種不同的思路:與其讓一個(gè)超級(jí)大腦做所有事,不如讓一群大腦分工協(xié)作。
這可能才是通向 AGI 的更務(wù)實(shí)路徑:?jiǎn)为?dú)一只蜜蜂并不起眼,但當(dāng)成千上萬(wàn)只蜜蜂協(xié)同工作時(shí),它們能建造出精妙的蜂巢。
歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡(jiǎn)歷投遞郵箱hr@ifanr.com
?? 郵件標(biāo)題「姓名+崗位名稱」(請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.