網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

實(shí)測(cè)Kimi首個(gè)Agent：智能體與模型之間的區(qū)隔消失了？

2025-06-23 13:01:16　來(lái)源: 直面派

北京舉報(bào)

分享至

這兩天，月之暗面上線了名為 Kimi-Researcher 的產(chǎn)品，以“模型即Agent”的思路切入，標(biāo)志著其在 Agent 路線上的一次明顯發(fā)力。

如果大家還記得的話，就在 Kimi 發(fā)布的前一天，MiniMax 在 MiniMax Week 的第三天也啟動(dòng)了通用 Agent 的灰度測(cè)試。這兩家此前一度低調(diào)的公司幾乎在同一時(shí)段重新進(jìn)入公眾視野，也讓原本趨于平靜的 AI 四小強(qiáng)格局再次活躍起來(lái)。

Kimi、MiniMax、智譜、階躍星辰，這幾位曾經(jīng)在大模型初期階段高頻出現(xiàn)的名字，如今正借助 Agent 的新賽道尋找新的突破口。不管是技術(shù)報(bào)告的更新、產(chǎn)品形態(tài)的演進(jìn)，還是實(shí)際功能的迭代，幾家廠商都在以各自的節(jié)奏向外界釋放信號(hào)。

這一輪產(chǎn)品集中露面的時(shí)間節(jié)點(diǎn)并非巧合。從時(shí)機(jī)上看，這一波集中亮相并非偶然。當(dāng)前，大模型正從純粹的問(wèn)答工具演進(jìn)為具備自主規(guī)劃、任務(wù)執(zhí)行與上下文記憶能力的智能體系統(tǒng)。Agent 正在從“增強(qiáng)生產(chǎn)力”轉(zhuǎn)向“替代部分人類(lèi)任務(wù)角色”。對(duì)于具備模型研發(fā)和產(chǎn)品整合能力的廠商來(lái)說(shuō)，這是一次相對(duì)公平的新起點(diǎn)。

報(bào)告，不只是寫(xiě)完，還得像

在這樣的背景下，Kimi 推出的 Kimi-Researcher 選擇了一個(gè)很明確的切入口：深度研究。

這個(gè)定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問(wèn)答，而是瞄準(zhǔn)了原本需要專(zhuān)業(yè)助理團(tuán)隊(duì)完成的任務(wù)，例如梳理產(chǎn)業(yè)政策、比對(duì)跨國(guó)法規(guī)、生成調(diào)研報(bào)告等。

這類(lèi)任務(wù)對(duì)模型的檢索、思考、組織、判斷能力要求極高，幾乎是對(duì) Agent 體系的全方位考驗(yàn)。

話不多說(shuō)，我們直接開(kāi)測(cè)。

比如說(shuō)我想讓它分析下2025年上半年黃金價(jià)格波動(dòng)與美聯(lián)儲(chǔ)政策走向的關(guān)聯(lián)性。

它沒(méi)有立刻開(kāi)始寫(xiě)，而是反問(wèn)了我一些問(wèn)題，從研究邏輯本身出發(fā)，主動(dòng)確認(rèn)這個(gè)任務(wù)到底該怎么做才不空轉(zhuǎn)。

這種主動(dòng)澄清機(jī)制，是過(guò)去在 Deep Research（左圖展示為：ChatGPT的 research 模式）里很熟悉的，也不像 MiniMax （右圖展示為MiniMax Agent）那種一口氣跑完所有流程后才看結(jié)果的虛擬機(jī)結(jié)構(gòu)，更接近一個(gè)“你提一個(gè)話題，它開(kāi)始一步步推”的助研模型。

Kimi比GPT更貼心增添了“Include everything”按鈕，不是單純放開(kāi)信息源，而是直接把它切換到一種更傾向生成完整結(jié)構(gòu)報(bào)告的工作狀態(tài)。

經(jīng)過(guò)大概十幾分鐘的等待，它一共生成了兩種版本。

一種是我們熟悉的文字版研究報(bào)告，段落結(jié)構(gòu)清晰，語(yǔ)氣沉穩(wěn)，整體邏輯偏向內(nèi)容層次 + 政策推導(dǎo)；另一種則是自動(dòng)渲染的 HTML 格式報(bào)告，已經(jīng)配好封面、標(biāo)題、摘要、分節(jié)說(shuō)明，標(biāo)注出“核心發(fā)現(xiàn)”“關(guān)鍵風(fēng)險(xiǎn)”“歷史規(guī)律”這些結(jié)構(gòu)化小標(biāo)簽。

網(wǎng)頁(yè)稿鏈接在這，有興趣的朋友們可以打開(kāi)看一看：

https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108

內(nèi)容還是很豐富的。

對(duì)經(jīng)常要做對(duì)內(nèi)材料和對(duì)外匯報(bào)的人來(lái)說(shuō)，這種“寫(xiě)+排+渲”一體的體驗(yàn)，確實(shí)提高了交付效率。

你可以把它當(dāng)成是Word+Notion+研究助理的混合體，不僅能輸出內(nèi)容，還知道怎么讓內(nèi)容看起來(lái)像一份真的報(bào)告。

然后我們也測(cè)了測(cè)生成PPT的能力。給它的任務(wù)是這樣的：

梳理一下 Stable Diffusion 從最初發(fā)布到最新版本的演進(jìn)路線，列出各階段關(guān)鍵改進(jìn)與社區(qū)貢獻(xiàn)節(jié)點(diǎn)，并作出PPT

看起來(lái)是一個(gè)非常結(jié)構(gòu)化的問(wèn)題，理論上應(yīng)該正對(duì) Researcher 的下懷。但實(shí)際操作過(guò)程中，我們也發(fā)現(xiàn)了一些限制。

1. 當(dāng)前版本仍未支持多任務(wù)并行（當(dāng)然，這可能只是內(nèi)測(cè)階段的限制，正式版是否優(yōu)化還有待觀察。）

2. 并不能生成傳統(tǒng)PPT，只能是 HTML 格式報(bào)告。

我們還是把report鏈接放在這里：

https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108

不過(guò)也不能說(shuō)它表現(xiàn)不好。作為一個(gè)學(xué)術(shù)型Agent，它在報(bào)告里自動(dòng)加上了參考文獻(xiàn)鏈接，并用下劃線標(biāo)注出處。可以完成一整套可交付內(nèi)容。

而這，恰恰就是很多 AI 工具還停留在段落生成時(shí)無(wú)法做到的部分。

但當(dāng)我們把這個(gè)任務(wù)交給 MiniMax Agent 時(shí)，體驗(yàn)就完全不同了：

它不僅生成了 PPT，還一并打包了 PDF 報(bào)告、Markdown 研究文檔、圖表文件、項(xiàng)目任務(wù)表（todo.md）和用于可視化的 Python 腳本。

你可以下載 .pptx 源文件，二次修改內(nèi)容和格式。也能查看 .md 的版本記錄、調(diào)圖的 .py 腳本，每一階段的中間產(chǎn)物全都可查。

從產(chǎn)出形式來(lái)看，它給你的是一整個(gè)PPT 制作系統(tǒng)，而不是一份靜態(tài)報(bào)告。

Kimi-Researcher和

MiniMax Agent，哪個(gè)更適合你

從執(zhí)行力上來(lái)說(shuō)，兩者都已經(jīng)遠(yuǎn)超傳統(tǒng)意義上的聊天機(jī)器人——你不用再一句一句提示，它們可以自己補(bǔ)全問(wèn)題、拆解任務(wù)，甚至按你沒(méi)說(shuō)出口的邏輯推下去。但使用下來(lái)，兩者的Agent 感其實(shí)來(lái)自不同的方向。

Kimi-Researcher 是任務(wù)導(dǎo)向的，它的邏輯很清楚：你給我一個(gè)研究型問(wèn)題，我就像一個(gè)訓(xùn)練過(guò)的助理那樣，問(wèn)你三件事、查五份資料、最后給你一份成稿。

但 MiniMax 不太一樣。

它更像一個(gè)運(yùn)行在虛擬機(jī)里的多工系統(tǒng)——你可以把它理解成你裝了一個(gè)干活的人，但這個(gè)人是你組裝出來(lái)的。他自己并不主張“要做研究”還是“要做運(yùn)營(yíng)”，而是你怎么設(shè)計(jì)，他就按你的指令一步步走。有時(shí)候你會(huì)覺(jué)得，它像是個(gè)開(kāi)著調(diào)試模式的智能體，你能看到它每一步調(diào)用了什么插件、在哪個(gè)頁(yè)面抓了數(shù)據(jù)、用了哪個(gè)文檔里的知識(shí)。這種透明度很高的體驗(yàn)，本質(zhì)上更像是你操控一個(gè)流程機(jī)器人，而不是和一個(gè)人打交道。

如果說(shuō) Kimi 是把一個(gè)智能體藏在了模型背后，讓你感受到結(jié)果；那 MiniMax 更像是把智能體攤開(kāi)在你眼前，讓你參與構(gòu)建過(guò)程。兩者誰(shuí)更強(qiáng)，不一定，但它們帶來(lái)的使用心智是完全不一樣的。

還有一個(gè)重要差別，是默認(rèn)角色設(shè)定。

Kimi 很明顯是自帶性格的——不夸張地說(shuō)，它的Researcher標(biāo)簽決定了它的行為方式，比如它更關(guān)注嚴(yán)謹(jǐn)表達(dá)、更傾向于做出規(guī)范排版、更容易使用資料比對(duì)視角進(jìn)行總結(jié)。

而 MiniMax 給你的更多是空角色模板——你自己來(lái)寫(xiě) prompt，自己搭建鏈路，它才啟動(dòng)真正的 Agent 能力。

我不是說(shuō)哪個(gè)更好，我只是說(shuō)它們?cè)趯?shí)現(xiàn)Agent這件事上，走的是完全不同的路徑。

在我們深度體驗(yàn)兩者后，給出用戶一句話結(jié)論：如果你更在意“我提個(gè)需求就能直接拿到結(jié)果”，Kimi 會(huì)是更順手的選擇；但如果你希望掌控整個(gè)任務(wù)的執(zhí)行流程、甚至自己定義智能體的邏輯結(jié)構(gòu)，那 MiniMax 可能更適合你。

Kimi 做結(jié)果，MiniMax 做過(guò)程

說(shuō)到底，Kimi 和 MiniMax 的這次同步出招，看起來(lái)像是在做 Agent，其實(shí)是在做一次底層策略切換。

Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設(shè)計(jì)這些 Developer 套路，它不是在鼓勵(lì)你搭建 Agent，而是干脆告訴你：“Agent 本身就是模型的一部分了”。你想研究政策，它就用研究員的方式回應(yīng)你。它把智能體的控制權(quán)從用戶界面撤回到了模型內(nèi)部，交給了系統(tǒng)自動(dòng)調(diào)度。

這一點(diǎn)是很多人沒(méi)意識(shí)到的。

過(guò)去我們理解的智能體，是我來(lái)設(shè)計(jì)、我來(lái)組合，但 Kimi 的思路是，你不需要設(shè)計(jì)，你只要告訴我你要什么結(jié)果，我來(lái)決定應(yīng)該找誰(shuí)干活、用什么方法、怎么安排流程。

它把整個(gè) Agent 系統(tǒng)做成了一個(gè)黑箱，你丟任務(wù)進(jìn)去，它自己完成任務(wù)拆解、插件調(diào)用、資料組織和內(nèi)容生成。就像你發(fā)了封工作郵件，過(guò)一陣就能收到一份干凈利落的文檔回復(fù)。

很多人還在找插件入口，Kimi 已經(jīng)在去插件化。

這兩種產(chǎn)品方向的不同，其實(shí)也能看出背后公司在策略上的側(cè)重點(diǎn)。Kimi 一直強(qiáng)調(diào)“長(zhǎng)文本”能力和“系統(tǒng)性表達(dá)”，在 Researcher 這個(gè)產(chǎn)品上被推到極致，它更注重交付內(nèi)容的完整性和邏輯性。

Kimi不是做開(kāi)發(fā)者平臺(tái)，它要做的是“懂結(jié)構(gòu)、能調(diào)度”的模型本體。這也解釋了為什么它一上來(lái)就定位在最復(fù)雜的研究類(lèi)任務(wù)，因?yàn)檫@種任務(wù)能最大程度激活它預(yù)設(shè)的 Agent 內(nèi)部機(jī)制：澄清問(wèn)題、檢索并行、結(jié)構(gòu)統(tǒng)籌、表達(dá)生成。這不是讓你看到它能干什么，而是逼你意識(shí)到，你其實(shí)可以不再親自干。

這點(diǎn)對(duì)用戶心智的沖擊，其實(shí)比 MiniMax 更強(qiáng)。

MiniMax 反而是最像 Agent的那一個(gè)。你真的可以看到它調(diào)用了哪些函數(shù)，爬了哪些網(wǎng)頁(yè)，引用了哪段語(yǔ)料，它給你一個(gè)完整的操作軌道，你像是在 Debug 一個(gè)機(jī)器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當(dāng)成 Agent 的 IDE ——你是工程師，它是執(zhí)行層。

但這個(gè)過(guò)程中，大多數(shù)用戶其實(shí)是有門(mén)檻的。

你需要理解：插件怎么綁定、變量怎么配置、路徑怎么切換、長(zhǎng)文本怎么緩存……你得像在搭一個(gè)流程工廠。而 Kimi 則直接告訴你：“你什么都不用管，只要告訴我要結(jié)果?！?/p>

這個(gè)差別說(shuō)到底，是兩家公司對(duì)智能體未來(lái)形態(tài)的不同下注。

MiniMax 賭的是：AI 應(yīng)該成為一個(gè)流程平臺(tái)，你來(lái)決定它長(zhǎng)成什么樣。

Kimi 賭的是：AI 應(yīng)該直接成為一個(gè)能干事的角色，讓你不再需要流程本身。

這兩條路背后的預(yù)設(shè)完全不同。一個(gè)相信每個(gè)用戶都該擁有自己的Agent，一個(gè)相信模型應(yīng)該成為能自動(dòng)執(zhí)行復(fù)雜任務(wù)的交付體。

Kimi 是在重新定義什么是工具，MiniMax 是在放大工具能到多深。

這場(chǎng)Agent戰(zhàn)役其實(shí)不是從用戶開(kāi)始的，而是從怎么分配任務(wù)這件事開(kāi)始的。而這，恰恰是大模型能力真正能走入現(xiàn)實(shí)的起點(diǎn)。

你以為你在選一個(gè)Agent工具，其實(shí)你在決定的是：你愿不愿意把解決問(wèn)題的方式，也一并交給它。

歡迎在評(píng)論區(qū)留言~
如需開(kāi)白請(qǐng)加小編微信：dongfangmark

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.