<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      實(shí)測(cè)Kimi首個(gè)Agent:智能體與模型之間的區(qū)隔消失了?

      0
      分享至


      這兩天,月之暗面上線了名為 Kimi-Researcher 的產(chǎn)品,以“模型即Agent”的思路切入,標(biāo)志著其在 Agent 路線上的一次明顯發(fā)力。


      如果大家還記得的話,就在 Kimi 發(fā)布的前一天,MiniMax 在 MiniMax Week 的第三天也啟動(dòng)了通用 Agent 的灰度測(cè)試。這兩家此前一度低調(diào)的公司幾乎在同一時(shí)段重新進(jìn)入公眾視野,也讓原本趨于平靜的 AI 四小強(qiáng)格局再次活躍起來(lái)。


      Kimi、MiniMax、智譜、階躍星辰,這幾位曾經(jīng)在大模型初期階段高頻出現(xiàn)的名字,如今正借助 Agent 的新賽道尋找新的突破口。不管是技術(shù)報(bào)告的更新、產(chǎn)品形態(tài)的演進(jìn),還是實(shí)際功能的迭代,幾家廠商都在以各自的節(jié)奏向外界釋放信號(hào)。

      這一輪產(chǎn)品集中露面的時(shí)間節(jié)點(diǎn)并非巧合。從時(shí)機(jī)上看,這一波集中亮相并非偶然。當(dāng)前,大模型正從純粹的問(wèn)答工具演進(jìn)為具備自主規(guī)劃、任務(wù)執(zhí)行與上下文記憶能力的智能體系統(tǒng)。Agent 正在從“增強(qiáng)生產(chǎn)力”轉(zhuǎn)向“替代部分人類(lèi)任務(wù)角色”。對(duì)于具備模型研發(fā)和產(chǎn)品整合能力的廠商來(lái)說(shuō),這是一次相對(duì)公平的新起點(diǎn)。

      01

      報(bào)告,不只是寫(xiě)完,還得像

      在這樣的背景下,Kimi 推出的 Kimi-Researcher 選擇了一個(gè)很明確的切入口:深度研究。

      這個(gè)定位本身就帶著濃厚的判斷意味。它不打資訊助手、也不打日常問(wèn)答,而是瞄準(zhǔn)了原本需要專(zhuān)業(yè)助理團(tuán)隊(duì)完成的任務(wù),例如梳理產(chǎn)業(yè)政策、比對(duì)跨國(guó)法規(guī)、生成調(diào)研報(bào)告等。

      這類(lèi)任務(wù)對(duì)模型的檢索、思考、組織、判斷能力要求極高,幾乎是對(duì) Agent 體系的全方位考驗(yàn)。

      話不多說(shuō),我們直接開(kāi)測(cè)。

      比如說(shuō)我想讓它分析下2025年上半年黃金價(jià)格波動(dòng)與美聯(lián)儲(chǔ)政策走向的關(guān)聯(lián)性。


      它沒(méi)有立刻開(kāi)始寫(xiě),而是反問(wèn)了我一些問(wèn)題,從研究邏輯本身出發(fā),主動(dòng)確認(rèn)這個(gè)任務(wù)到底該怎么做才不空轉(zhuǎn)。

      這種主動(dòng)澄清機(jī)制,是過(guò)去在 Deep Research(左圖展示為:ChatGPT的 research 模式)里很熟悉的,也不像 MiniMax (右圖展示為MiniMax Agent)那種一口氣跑完所有流程后才看結(jié)果的虛擬機(jī)結(jié)構(gòu),更接近一個(gè)“你提一個(gè)話題,它開(kāi)始一步步推”的助研模型。



      Kimi比GPT更貼心增添了“Include everything”按鈕,不是單純放開(kāi)信息源,而是直接把它切換到一種更傾向生成完整結(jié)構(gòu)報(bào)告的工作狀態(tài)。


      經(jīng)過(guò)大概十幾分鐘的等待,它一共生成了兩種版本。

      一種是我們熟悉的文字版研究報(bào)告,段落結(jié)構(gòu)清晰,語(yǔ)氣沉穩(wěn),整體邏輯偏向內(nèi)容層次 + 政策推導(dǎo);另一種則是自動(dòng)渲染的 HTML 格式報(bào)告,已經(jīng)配好封面、標(biāo)題、摘要、分節(jié)說(shuō)明,標(biāo)注出“核心發(fā)現(xiàn)”“關(guān)鍵風(fēng)險(xiǎn)”“歷史規(guī)律”這些結(jié)構(gòu)化小標(biāo)簽。

      網(wǎng)頁(yè)稿鏈接在這,有興趣的朋友們可以打開(kāi)看一看:

      https://www.kimi.com/preview/d1bpb4criic9fe1hgdk0?blockId=108


      內(nèi)容還是很豐富的。

      對(duì)經(jīng)常要做對(duì)內(nèi)材料和對(duì)外匯報(bào)的人來(lái)說(shuō),這種“寫(xiě)+排+渲”一體的體驗(yàn),確實(shí)提高了交付效率。

      你可以把它當(dāng)成是Word+Notion+研究助理的混合體,不僅能輸出內(nèi)容,還知道怎么讓內(nèi)容看起來(lái)像一份真的報(bào)告。

      然后我們也測(cè)了測(cè)生成PPT的能力。給它的任務(wù)是這樣的:

      梳理一下 Stable Diffusion 從最初發(fā)布到最新版本的演進(jìn)路線,列出各階段關(guān)鍵改進(jìn)與社區(qū)貢獻(xiàn)節(jié)點(diǎn),并作出PPT

      看起來(lái)是一個(gè)非常結(jié)構(gòu)化的問(wèn)題,理論上應(yīng)該正對(duì) Researcher 的下懷。但實(shí)際操作過(guò)程中,我們也發(fā)現(xiàn)了一些限制。

      1. 當(dāng)前版本仍未支持多任務(wù)并行(當(dāng)然,這可能只是內(nèi)測(cè)階段的限制,正式版是否優(yōu)化還有待觀察。)


      2. 并不能生成傳統(tǒng)PPT,只能是 HTML 格式報(bào)告。


      我們還是把report鏈接放在這里:

      https://www.kimi.com/preview/d1bmvgb1cvf506sb6okg?blockId=108


      不過(guò)也不能說(shuō)它表現(xiàn)不好。作為一個(gè)學(xué)術(shù)型Agent,它在報(bào)告里自動(dòng)加上了參考文獻(xiàn)鏈接,并用下劃線標(biāo)注出處。可以完成一整套可交付內(nèi)容。

      而這,恰恰就是很多 AI 工具還停留在段落生成時(shí)無(wú)法做到的部分。

      但當(dāng)我們把這個(gè)任務(wù)交給 MiniMax Agent 時(shí),體驗(yàn)就完全不同了:

      它不僅生成了 PPT,還一并打包了 PDF 報(bào)告、Markdown 研究文檔、圖表文件、項(xiàng)目任務(wù)表(todo.md)和用于可視化的 Python 腳本。

      你可以下載 .pptx 源文件,二次修改內(nèi)容和格式。也能查看 .md 的版本記錄、調(diào)圖的 .py 腳本,每一階段的中間產(chǎn)物全都可查。


      從產(chǎn)出形式來(lái)看,它給你的是一整個(gè)PPT 制作系統(tǒng),而不是一份靜態(tài)報(bào)告。

      02

      Kimi-Researcher和

      MiniMax Agent,哪個(gè)更適合你

      從執(zhí)行力上來(lái)說(shuō),兩者都已經(jīng)遠(yuǎn)超傳統(tǒng)意義上的聊天機(jī)器人——你不用再一句一句提示,它們可以自己補(bǔ)全問(wèn)題、拆解任務(wù),甚至按你沒(méi)說(shuō)出口的邏輯推下去。但使用下來(lái),兩者的Agent 感其實(shí)來(lái)自不同的方向。

      Kimi-Researcher 是任務(wù)導(dǎo)向的,它的邏輯很清楚:你給我一個(gè)研究型問(wèn)題,我就像一個(gè)訓(xùn)練過(guò)的助理那樣,問(wèn)你三件事、查五份資料、最后給你一份成稿。

      但 MiniMax 不太一樣。

      它更像一個(gè)運(yùn)行在虛擬機(jī)里的多工系統(tǒng)——你可以把它理解成你裝了一個(gè)干活的人,但這個(gè)人是你組裝出來(lái)的。他自己并不主張“要做研究”還是“要做運(yùn)營(yíng)”,而是你怎么設(shè)計(jì),他就按你的指令一步步走。有時(shí)候你會(huì)覺(jué)得,它像是個(gè)開(kāi)著調(diào)試模式的智能體,你能看到它每一步調(diào)用了什么插件、在哪個(gè)頁(yè)面抓了數(shù)據(jù)、用了哪個(gè)文檔里的知識(shí)。這種透明度很高的體驗(yàn),本質(zhì)上更像是你操控一個(gè)流程機(jī)器人,而不是和一個(gè)人打交道。

      如果說(shuō) Kimi 是把一個(gè)智能體藏在了模型背后,讓你感受到結(jié)果;那 MiniMax 更像是把智能體攤開(kāi)在你眼前,讓你參與構(gòu)建過(guò)程。兩者誰(shuí)更強(qiáng),不一定,但它們帶來(lái)的使用心智是完全不一樣的。

      還有一個(gè)重要差別,是默認(rèn)角色設(shè)定。

      Kimi 很明顯是自帶性格的——不夸張地說(shuō),它的Researcher標(biāo)簽決定了它的行為方式,比如它更關(guān)注嚴(yán)謹(jǐn)表達(dá)、更傾向于做出規(guī)范排版、更容易使用資料比對(duì)視角進(jìn)行總結(jié)。

      而 MiniMax 給你的更多是空角色模板——你自己來(lái)寫(xiě) prompt,自己搭建鏈路,它才啟動(dòng)真正的 Agent 能力。

      我不是說(shuō)哪個(gè)更好,我只是說(shuō)它們?cè)趯?shí)現(xiàn)Agent這件事上,走的是完全不同的路徑。

      在我們深度體驗(yàn)兩者后,給出用戶一句話結(jié)論:如果你更在意“我提個(gè)需求就能直接拿到結(jié)果”,Kimi 會(huì)是更順手的選擇;但如果你希望掌控整個(gè)任務(wù)的執(zhí)行流程、甚至自己定義智能體的邏輯結(jié)構(gòu),那 MiniMax 可能更適合你。

      03

      Kimi 做結(jié)果,MiniMax 做過(guò)程

      說(shuō)到底,Kimi 和 MiniMax 的這次同步出招,看起來(lái)像是在做 Agent,其實(shí)是在做一次底層策略切換。

      Kimi 把“模型即 Agent”這件事做得非常徹底。你看不到 Agent 配置、插件安裝、工作流設(shè)計(jì)這些 Developer 套路,它不是在鼓勵(lì)你搭建 Agent,而是干脆告訴你:“Agent 本身就是模型的一部分了”。你想研究政策,它就用研究員的方式回應(yīng)你。它把智能體的控制權(quán)從用戶界面撤回到了模型內(nèi)部,交給了系統(tǒng)自動(dòng)調(diào)度。

      這一點(diǎn)是很多人沒(méi)意識(shí)到的。

      過(guò)去我們理解的智能體,是我來(lái)設(shè)計(jì)、我來(lái)組合,但 Kimi 的思路是,你不需要設(shè)計(jì),你只要告訴我你要什么結(jié)果,我來(lái)決定應(yīng)該找誰(shuí)干活、用什么方法、怎么安排流程。

      它把整個(gè) Agent 系統(tǒng)做成了一個(gè)黑箱,你丟任務(wù)進(jìn)去,它自己完成任務(wù)拆解、插件調(diào)用、資料組織和內(nèi)容生成。就像你發(fā)了封工作郵件,過(guò)一陣就能收到一份干凈利落的文檔回復(fù)。

      很多人還在找插件入口,Kimi 已經(jīng)在去插件化。

      這兩種產(chǎn)品方向的不同,其實(shí)也能看出背后公司在策略上的側(cè)重點(diǎn)。Kimi 一直強(qiáng)調(diào)“長(zhǎng)文本”能力和“系統(tǒng)性表達(dá)”,在 Researcher 這個(gè)產(chǎn)品上被推到極致,它更注重交付內(nèi)容的完整性和邏輯性。

      Kimi不是做開(kāi)發(fā)者平臺(tái),它要做的是“懂結(jié)構(gòu)、能調(diào)度”的模型本體。這也解釋了為什么它一上來(lái)就定位在最復(fù)雜的研究類(lèi)任務(wù),因?yàn)檫@種任務(wù)能最大程度激活它預(yù)設(shè)的 Agent 內(nèi)部機(jī)制:澄清問(wèn)題、檢索并行、結(jié)構(gòu)統(tǒng)籌、表達(dá)生成。這不是讓你看到它能干什么,而是逼你意識(shí)到,你其實(shí)可以不再親自干。

      這點(diǎn)對(duì)用戶心智的沖擊,其實(shí)比 MiniMax 更強(qiáng)。

      MiniMax 反而是最像 Agent的那一個(gè)。你真的可以看到它調(diào)用了哪些函數(shù),爬了哪些網(wǎng)頁(yè),引用了哪段語(yǔ)料,它給你一個(gè)完整的操作軌道,你像是在 Debug 一個(gè)機(jī)器人的思路流程。這讓它特別適合那些自己有一套流程、知道怎么干活的人。你可以把它當(dāng)成 Agent 的 IDE ——你是工程師,它是執(zhí)行層。

      但這個(gè)過(guò)程中,大多數(shù)用戶其實(shí)是有門(mén)檻的。

      你需要理解:插件怎么綁定、變量怎么配置、路徑怎么切換、長(zhǎng)文本怎么緩存……你得像在搭一個(gè)流程工廠。而 Kimi 則直接告訴你:“你什么都不用管,只要告訴我要結(jié)果?!?/p>

      這個(gè)差別說(shuō)到底,是兩家公司對(duì)智能體未來(lái)形態(tài)的不同下注。

      MiniMax 賭的是:AI 應(yīng)該成為一個(gè)流程平臺(tái),你來(lái)決定它長(zhǎng)成什么樣。

      Kimi 賭的是:AI 應(yīng)該直接成為一個(gè)能干事的角色,讓你不再需要流程本身。

      這兩條路背后的預(yù)設(shè)完全不同。一個(gè)相信每個(gè)用戶都該擁有自己的Agent,一個(gè)相信模型應(yīng)該成為能自動(dòng)執(zhí)行復(fù)雜任務(wù)的交付體。

      Kimi 是在重新定義什么是工具,MiniMax 是在放大工具能到多深。

      這場(chǎng)Agent戰(zhàn)役其實(shí)不是從用戶開(kāi)始的,而是從怎么分配任務(wù)這件事開(kāi)始的。而這,恰恰是大模型能力真正能走入現(xiàn)實(shí)的起點(diǎn)。

      你以為你在選一個(gè)Agent工具,其實(shí)你在決定的是:你愿不愿意把解決問(wèn)題的方式,也一并交給它。


      歡迎在評(píng)論區(qū)留言~
      如需開(kāi)白請(qǐng)加小編微信:dongfangmark

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      63歲大媽每天早上吃藍(lán)莓,已經(jīng)堅(jiān)持了5年,體檢后醫(yī)生:方法不錯(cuò)

      63歲大媽每天早上吃藍(lán)莓,已經(jīng)堅(jiān)持了5年,體檢后醫(yī)生:方法不錯(cuò)

      觀星賞月
      2026-04-09 12:59:21
      超市5大“廉價(jià)酒”,純糧釀外行人卻看不上,內(nèi)行人都整箱往家搬

      超市5大“廉價(jià)酒”,純糧釀外行人卻看不上,內(nèi)行人都整箱往家搬

      濤哥美食匯
      2026-04-10 09:55:58
      重大勝利!美國(guó)高層召開(kāi)新聞發(fā)布會(huì),介紹針對(duì)伊朗行動(dòng)的重大戰(zhàn)果

      重大勝利!美國(guó)高層召開(kāi)新聞發(fā)布會(huì),介紹針對(duì)伊朗行動(dòng)的重大戰(zhàn)果

      小蘿卜絲
      2026-04-08 22:17:45
      卷入全紅嬋網(wǎng)暴事件!陳芋汐4個(gè)月前含淚:有人挑撥離間我倆關(guān)系

      卷入全紅嬋網(wǎng)暴事件!陳芋汐4個(gè)月前含淚:有人挑撥離間我倆關(guān)系

      風(fēng)過(guò)鄉(xiāng)
      2026-04-09 06:13:32
      當(dāng)不成首相了?高市身體出了問(wèn)題,日本請(qǐng)求對(duì)話,伊朗潑了冷水

      當(dāng)不成首相了?高市身體出了問(wèn)題,日本請(qǐng)求對(duì)話,伊朗潑了冷水

      青煙小先生
      2026-04-10 10:14:07
      阿勒代斯:C羅想走馬上就走了,馬奎爾是足壇最有耐心的人

      阿勒代斯:C羅想走馬上就走了,馬奎爾是足壇最有耐心的人

      懂球帝
      2026-04-10 10:22:09
      國(guó)產(chǎn)旗艦親民定價(jià):華為Mate 90 Pro遇2026國(guó)補(bǔ),換機(jī)更輕松

      國(guó)產(chǎn)旗艦親民定價(jià):華為Mate 90 Pro遇2026國(guó)補(bǔ),換機(jī)更輕松

      時(shí)尚的弄潮
      2026-04-10 06:34:37
      皇馬新星“作死”!全隊(duì)怒火中燒,離隊(duì)已成定局!

      皇馬新星“作死”!全隊(duì)怒火中燒,離隊(duì)已成定局!

      瀾歸序
      2026-04-10 05:26:30
      歐冠首回合收官,3隊(duì)主場(chǎng)輸球!懸念已不大,4強(qiáng)預(yù)測(cè)巴薩皇馬出局

      歐冠首回合收官,3隊(duì)主場(chǎng)輸球!懸念已不大,4強(qiáng)預(yù)測(cè)巴薩皇馬出局

      小火箭愛(ài)體育
      2026-04-09 12:35:19
      廣東一空調(diào)工人沒(méi)吃早餐,高空作業(yè)時(shí)突發(fā)暈厥,同事發(fā)現(xiàn)后咬牙托舉

      廣東一空調(diào)工人沒(méi)吃早餐,高空作業(yè)時(shí)突發(fā)暈厥,同事發(fā)現(xiàn)后咬牙托舉

      環(huán)球網(wǎng)資訊
      2026-04-09 14:20:06
      伊朗革命衛(wèi)隊(duì)海軍:霍爾木茲海峽管控進(jìn)入“新階段”

      伊朗革命衛(wèi)隊(duì)海軍:霍爾木茲海峽管控進(jìn)入“新階段”

      每日經(jīng)濟(jì)新聞
      2026-04-10 09:19:37
      三位教育部副部長(zhǎng)密集調(diào)研,釋放重要信號(hào)!

      三位教育部副部長(zhǎng)密集調(diào)研,釋放重要信號(hào)!

      麥可思研究
      2026-04-10 10:38:14
      砍17分9助攻!中國(guó)女籃25歲后衛(wèi)復(fù)蘇再?zèng)_冠:宮魯鳴召回她?

      砍17分9助攻!中國(guó)女籃25歲后衛(wèi)復(fù)蘇再?zèng)_冠:宮魯鳴召回她?

      李喜林籃球絕殺
      2026-04-10 10:37:11
      博主解釋C羅進(jìn)球數(shù)為何是967,C羅評(píng)論:接受事實(shí)是一種美德

      博主解釋C羅進(jìn)球數(shù)為何是967,C羅評(píng)論:接受事實(shí)是一種美德

      懂球帝
      2026-04-10 09:50:23
      萬(wàn)斯抨擊澤連斯基:“完全不可接受”

      萬(wàn)斯抨擊澤連斯基:“完全不可接受”

      環(huán)球時(shí)報(bào)國(guó)際
      2026-04-09 23:30:07
      北大連夜報(bào)喜!1納米芯片繞開(kāi)光刻機(jī),中國(guó)換道超車(chē),西方失算了

      北大連夜報(bào)喜!1納米芯片繞開(kāi)光刻機(jī),中國(guó)換道超車(chē),西方失算了

      失我者永失qq
      2026-04-09 22:19:02
      做了連戰(zhàn)馬英九沒(méi)敢做的事,鄭麗文專(zhuān)機(jī)將飛進(jìn)北京,島內(nèi)風(fēng)向要變

      做了連戰(zhàn)馬英九沒(méi)敢做的事,鄭麗文專(zhuān)機(jī)將飛進(jìn)北京,島內(nèi)風(fēng)向要變

      南宗歷史
      2026-04-09 04:46:58
      恩佐轉(zhuǎn)會(huì)皇馬進(jìn)展:切爾西愿意放人,要價(jià)1.2億歐,皇馬只給1億!

      恩佐轉(zhuǎn)會(huì)皇馬進(jìn)展:切爾西愿意放人,要價(jià)1.2億歐,皇馬只給1億!

      海浪星體育
      2026-04-10 09:00:14
      油價(jià)180°大變,92汽油接近9元/升后,下次4月21日調(diào)價(jià),恢復(fù)下跌

      油價(jià)180°大變,92汽油接近9元/升后,下次4月21日調(diào)價(jià),恢復(fù)下跌

      豬友巴巴
      2026-04-10 09:54:14
      特朗普宣布:美軍“將繼續(xù)駐扎在伊朗境內(nèi)及周邊”,美伊達(dá)成共識(shí),伊朗將絕無(wú)核武器,霍爾木茲海峽必須保持開(kāi)放,或由美伊“合資經(jīng)營(yíng)”

      特朗普宣布:美軍“將繼續(xù)駐扎在伊朗境內(nèi)及周邊”,美伊達(dá)成共識(shí),伊朗將絕無(wú)核武器,霍爾木茲海峽必須保持開(kāi)放,或由美伊“合資經(jīng)營(yíng)”

      每日經(jīng)濟(jì)新聞
      2026-04-09 14:19:51
      2026-04-10 11:07:00
      直面派 incentive-icons
      直面派
      講述值得講述的真實(shí)故事
      258文章數(shù) 237關(guān)注度
      往期回顧 全部

      科技要聞

      程序員驚喜,每月100美元!OpenAI推新套餐

      頭條要聞

      牛彈琴:巴基斯坦被以色列激怒了 這是一個(gè)不祥的信號(hào)

      頭條要聞

      牛彈琴:巴基斯坦被以色列激怒了 這是一個(gè)不祥的信號(hào)

      體育要聞

      把孫穎莎逼入絕境后,18歲非洲女孩哭著離場(chǎng)

      娛樂(lè)要聞

      夏克立婚內(nèi)出軌 曾參加《爸爸去哪兒》

      財(cái)經(jīng)要聞

      AI短劇"買(mǎi)臉"成風(fēng) 肖像生意成灰色產(chǎn)業(yè)

      汽車(chē)要聞

      全新一代理想 L8 五座旗艦+5C增程系統(tǒng) 三季度交付

      態(tài)度原創(chuàng)

      時(shí)尚
      旅游
      游戲
      數(shù)碼
      公開(kāi)課

      越來(lái)越流行的松弛感穿搭,照著穿就很好看

      旅游要聞

      花開(kāi)如雪 云南南華這株古流蘇樹(shù)驚艷春天

      太用心!《控制》新作有完整中文配音

      數(shù)碼要聞

      群聯(lián)潘健成:SSD主控太難做了不賺錢(qián) 咱們合并吧!

      公開(kāi)課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版