網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

AI開(kāi)始學(xué)會(huì)合作？！實(shí)測(cè)4大多Agent體=10個(gè)打工人

2025-08-07 19:51:27　來(lái)源: 鯨選AI

北京舉報(bào)

分享至

Agent掀起的AI產(chǎn)品熱潮中，如今又進(jìn)化到了多智能體（Multi-Agent）時(shí)代，或者說(shuō)是L4 智能體時(shí)代。

當(dāng)然，這都是企業(yè)給自己產(chǎn)品的稱謂。核心就是多個(gè)任務(wù)流能一起工作，自主完成更復(fù)雜的任務(wù)。

從8月1日開(kāi)始熱鬧，Manus 發(fā)布Wide Research功能；到3日，360宣布首個(gè)L4 智能體納米AI蜂群；MasterAgent作為初創(chuàng)公司聲量很難比得過(guò)前兩者，但實(shí)際上也通過(guò)一些KOL在傳播首個(gè)L4 智能體的概念；APUS的天燕則正常上線，沒(méi)有過(guò)多傳播。

如果說(shuō)這幾款產(chǎn)品是多Agent的四大天王（實(shí)際上目前也就這幾款），鯨哥發(fā)現(xiàn)相比上一代Agent產(chǎn)品，進(jìn)步真的挺明顯，多任務(wù)的效率和復(fù)雜任務(wù)的處理結(jié)果，基本有一兩倍的效果提升。

這里簡(jiǎn)單總結(jié)下測(cè)評(píng)出來(lái)的大家亮點(diǎn)：

Manus最大的亮點(diǎn)是多任務(wù)執(zhí)行效率更高，官宣是10個(gè)智能體同時(shí)能執(zhí)行10個(gè)任務(wù)，內(nèi)部人說(shuō)最高2000+智能體同時(shí)工作，類似調(diào)研100家競(jìng)品公司這種任務(wù)就簡(jiǎn)單了；

納米AI則類似內(nèi)置了『扣子』，手動(dòng)或者自動(dòng)配置工作流兩種思路，并且能調(diào)用的MCP多，任務(wù)多樣性不錯(cuò)；

而MasterAgent則是交互創(chuàng)新幅度最大的產(chǎn)品，每次生成幾個(gè)角色形象（Agent），不同角色分工完成任務(wù)，看起來(lái)十分直觀清爽。

天燕則是產(chǎn)品有一定的進(jìn)步，在查商業(yè)信息查詢領(lǐng)域比較落地。

多說(shuō)無(wú)益，Agent主要是思考、規(guī)劃、執(zhí)行、反思幾個(gè)核心步驟，鯨哥認(rèn)為多Agent應(yīng)該考驗(yàn)，多智能體在任務(wù)串并聯(lián)分解，以及錯(cuò)誤累加效應(yīng)處理效果等方面。

我們最終實(shí)測(cè)了商業(yè)計(jì)劃、運(yùn)營(yíng)設(shè)計(jì)、內(nèi)容創(chuàng)作、生活服務(wù)四大場(chǎng)景。重點(diǎn)關(guān)注了智能體的信息收集、數(shù)據(jù)分析、全流程鏈路、圖像生成以及復(fù)雜任務(wù)處理等，力求更全面還原“協(xié)作式智能群體”在真實(shí)工作流中的表現(xiàn)。

商業(yè)計(jì)劃?rùn)M評(píng)

比如在鯨哥的老家開(kāi)一家門(mén)店，向智能體提出具體的問(wèn)題提示詞，考驗(yàn)智能體對(duì)最新信息的準(zhǔn)確抓取、任務(wù)分解和執(zhí)最終回答的可用性。

提示詞：在四五線小城市赤峰開(kāi)一家門(mén)店，幫做一個(gè)完整調(diào)研，開(kāi)什么類型店（搜集網(wǎng)絡(luò)加盟信息），哪些店鋪便宜（搜集本地商鋪?zhàn)饨鹦畔ⅲ趺唇?jīng)營(yíng)，以及如何回本和盈利。

MsterAgent在處理任務(wù)時(shí)，首先會(huì)對(duì)提示詞進(jìn)行分解，再反饋用戶詢問(wèn)相關(guān)細(xì)節(jié)信息，為用戶量身定制更符合方案。當(dāng)然，不想一個(gè)一個(gè)回復(fù)，也可以點(diǎn)擊「由AI補(bǔ)充」。

隨后，MsterAgent會(huì)生成四個(gè)智能體的工作組，點(diǎn)擊「立即運(yùn)行」，任務(wù)會(huì)自動(dòng)分給智能體工作。

MsterAgent是構(gòu)建單線程線性智能體的架構(gòu)，任務(wù)拆解的角色十分清晰。但是，這種架構(gòu)的弊端是如果有大量子任務(wù)的大型任務(wù)，會(huì)導(dǎo)致上下文窗口溢出，而MsterAgent大多數(shù)生成4個(gè)智能體，很少出現(xiàn)給到10個(gè)智能體角色解決任務(wù)。

master Agent

我們?cè)賮?lái)看最終結(jié)果，MsterAgent對(duì)抓取的信息完整，保持了任務(wù)的整體一致性和可控性。但多為宏觀新聞且內(nèi)容雜亂、有用性不強(qiáng)，缺乏地方最新動(dòng)態(tài)。

同樣，納米在處理任務(wù)時(shí)，首先會(huì)對(duì)提示詞進(jìn)行分解，分成多個(gè)任務(wù)。不同的是，納米會(huì)將任務(wù)生成后，是否需要修改的權(quán)力給了用戶，用戶在20秒內(nèi)可以修改任務(wù)執(zhí)行方案。

過(guò)程中也會(huì)調(diào)用MCP執(zhí)行不同的任務(wù)，整個(gè)工作流程也清晰可見(jiàn)。值得注意的是，很多抓取新的網(wǎng)站需要用戶自己登錄賬號(hào)，不然不能繼續(xù)執(zhí)行。

最終回答中，對(duì)城市畫(huà)像、加盟分析以及租金成本信息抓取完整，對(duì)法規(guī)政策也進(jìn)行了監(jiān)測(cè)，真實(shí)參考性較強(qiáng)。

納米AI

APUS 天燕集合多家先進(jìn)大模型，內(nèi)置MCP工具鏈，通過(guò)分步的任務(wù)，在處理實(shí)際復(fù)雜商業(yè)任務(wù)時(shí)，響應(yīng)時(shí)間短，提升工作效率。但是APUS 天燕智能體缺乏反思機(jī)制，一旦信息錯(cuò)漏，中途難以調(diào)節(jié)思路。

APUS 天燕

Manus沒(méi)使用最高級(jí)版本，質(zhì)量模式下通過(guò)公開(kāi)信息的深入搜集和分析（10年前的新聞也找出來(lái)了），主動(dòng)調(diào)用瀏覽器、數(shù)據(jù)分析工具等完成任務(wù)。最終交付的結(jié)果存在AI幻覺(jué)（一本正經(jīng)的瞎編），需要人工進(jìn)一步篩查。

Manus

運(yùn)營(yíng)設(shè)計(jì)比拼

這里我們將智能體的內(nèi)容從文字升維到圖文，而是是超大量工作。這個(gè)任務(wù)挺考驗(yàn)圖片Agent的調(diào)用效果，以及多智能體的處理任務(wù)效率，畢竟如果是人工設(shè)計(jì)完成，沒(méi)有幾個(gè)月時(shí)間怕是辦不完。

提示詞：幫我給中國(guó)熊貓?jiān)O(shè)計(jì)一百套不同款式的穿搭。

master Agent從面料、元素、風(fēng)格等方面進(jìn)行設(shè)計(jì)，甚至特別設(shè)計(jì)了幼年熊貓的方案。所有的設(shè)計(jì)稿最終以3D模型形式呈現(xiàn)，非常直觀的看見(jiàn)最終效果，可惜的是只生成了8張圖片。

master Agent

納米AI僅生成了四張圖片，其中兩張還是無(wú)關(guān)的圖片，敦煌熊貓還挺萌的，還會(huì)出現(xiàn)任務(wù)過(guò)長(zhǎng)（超出上下文），可能會(huì)宣告失敗，執(zhí)行不落地。

納米AI

Manus像一個(gè)“自主性高的秘書(shū)”，它會(huì)自動(dòng)將任務(wù)拆分成多個(gè)小步驟，每個(gè)批次生成5張圖片，最終充分完成100張不同風(fēng)格的設(shè)計(jì)圖任務(wù)。

Manus

內(nèi)容創(chuàng)作競(jìng)賽

文生視頻一直是非常火的AI創(chuàng)作功能，于是鯨哥想測(cè)試一下多智能體是如何制作文生視頻創(chuàng)作的，也考驗(yàn)智能體對(duì)指令遵循、文本理解以及調(diào)用視頻、音頻模型的合成質(zhì)量。

根據(jù)“《靜夜思》床前看月光，疑是地上霜。舉頭望山月，低頭思故鄉(xiāng)。”生成相應(yīng)的視頻

master Agent通過(guò)水墨畫(huà)留白技法，使畫(huà)面既具體又具有想象空間，能深切的感受到月光光影的變化，同時(shí)又創(chuàng)作了四段式結(jié)構(gòu)原創(chuàng)音樂(lè)，作品總時(shí)長(zhǎng)也控制在理想范圍內(nèi)。

MasterAgent

接近1個(gè)小時(shí)，納米AI生成了一段講解視頻，對(duì)詩(shī)人李白《靜夜思》的理解也有一定的深度，視頻畫(huà)面流暢。不過(guò)中間有一段白素貞的畫(huà)面是什么鬼，腳本里也沒(méi)有，鯨哥懷疑是納米AI多智能體蜂群協(xié)作空間技術(shù)，因缺乏共享上下文，產(chǎn)生了沖突回應(yīng)。

納米AI

生活服務(wù)優(yōu)選

旅游攻略制定想必困擾過(guò)非常多的人。尤其是在陪父母或者孩子時(shí)，往往需要制定一個(gè)兼顧不同年齡層以及特殊需求的旅行計(jì)劃。智能體需要深度理解人類復(fù)雜任務(wù)，考慮各種突發(fā)事件，為每一天都做好詳細(xì)的計(jì)劃。

提示詞：為35歲男性、60歲母親、懷孕3個(gè)月的孕婦和10歲孩子設(shè)計(jì)一份武漢一周旅游攻略。要求確保安全舒適，適合各年齡段和特殊身體狀況的家庭成員。

master Agent雖然說(shuō)針對(duì)不同需求人群制訂計(jì)劃，但是卻是特種兵旅行，第四天安排上午逛武漢植物園，下午就去木蘭草原了，大學(xué)生也沒(méi)這么旺盛的精力吧。

MasterAgent

納米AI在運(yùn)行時(shí)，調(diào)取了小紅書(shū)和微博等平臺(tái)，但是需要用戶自己登錄賬號(hào)密碼才能獲取，導(dǎo)致在執(zhí)行任務(wù)時(shí)，用戶需要時(shí)不時(shí)觀察生成進(jìn)度。納米AI就像被擋在博物館門(mén)口的參觀者，想?yún)⒂^卻沒(méi)有門(mén)票。

納米AI

APUS 天燕考慮的最周全，不管是游玩建議時(shí)長(zhǎng)、游玩項(xiàng)目還是酒店/飲食/交通的有最優(yōu)推薦，還給出了避坑指南及行前準(zhǔn)備清單。

APUS 天燕

Manus生成的攻略比較擺爛，要求游玩七天，卻規(guī)劃酒店休息三天。景區(qū)游玩地點(diǎn)也是東一下西一下，不考慮路程的遠(yuǎn)近。

Manus

通過(guò)以上案例看，大家其實(shí)各有春秋。鯨哥試著總結(jié)下：

Manus還是圍繞Deep Research思路做多Agent產(chǎn)品，抱怨任務(wù)太燒Token、會(huì)員費(fèi)貴? 不好意思，這給精英做的產(chǎn)品，普通消費(fèi)者不是首要考慮目標(biāo)。

MasterAgent擁有最優(yōu)想法，但是自研模型帶來(lái)的短期弊端，就是能力確實(shí)跟不上一線大模型，很多任務(wù)分解的漂亮，結(jié)果卻差點(diǎn)意思，把好產(chǎn)品做成了玩具。

納米蜂群做得中庸，調(diào)用多家大模型，手動(dòng)、自動(dòng)多智能體協(xié)作，不同角色和不同人群都考慮到了，追求當(dāng)下的最佳效果。而且納米AI現(xiàn)在還有很多AI功能合集，你很難定義它是Agent 還是瀏覽器，還是AI商店。

APUS 天燕則是在跟上了第一波多智能體的浪潮，特定領(lǐng)域效果做到更好，整體產(chǎn)品還需要發(fā)展時(shí)間，只能說(shuō)免費(fèi)的要要啥自行車(chē)。

總體而言，多Agent正實(shí)現(xiàn)大模型從“一個(gè)聰明的個(gè)體”向“協(xié)作式智能群體”演進(jìn)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.