![]()
Agent掀起的AI產(chǎn)品熱潮中,如今又進(jìn)化到了多智能體(Multi-Agent)時(shí)代,或者說(shuō)是L4 智能體時(shí)代。
當(dāng)然,這都是企業(yè)給自己產(chǎn)品的稱謂。核心就是多個(gè)任務(wù)流能一起工作,自主完成更復(fù)雜的任務(wù)。
從8月1日開(kāi)始熱鬧,Manus 發(fā)布Wide Research功能;到3日,360宣布首個(gè)L4 智能體納米AI蜂群;MasterAgent作為初創(chuàng)公司聲量很難比得過(guò)前兩者,但實(shí)際上也通過(guò)一些KOL在傳播首個(gè)L4 智能體的概念;APUS的天燕則正常上線,沒(méi)有過(guò)多傳播。
如果說(shuō)這幾款產(chǎn)品是多Agent的四大天王(實(shí)際上目前也就這幾款),鯨哥發(fā)現(xiàn)相比上一代Agent產(chǎn)品,進(jìn)步真的挺明顯,多任務(wù)的效率和復(fù)雜任務(wù)的處理結(jié)果,基本有一兩倍的效果提升。
![]()
這里簡(jiǎn)單總結(jié)下測(cè)評(píng)出來(lái)的大家亮點(diǎn):
Manus最大的亮點(diǎn)是多任務(wù)執(zhí)行效率更高,官宣是10個(gè)智能體同時(shí)能執(zhí)行10個(gè)任務(wù),內(nèi)部人說(shuō)最高2000+智能體同時(shí)工作,類似調(diào)研100家競(jìng)品公司這種任務(wù)就簡(jiǎn)單了;
納米AI則類似內(nèi)置了『扣子』,手動(dòng)或者自動(dòng)配置工作流兩種思路,并且能調(diào)用的MCP多,任務(wù)多樣性不錯(cuò);
而MasterAgent則是交互創(chuàng)新幅度最大的產(chǎn)品,每次生成幾個(gè)角色形象(Agent),不同角色分工完成任務(wù),看起來(lái)十分直觀清爽。
天燕則是產(chǎn)品有一定的進(jìn)步,在查商業(yè)信息查詢領(lǐng)域比較落地。
多說(shuō)無(wú)益,Agent主要是思考、規(guī)劃、執(zhí)行、反思幾個(gè)核心步驟,鯨哥認(rèn)為多Agent應(yīng)該考驗(yàn),多智能體在任務(wù)串并聯(lián)分解,以及錯(cuò)誤累加效應(yīng)處理效果等方面。
我們最終實(shí)測(cè)了商業(yè)計(jì)劃、運(yùn)營(yíng)設(shè)計(jì)、內(nèi)容創(chuàng)作、生活服務(wù)四大場(chǎng)景。重點(diǎn)關(guān)注了智能體的信息收集、數(shù)據(jù)分析、全流程鏈路、圖像生成以及復(fù)雜任務(wù)處理等,力求更全面還原“協(xié)作式智能群體”在真實(shí)工作流中的表現(xiàn)。
商業(yè)計(jì)劃?rùn)M評(píng)
比如在鯨哥的老家開(kāi)一家門(mén)店,向智能體提出具體的問(wèn)題提示詞,考驗(yàn)智能體對(duì)最新信息的準(zhǔn)確抓取、任務(wù)分解和執(zhí)最終回答的可用性。
提示詞:在四五線小城市赤峰開(kāi)一家門(mén)店,幫做一個(gè)完整調(diào)研,開(kāi)什么類型店(搜集網(wǎng)絡(luò)加盟信息),哪些店鋪便宜(搜集本地商鋪?zhàn)饨鹦畔ⅲ趺唇?jīng)營(yíng),以及如何回本和盈利。
MsterAgent在處理任務(wù)時(shí),首先會(huì)對(duì)提示詞進(jìn)行分解,再反饋用戶詢問(wèn)相關(guān)細(xì)節(jié)信息,為用戶量身定制更符合方案。當(dāng)然,不想一個(gè)一個(gè)回復(fù),也可以點(diǎn)擊「由AI補(bǔ)充」。
![]()
隨后,MsterAgent會(huì)生成四個(gè)智能體的工作組,點(diǎn)擊「立即運(yùn)行」,任務(wù)會(huì)自動(dòng)分給智能體工作。
![]()
MsterAgent是構(gòu)建單線程線性智能體的架構(gòu),任務(wù)拆解的角色十分清晰。但是,這種架構(gòu)的弊端是如果有大量子任務(wù)的大型任務(wù),會(huì)導(dǎo)致上下文窗口溢出,而MsterAgent大多數(shù)生成4個(gè)智能體,很少出現(xiàn)給到10個(gè)智能體角色解決任務(wù)。
![]()
master Agent
我們?cè)賮?lái)看最終結(jié)果,MsterAgent對(duì)抓取的信息完整,保持了任務(wù)的整體一致性和可控性。但多為宏觀新聞且內(nèi)容雜亂、有用性不強(qiáng),缺乏地方最新動(dòng)態(tài)。
同樣,納米在處理任務(wù)時(shí),首先會(huì)對(duì)提示詞進(jìn)行分解,分成多個(gè)任務(wù)。不同的是,納米會(huì)將任務(wù)生成后,是否需要修改的權(quán)力給了用戶,用戶在20秒內(nèi)可以修改任務(wù)執(zhí)行方案。
![]()
過(guò)程中也會(huì)調(diào)用MCP執(zhí)行不同的任務(wù),整個(gè)工作流程也清晰可見(jiàn)。值得注意的是,很多抓取新的網(wǎng)站需要用戶自己登錄賬號(hào),不然不能繼續(xù)執(zhí)行。
最終回答中,對(duì)城市畫(huà)像、加盟分析以及租金成本信息抓取完整,對(duì)法規(guī)政策也進(jìn)行了監(jiān)測(cè),真實(shí)參考性較強(qiáng)。
![]()
納米AI
APUS 天燕集合多家先進(jìn)大模型,內(nèi)置MCP工具鏈,通過(guò)分步的任務(wù),在處理實(shí)際復(fù)雜商業(yè)任務(wù)時(shí),響應(yīng)時(shí)間短,提升工作效率。但是APUS 天燕智能體缺乏反思機(jī)制,一旦信息錯(cuò)漏,中途難以調(diào)節(jié)思路。
![]()
APUS 天燕
Manus沒(méi)使用最高級(jí)版本,質(zhì)量模式下通過(guò)公開(kāi)信息的深入搜集和分析(10年前的新聞也找出來(lái)了),主動(dòng)調(diào)用瀏覽器、數(shù)據(jù)分析工具等完成任務(wù)。最終交付的結(jié)果存在AI幻覺(jué)(一本正經(jīng)的瞎編),需要人工進(jìn)一步篩查。
![]()
Manus
運(yùn)營(yíng)設(shè)計(jì)比拼
這里我們將智能體的內(nèi)容從文字升維到圖文,而是是超大量工作。這個(gè)任務(wù)挺考驗(yàn)圖片Agent的調(diào)用效果,以及多智能體的處理任務(wù)效率,畢竟如果是人工設(shè)計(jì)完成,沒(méi)有幾個(gè)月時(shí)間怕是辦不完。
提示詞:幫我給中國(guó)熊貓?jiān)O(shè)計(jì)一百套不同款式的穿搭。
master Agent從面料、元素、風(fēng)格等方面進(jìn)行設(shè)計(jì),甚至特別設(shè)計(jì)了幼年熊貓的方案。所有的設(shè)計(jì)稿最終以3D模型形式呈現(xiàn),非常直觀的看見(jiàn)最終效果,可惜的是只生成了8張圖片。
![]()
master Agent
納米AI僅生成了四張圖片,其中兩張還是無(wú)關(guān)的圖片,敦煌熊貓還挺萌的,還會(huì)出現(xiàn)任務(wù)過(guò)長(zhǎng)(超出上下文),可能會(huì)宣告失敗,執(zhí)行不落地。
![]()
納米AI
Manus像一個(gè)“自主性高的秘書(shū)”,它會(huì)自動(dòng)將任務(wù)拆分成多個(gè)小步驟,每個(gè)批次生成5張圖片,最終充分完成100張不同風(fēng)格的設(shè)計(jì)圖任務(wù)。
![]()
Manus
內(nèi)容創(chuàng)作競(jìng)賽
文生視頻一直是非常火的AI創(chuàng)作功能,于是鯨哥想測(cè)試一下多智能體是如何制作文生視頻創(chuàng)作的,也考驗(yàn)智能體對(duì)指令遵循、文本理解以及調(diào)用視頻、音頻模型的合成質(zhì)量。
根據(jù)“《靜夜思》床前看月光,疑是地上霜。舉頭望山月,低頭思故鄉(xiāng)。”生成相應(yīng)的視頻
master Agent通過(guò)水墨畫(huà)留白技法,使畫(huà)面既具體又具有想象空間,能深切的感受到月光光影的變化,同時(shí)又創(chuàng)作了四段式結(jié)構(gòu)原創(chuàng)音樂(lè),作品總時(shí)長(zhǎng)也控制在理想范圍內(nèi)。
MasterAgent
接近1個(gè)小時(shí),納米AI生成了一段講解視頻,對(duì)詩(shī)人李白《靜夜思》的理解也有一定的深度,視頻畫(huà)面流暢。不過(guò)中間有一段白素貞的畫(huà)面是什么鬼,腳本里也沒(méi)有,鯨哥懷疑是納米AI多智能體蜂群協(xié)作空間技術(shù),因缺乏共享上下文,產(chǎn)生了沖突回應(yīng)。
納米AI
生活服務(wù)優(yōu)選
旅游攻略制定想必困擾過(guò)非常多的人。尤其是在陪父母或者孩子時(shí),往往需要制定一個(gè)兼顧不同年齡層以及特殊需求的旅行計(jì)劃。智能體需要深度理解人類復(fù)雜任務(wù),考慮各種突發(fā)事件,為每一天都做好詳細(xì)的計(jì)劃。
提示詞:為35歲男性、60歲母親、懷孕3個(gè)月的孕婦和10歲孩子設(shè)計(jì)一份武漢一周旅游攻略。要求確保安全舒適,適合各年齡段和特殊身體狀況的家庭成員。
master Agent雖然說(shuō)針對(duì)不同需求人群制訂計(jì)劃,但是卻是特種兵旅行,第四天安排上午逛武漢植物園,下午就去木蘭草原了,大學(xué)生也沒(méi)這么旺盛的精力吧。
![]()
MasterAgent
納米AI在運(yùn)行時(shí),調(diào)取了小紅書(shū)和微博等平臺(tái),但是需要用戶自己登錄賬號(hào)密碼才能獲取,導(dǎo)致在執(zhí)行任務(wù)時(shí),用戶需要時(shí)不時(shí)觀察生成進(jìn)度。納米AI就像被擋在博物館門(mén)口的參觀者,想?yún)⒂^卻沒(méi)有門(mén)票。
![]()
納米AI
APUS 天燕考慮的最周全,不管是游玩建議時(shí)長(zhǎng)、游玩項(xiàng)目還是酒店/飲食/交通的有最優(yōu)推薦,還給出了避坑指南及行前準(zhǔn)備清單。
![]()
APUS 天燕
Manus生成的攻略比較擺爛,要求游玩七天,卻規(guī)劃酒店休息三天。景區(qū)游玩地點(diǎn)也是東一下西一下,不考慮路程的遠(yuǎn)近。
![]()
Manus
通過(guò)以上案例看,大家其實(shí)各有春秋。鯨哥試著總結(jié)下:
Manus還是圍繞Deep Research思路做多Agent產(chǎn)品,抱怨任務(wù)太燒Token、會(huì)員費(fèi)貴? 不好意思,這給精英做的產(chǎn)品,普通消費(fèi)者不是首要考慮目標(biāo)。
MasterAgent擁有最優(yōu)想法,但是自研模型帶來(lái)的短期弊端,就是能力確實(shí)跟不上一線大模型,很多任務(wù)分解的漂亮,結(jié)果卻差點(diǎn)意思,把好產(chǎn)品做成了玩具。
納米蜂群做得中庸,調(diào)用多家大模型,手動(dòng)、自動(dòng)多智能體協(xié)作,不同角色和不同人群都考慮到了,追求當(dāng)下的最佳效果。而且納米AI現(xiàn)在還有很多AI功能合集,你很難定義它是Agent 還是瀏覽器,還是AI商店。
APUS 天燕則是在跟上了第一波多智能體的浪潮,特定領(lǐng)域效果做到更好,整體產(chǎn)品還需要發(fā)展時(shí)間,只能說(shuō)免費(fèi)的要要啥自行車(chē)。
總體而言,多Agent正實(shí)現(xiàn)大模型從“一個(gè)聰明的個(gè)體”向“協(xié)作式智能群體”演進(jìn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.