網易首頁 > 網易號 > 正文申請入駐

Manus聯(lián)合創(chuàng)始人張濤：智能體Agent的終極形態(tài)是什么？

2025-12-31 11:44:16　來源: 人工智能學家

北京舉報

分享至

來源：科技行者

作者：科技行者

鑒于Meta收購Manus的消息甚囂塵上，我們發(fā)現(xiàn)Manus這家公司在被收購之前，對外作出了一場公開演講，Manus AI聯(lián)合創(chuàng)始人兼首席產品官張濤，在10月29日新加坡企業(yè)發(fā)展局主辦的SWITCH大會上，分享了對于智能體的理解。

重新定義「智能體」

演講開始，張濤直擊當前市場的一大亂象，他說，2025年幾乎所有人都在談論“智能體”，但這個詞背后充滿了誤解，很多服務僅在聊天機器人中加入一些系統(tǒng)提示（System Prompt），比如“你現(xiàn)在是一個法律代理”或“你是一個金融代理”，然后便宣稱自己提供了智能體服務。

那么，究竟如何讓一個真正的“智能體”（AI Agent）與眾不同？張濤的答案只有一個詞：自主性（Agency）。

他說：“一個真正的智能體，必須具備獨立思考、獨立行動、獨立完成任務的能力，而不是僅僅被我們人類的指令所觸發(fā)。”

他做了一個對比。用聊天機器人時，用戶需要不斷地追問，你問一個問題，得到一個答案，然后再問下一個問題，整個過程是“一問一答”的被動式交互。而智能體的工作方式則完全不同，它更像一個自主的目標執(zhí)行者。

在此基礎上，還衍生了“通用智能體”（General Agent）的概念。張濤強調，通用智能體并非為某個特定任務而設計，而是一個擁有廣泛能力、能夠解決開放式問題的系統(tǒng)。

“這就像我們人類自己。當你的兒女去上大學時，你并不知道他們未來會做什么。他們會在大學里學習，然后開啟自己的職業(yè)生涯，最終成為一個我們從未想象過的人。”

在Manus內部，這個過程被簡化為三個步驟：思考（Think）、行動（Act）、學習（Learn）。

首先，智能體根據(jù)任務進行思考和規(guī)劃，并在過程中不斷反思、調整計劃。其次，它會基于思考結果，決定下一步應該執(zhí)行何種“行動”——這些行動是高度自動化的原子能力，例如讀寫文件、看網頁、運行終端命令或訪問數(shù)據(jù)庫。最后，在整個過程中，智能體會從與用戶的交互中學習，記住用戶的個人偏好，比如報告需要以PDF格式呈現(xiàn)。

“我們正在構建的是一個‘問題解決引擎’，而不僅僅是一個特定的應用程序。”張濤總結。

第一前沿：工具的「網絡效應」與涌現(xiàn)式的「軟件開發(fā)」

了解基本概念后，張濤開始深入探討他眼中智能體技術的三大前沿領域。

第一個，也是正在徹底改變軟件行業(yè)面貌的，是“自主能力”及其帶來的“工具的網絡效應”。

“在過去的15年軟件行業(yè)生涯中，我們構建軟件的方式是固定的，我們傾聽用戶需求，構思解決方案，然后進行設計、開發(fā)、測試、發(fā)布，最后收集用戶反饋。這是一個傳統(tǒng)的線性過程。”

然而，在Manus，產品的構建方式被徹底顛覆。張濤透露，目前Manus有三個核心用例：深度研究、日常工作報告與幻燈片制作、構建網站或AI應用。有意思的是，在產品最初于2025年3月發(fā)布時，開發(fā)團隊從未預想過這些具體用途。

那么，這些功能如何實現(xiàn)？

答案在于Manus的構建當中：他們只專注于打造一個通用的核心架構，并為系統(tǒng)提供足夠豐富的工具箱，這些工具包括圖像生成、代碼編寫、在虛擬機上讀寫文件，以及一個可以讓智能體自由瀏覽互聯(lián)網的瀏覽器。

然后，系統(tǒng)以一種近乎神奇的方式，自己找到了解決這些垂直領域問題的方法。

為了具體說明這種“涌現(xiàn)式”的能力，他分享了一個用戶案例。一位生物信息學的研究員，在自己的實驗室里需要處理一種特殊格式的設備文件，這種文件只能用一款特定的專有軟件打開。這位研究員沒有任何編程經驗，而實驗室對文件處理又有特殊的需求，這讓她一籌莫展。

于是，她將這個文件展示給了Manus。智能體首先自主上網研究，弄清楚了這是什么文件格式。接著，它竟然設法編寫了一個Python庫來處理這種格式，并最終為她的實驗室交付了一個Web服務。此后，不僅是她，她所有的同事都可以通過這個Web服務來處理這種特殊文件，以進行后續(xù)的數(shù)據(jù)分析。

“我們從未如此設計過Manus，我們只提供了基礎的工具和行動能力，智能體自己解決了這些開放式問題”，張濤說。

Manus首席科學家將這種現(xiàn)象命名為“工具的網絡效應”（Network Effect of Tools）。當你為智能體提供越多的工具，系統(tǒng)能力的邊界就會以非線性的方式擴展，涌現(xiàn)出你從未預料到的新能力——這也是Manus未來會持續(xù)為智能體增加更多工具和行動的核心原因。

第二前沿：7x24小時在線的「數(shù)字員工」

智能體的第二個前沿，也關乎它最終形態(tài)的實現(xiàn)——一個7天24小時為每個人不間斷工作的“數(shù)字員工”。

“也許明年的SWITCH大會，在座的一半人都將擁有一個為你24小時運行的智能體，甚至無需你提出問題。”張濤大膽預言。

要實現(xiàn)這一愿景，必須克服一個技術挑戰(zhàn)：構建一個能夠支持“長時運行任務”（Long-Running Tasks）的堅實基礎架構，目前的系統(tǒng)存在局限，一個任務運行幾分鐘或一小時后就可能失敗。Manus的目標遠不止于此，他們正致力于打造能夠支持任務連續(xù)運行24小時的架構，以解決那些極其復雜和耗時的問題。

除了持久性，速度也是關鍵。為此，Manus引入了“并行處理”（Parallelism）機制。

張濤以Manus在7月份發(fā)布的一項名為“廣泛研究”的功能為例：“如果你想對1000個不同的目標進行研究，你可以試試把這個任務交給其他工具，你會發(fā)現(xiàn)它們都會失敗。”

但在Manus內部，當接到這樣的任務時，系統(tǒng)會自動將這個任務分解為1000個獨立的子任務，并讓它們并發(fā)運行。這不但提升了效率，也避免了大型模型在處理長任務時可能出現(xiàn)的“惰性”或注意力衰減問題。這是一種只有通過專門的智能體架構才能實現(xiàn)的能力。

第三前沿：主動性是智能體的靈魂

在張濤看來，第三個前沿，也是最重要、最能體現(xiàn)“自主性”精髓的，是“主動性”（Proactivity）。

“我們認為，智能體應該在你要求它做某事之前就開始工作。自主性就意味著主動性。”張濤強調。

當前市面上的智能體產品，包括Manus在3月份發(fā)布的版本，仍然沒有達到智能體的終極形態(tài)，因為用戶仍需明確地提出問題或分配任務。而未來的圖景是，智能體將成為一個真正主動的伙伴。

為了實現(xiàn)這一點，Manus推出了“連接器”（Connectors）功能，允許用戶將自己的Gmail、日歷、Notion等個人工作流與代理連接。然而，他們發(fā)現(xiàn)，即使用戶連接了這些服務，很多人仍然不知道可以分配什么樣的任務給智能體。

于是，一個顛覆性想法誕生了：“為什么我們還需要用戶來提問呢？”

既然智能體已經通過連接器訪問了用戶的日歷和待辦事項，它已經知道了用戶正在忙什么。因此，使用智能體的最佳方式，是讓它基于用戶的個人上下文，主動開展工作。

張濤分享了他自己的日常體驗，一個內部原型已經讓他享受到了這種便利：“每天早上8點，我的Manus智能體會檢查我當天的日歷，如果發(fā)現(xiàn)有與外部伙伴的會議，它就會主動去研究參會者的背景資料，為我準備會議。這超級有用，我每天都在用。”

這便是「主動性」的用武之地。未來，你可能每天只需花5到10分鐘與智能體進行一些關鍵的對齊，但它會在后臺為你工作24小時。

企業(yè)破局的關鍵：從“替代思維”到“增效思維”

在描繪了技術前沿之后，張濤將話題轉向了更具挑戰(zhàn)性的商業(yè)現(xiàn)實：企業(yè)應如何擁抱智能體？

他指出，在過去兩年中，他看到許多身為行業(yè)領導者的朋友和創(chuàng)始人，在嘗試將AI智能體（Agentic AI）引入公司時，絕大多數(shù)都失敗了。為什么？

“因為當人們試圖在公司中應用AI時，他們腦海里冒出的第一個念頭是：‘我能用AI替代哪些員工？’”

張濤認為這正是問題的癥結所在，當你的出發(fā)點是“替代”時，你的整個思維框架就會被“風險控制”所主導。你會首先考慮：如果我解雇了這個人，現(xiàn)有的工作流程還能否正常運轉？你的焦點在于規(guī)避風險，而不是創(chuàng)造收益。

他倡導一種不同的思維模式：從“替代”（Replace）轉向“生成/增效”（Generate）。

“如果你開始思考如何用AI來增效，你腦海里冒出的第一個念頭會是：‘AI如何能讓我的頂尖員工的績效提升10倍？會出現(xiàn)哪些新的機會和可能性？’”在這種模式下，你的焦點轉向了“收益”，你看到的是一片藍海。

他強調，AI技術尚處早期，在這樣一個階段，如果只盯著風險，必然會錯失良機。而關注收益，則會讓你看到完全不同的景象。

為了印證這一點，他分享了一個發(fā)生在他身上的真實故事。今年1月，公司搬到新加坡后，CEO需要找公寓，與他合作的是房地產中介，當這位中介得知客戶是Manus的CEO后，她利用Manus為客戶制作了一份高度個性化的定制PPT。

這份長達12頁的PPT，詳細介紹了當天下午要看的三套公寓，不僅包含了戶型圖，還深入研究了公寓周邊的環(huán)境，如哪里有超市、醫(yī)院，以及頂級的餐廳和酒吧。這份報告的專業(yè)度和個性化程度，讓CEO感到非常驚喜，因為他從未想過一個房地產中介能提供如此水平的服務體驗。

“這正是AI如何賦能的體現(xiàn)，重點從來不是替代，那位中介仍然在那里，但借助AI，她的工作表現(xiàn)和客戶體驗得到了極大的提升。擁抱AI最重要的事，就是改變你的思維模式。”張濤總結。

跨越三大障礙

除了思維模式的轉變，張濤還指出了企業(yè)在擁抱AI時需要跨越的其他三個障礙：

第一，信任與上下文共享。人們普遍對與AI共享個人數(shù)據(jù)（如郵件）感到恐懼。張濤認為這只是一個時間問題，隨著技術的成熟和信任的建立，人們會逐漸愿意向自己的專屬智能體開放個人上下文。

第二，為人類而建的世界。當今絕大多數(shù)的工具和服務都是為人類操作而設計，未來，我們將會看到越來越多從第一天起就為AI交互而設計的“AI原生”工具。

第三，與AI協(xié)作的范式。在過去，我們習慣了機器增強我們的體力，但我們不習慣我們的“智力”也可以被規(guī)模化。學會如何與可規(guī)模化的智能體協(xié)作，是一個全新的課題，也是一道需要跨越的認知障礙。

他最后總結說，就像幾十年前需要學會打字、二十年前需要學會操作電腦一樣，從2025年開始，學會如何與智能體協(xié)作，將成為決定個人未來表現(xiàn)的關鍵技能。

閱讀最新前沿科技趨勢報告，請訪問歐米伽研究所的“未來知識庫”

https://wx.zsxq.com/group/454854145828

未來知識庫是“ 歐米伽未來研究所”建立的在線知識庫平臺，收藏的資料范圍包括人工智能、腦科學、互聯(lián)網、超級智能，數(shù)智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.