![]()
來源:科技行者
作者:科技行者
鑒于Meta收購Manus的消息甚囂塵上,我們發(fā)現(xiàn)Manus這家公司在被收購之前,對外作出了一場公開演講,Manus AI聯(lián)合創(chuàng)始人兼首席產品官張濤,在10月29日新加坡企業(yè)發(fā)展局主辦的SWITCH大會上,分享了對于智能體的理解。
重新定義「智能體」
演講開始,張濤直擊當前市場的一大亂象,他說,2025年幾乎所有人都在談論“智能體”,但這個詞背后充滿了誤解,很多服務僅在聊天機器人中加入一些系統(tǒng)提示(System Prompt),比如“你現(xiàn)在是一個法律代理”或“你是一個金融代理”,然后便宣稱自己提供了智能體服務。
那么,究竟如何讓一個真正的“智能體”(AI Agent)與眾不同?張濤的答案只有一個詞:自主性(Agency)。
他說:“一個真正的智能體,必須具備獨立思考、獨立行動、獨立完成任務的能力,而不是僅僅被我們人類的指令所觸發(fā)。”
他做了一個對比。用聊天機器人時,用戶需要不斷地追問,你問一個問題,得到一個答案,然后再問下一個問題,整個過程是“一問一答”的被動式交互。而智能體的工作方式則完全不同,它更像一個自主的目標執(zhí)行者。
在此基礎上,還衍生了“通用智能體”(General Agent)的概念。張濤強調,通用智能體并非為某個特定任務而設計,而是一個擁有廣泛能力、能夠解決開放式問題的系統(tǒng)。
“這就像我們人類自己。當你的兒女去上大學時,你并不知道他們未來會做什么。他們會在大學里學習,然后開啟自己的職業(yè)生涯,最終成為一個我們從未想象過的人。”
在Manus內部,這個過程被簡化為三個步驟:思考(Think)、行動(Act)、學習(Learn)。
首先,智能體根據(jù)任務進行思考和規(guī)劃,并在過程中不斷反思、調整計劃。其次,它會基于思考結果,決定下一步應該執(zhí)行何種“行動”——這些行動是高度自動化的原子能力,例如讀寫文件、看網頁、運行終端命令或訪問數(shù)據(jù)庫。最后,在整個過程中,智能體會從與用戶的交互中學習,記住用戶的個人偏好,比如報告需要以PDF格式呈現(xiàn)。
“我們正在構建的是一個‘問題解決引擎’,而不僅僅是一個特定的應用程序。”張濤總結。
![]()
第一前沿:工具的「網絡效應」與涌現(xiàn)式的「軟件開發(fā)」
了解基本概念后,張濤開始深入探討他眼中智能體技術的三大前沿領域。
第一個,也是正在徹底改變軟件行業(yè)面貌的,是“自主能力”及其帶來的“工具的網絡效應”。
“在過去的15年軟件行業(yè)生涯中,我們構建軟件的方式是固定的,我們傾聽用戶需求,構思解決方案,然后進行設計、開發(fā)、測試、發(fā)布,最后收集用戶反饋。這是一個傳統(tǒng)的線性過程。”
然而,在Manus,產品的構建方式被徹底顛覆。張濤透露,目前Manus有三個核心用例:深度研究、日常工作報告與幻燈片制作、構建網站或AI應用。有意思的是,在產品最初于2025年3月發(fā)布時,開發(fā)團隊從未預想過這些具體用途。
那么,這些功能如何實現(xiàn)?
答案在于Manus的構建當中:他們只專注于打造一個通用的核心架構,并為系統(tǒng)提供足夠豐富的工具箱,這些工具包括圖像生成、代碼編寫、在虛擬機上讀寫文件,以及一個可以讓智能體自由瀏覽互聯(lián)網的瀏覽器。
然后,系統(tǒng)以一種近乎神奇的方式,自己找到了解決這些垂直領域問題的方法。
為了具體說明這種“涌現(xiàn)式”的能力,他分享了一個用戶案例。一位生物信息學的研究員,在自己的實驗室里需要處理一種特殊格式的設備文件,這種文件只能用一款特定的專有軟件打開。這位研究員沒有任何編程經驗,而實驗室對文件處理又有特殊的需求,這讓她一籌莫展。
于是,她將這個文件展示給了Manus。智能體首先自主上網研究,弄清楚了這是什么文件格式。接著,它竟然設法編寫了一個Python庫來處理這種格式,并最終為她的實驗室交付了一個Web服務。此后,不僅是她,她所有的同事都可以通過這個Web服務來處理這種特殊文件,以進行后續(xù)的數(shù)據(jù)分析。
“我們從未如此設計過Manus,我們只提供了基礎的工具和行動能力,智能體自己解決了這些開放式問題”,張濤說。
Manus首席科學家將這種現(xiàn)象命名為“工具的網絡效應”(Network Effect of Tools)。當你為智能體提供越多的工具,系統(tǒng)能力的邊界就會以非線性的方式擴展,涌現(xiàn)出你從未預料到的新能力——這也是Manus未來會持續(xù)為智能體增加更多工具和行動的核心原因。
![]()
第二前沿:7x24小時在線的「數(shù)字員工」
智能體的第二個前沿,也關乎它最終形態(tài)的實現(xiàn)——一個7天24小時為每個人不間斷工作的“數(shù)字員工”。
“也許明年的SWITCH大會,在座的一半人都將擁有一個為你24小時運行的智能體,甚至無需你提出問題。”張濤大膽預言。
要實現(xiàn)這一愿景,必須克服一個技術挑戰(zhàn):構建一個能夠支持“長時運行任務”(Long-Running Tasks)的堅實基礎架構,目前的系統(tǒng)存在局限,一個任務運行幾分鐘或一小時后就可能失敗。Manus的目標遠不止于此,他們正致力于打造能夠支持任務連續(xù)運行24小時的架構,以解決那些極其復雜和耗時的問題。
除了持久性,速度也是關鍵。為此,Manus引入了“并行處理”(Parallelism)機制。
張濤以Manus在7月份發(fā)布的一項名為“廣泛研究”的功能為例:“如果你想對1000個不同的目標進行研究,你可以試試把這個任務交給其他工具,你會發(fā)現(xiàn)它們都會失敗。”
但在Manus內部,當接到這樣的任務時,系統(tǒng)會自動將這個任務分解為1000個獨立的子任務,并讓它們并發(fā)運行。這不但提升了效率,也避免了大型模型在處理長任務時可能出現(xiàn)的“惰性”或注意力衰減問題。這是一種只有通過專門的智能體架構才能實現(xiàn)的能力。
![]()
第三前沿:主動性是智能體的靈魂
在張濤看來,第三個前沿,也是最重要、最能體現(xiàn)“自主性”精髓的,是“主動性”(Proactivity)。
“我們認為,智能體應該在你要求它做某事之前就開始工作。自主性就意味著主動性。”張濤強調。
當前市面上的智能體產品,包括Manus在3月份發(fā)布的版本,仍然沒有達到智能體的終極形態(tài),因為用戶仍需明確地提出問題或分配任務。而未來的圖景是,智能體將成為一個真正主動的伙伴。
為了實現(xiàn)這一點,Manus推出了“連接器”(Connectors)功能,允許用戶將自己的Gmail、日歷、Notion等個人工作流與代理連接。然而,他們發(fā)現(xiàn),即使用戶連接了這些服務,很多人仍然不知道可以分配什么樣的任務給智能體。
于是,一個顛覆性想法誕生了:“為什么我們還需要用戶來提問呢?”
既然智能體已經通過連接器訪問了用戶的日歷和待辦事項,它已經知道了用戶正在忙什么。因此,使用智能體的最佳方式,是讓它基于用戶的個人上下文,主動開展工作。
張濤分享了他自己的日常體驗,一個內部原型已經讓他享受到了這種便利:“每天早上8點,我的Manus智能體會檢查我當天的日歷,如果發(fā)現(xiàn)有與外部伙伴的會議,它就會主動去研究參會者的背景資料,為我準備會議。這超級有用,我每天都在用。”
這便是「主動性」的用武之地。未來,你可能每天只需花5到10分鐘與智能體進行一些關鍵的對齊,但它會在后臺為你工作24小時。
![]()
企業(yè)破局的關鍵:從“替代思維”到“增效思維”
在描繪了技術前沿之后,張濤將話題轉向了更具挑戰(zhàn)性的商業(yè)現(xiàn)實:企業(yè)應如何擁抱智能體?
他指出,在過去兩年中,他看到許多身為行業(yè)領導者的朋友和創(chuàng)始人,在嘗試將AI智能體(Agentic AI)引入公司時,絕大多數(shù)都失敗了。為什么?
“因為當人們試圖在公司中應用AI時,他們腦海里冒出的第一個念頭是:‘我能用AI替代哪些員工?’”
張濤認為這正是問題的癥結所在,當你的出發(fā)點是“替代”時,你的整個思維框架就會被“風險控制”所主導。你會首先考慮:如果我解雇了這個人,現(xiàn)有的工作流程還能否正常運轉?你的焦點在于規(guī)避風險,而不是創(chuàng)造收益。
他倡導一種不同的思維模式:從“替代”(Replace)轉向“生成/增效”(Generate)。
“如果你開始思考如何用AI來增效,你腦海里冒出的第一個念頭會是:‘AI如何能讓我的頂尖員工的績效提升10倍?會出現(xiàn)哪些新的機會和可能性?’”在這種模式下,你的焦點轉向了“收益”,你看到的是一片藍海。
他強調,AI技術尚處早期,在這樣一個階段,如果只盯著風險,必然會錯失良機。而關注收益,則會讓你看到完全不同的景象。
為了印證這一點,他分享了一個發(fā)生在他身上的真實故事。今年1月,公司搬到新加坡后,CEO需要找公寓,與他合作的是房地產中介,當這位中介得知客戶是Manus的CEO后,她利用Manus為客戶制作了一份高度個性化的定制PPT。
這份長達12頁的PPT,詳細介紹了當天下午要看的三套公寓,不僅包含了戶型圖,還深入研究了公寓周邊的環(huán)境,如哪里有超市、醫(yī)院,以及頂級的餐廳和酒吧。這份報告的專業(yè)度和個性化程度,讓CEO感到非常驚喜,因為他從未想過一個房地產中介能提供如此水平的服務體驗。
“這正是AI如何賦能的體現(xiàn),重點從來不是替代,那位中介仍然在那里,但借助AI,她的工作表現(xiàn)和客戶體驗得到了極大的提升。擁抱AI最重要的事,就是改變你的思維模式。”張濤總結。
![]()
跨越三大障礙
除了思維模式的轉變,張濤還指出了企業(yè)在擁抱AI時需要跨越的其他三個障礙:
第一,信任與上下文共享。人們普遍對與AI共享個人數(shù)據(jù)(如郵件)感到恐懼。張濤認為這只是一個時間問題,隨著技術的成熟和信任的建立,人們會逐漸愿意向自己的專屬智能體開放個人上下文。
第二,為人類而建的世界。當今絕大多數(shù)的工具和服務都是為人類操作而設計,未來,我們將會看到越來越多從第一天起就為AI交互而設計的“AI原生”工具。
第三,與AI協(xié)作的范式。在過去,我們習慣了機器增強我們的體力,但我們不習慣我們的“智力”也可以被規(guī)模化。學會如何與可規(guī)模化的智能體協(xié)作,是一個全新的課題,也是一道需要跨越的認知障礙。
他最后總結說,就像幾十年前需要學會打字、二十年前需要學會操作電腦一樣,從2025年開始,學會如何與智能體協(xié)作,將成為決定個人未來表現(xiàn)的關鍵技能。
閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”
https://wx.zsxq.com/group/454854145828
![]()
未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學、互聯(lián)網、超級智能,數(shù)智大腦、能源、軍事、經濟、人類風險等等領域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.