網易首頁 > 網易號 > 正文申請入駐

解構AI Agent智能體范式：單體推理、多模型智能體和RAG中心化三種核心架構

2025-06-24 06:44:59　來源: 平凡AI

海外舉報

分享至

最近陸陸續續的發布了很多的智能體，有拿Agent做唯一產品的Manus這樣的明星產品，還有@夕小瑤團隊開發的Teamo；以及本身就是大模型產品基于自己模型開發的Agent，比如Kimi的Kimi-researcher，以及MiniMax最近開源周放出來的MiniMax Agent。

但如果仔細觀察的話，這些公司的產品中有一個大類是共通的，那就是去解決一個問題：「怎么去寫好一份報告？」

這幾個產品，包括古早就出現的OpenAI和Gemini都有的Deep Research功能，其實也是在做類似的事情，而這件事情想要做好，想要依靠單獨的某個模型，在現在的技術體系下絕無可能，從問題到結果，最少需要三個能力。

聯網搜索：大模型的記憶大多停留在2024年，這是因為大模型的固有訓練邏輯，從訓練好，到微調，再到最終發布，幾個月到半年起，所以你問他現在的事情，必須通過聯網搜索獲取。
推理思考：資料搜集是一方面，而搜索大多依賴于關鍵字，很多關鍵字對應的信息其實是有沖突的，信息沖突只是其中一方面，而碰到沖突就需要大模型得具備推理和思考的能力，像人一樣的去做判斷。
訪問信息：搜集到的信息可能有很多種類型，最普通的就是網頁上的文字，但如果碰到的是圖片上的文字，視頻信息甚至一些質量很差但是唯一信源的聲音信息，起碼的廣泛的信息訪問技術是必要的。

你會發現，不可能有任何一個單一的大模型可以完成「怎么去寫好一份報告這件事」，不管怎么樣，都需要給現有的大模型加一些插件才行，而這個過程，其實跟“人類和動物的最大區別是對于工具的使用”異曲同工。

AI Agent并沒有本質上提升某個模型的智力，只不過是學會了如何使用工具而已。

而如何使用工具，使用說明工具以及多大程度的依靠工具，就產生了現有的實現AI Agent智能體的三種方法：

單體推理模型：典型如OpenAI，這種架構的核心思想是依賴一個單一、巨大且能力全面的大語言模型來統一處理任務的各個方面，包括理解查詢、規劃步驟、執行工具（如搜索）以及綜合信息生成最終答案。

多模型智能體模型：Teamo非常典型，這種架構將一個復雜的任務分解成多個子任務，并為每個子任務分配一個專門的、角色清晰的AI智能體。這些智能體在一個“主管”或協調者的管理下協同工作，共同完成最終目標。并且根據不同任務的特性使用不同的模型，比如寫代碼用Claude，論文寫作用Gemini，講究的是借力。

RAG中心化智能體：Perplexity是代表，這種架構的設計哲學將事實準確性置于最高優先級。其核心是檢索增強生成（Retrieval-Augmented Generation, RAG）。整個工作流程圍繞“先檢索，后生成”展開：首先，系統實時從可信的外部來源（如互聯網）檢索與查詢相關的信息；然后，利用大語言模型將這些檢索到的、有事實依據的信息進行綜合、提煉和組織，最終生成答案。

單體推理模型

對于單體推理模型來說，最常見的就是大模型公司，比如OpenAI的Deep Research，MiniMax，以及Kimi的Researcher，他們的Agent就是基于自身大模型的產品，所以于情于理也不可能用別家的，這是大模型公司做應用的執念，即使只是暫時的。

下圖從左到右，從上到下分別是OpenAI的Deep Research，MiniMaX Agent，Kimi Researcher，Gemini的Deep Research。

這4個例子的背后公司肯定會有一個主打的模型，比如OpenAI的o系列，Kimi的k系列，以及MiniMax最近剛剛出的M1模型，Gemini的Gemini-2.5系列，都是在大模型領域非常能打的存在。也依靠他們的明星產品擁有不少的忠實用戶，這是他們能做單體推理模型的底氣。

優勢

強大的通用推理與靈活性：由于所有任務都在一個統一的“思維空間”內完成，單體模型可能發展出更強的通用問題解決能力。它不受限于預設的、僵化的角色分工，因此在面對從未見過或結構模糊的復雜任務時，可能表現出更高的靈活性和適應性。
整體性理解：模型能夠對任務形成一個連貫、整體的理解，因為從輸入到輸出的所有中間步驟和思考過程都是內在關聯的，而不是在不同模塊間傳遞。

劣勢

更高的“幻覺”風險：這是該架構最主要的弱點。強大的生成能力意味著模型在信息不足或推理出錯時，更容易“編造”事實，即產生幻覺。OpenAI也明確指出，其Deep Research智能體雖然比普通模型出錯率低，但仍會偶爾產生幻覺，并且在區分權威信息和網絡謠言方面存在困難。
不透明的“黑箱”問題：推理過程是模型內部的復雜神經活動，外界難以精確地審視其決策邏輯。當模型給出一個答案時，我們很難完全理解它是如何一步步推導出來的，這在需要高可靠性和可解釋性的關鍵應用中是一個重大障礙。
巨大的計算成本：訓練和運行一個能處理所有任務的、最前沿的單一模型，需要極其龐大的計算資源和資金投入。

總的來說，單體推理模型需要一個非常強的AI大模型，不然智力程度完全不夠，但這也需要前提投入大量的資金先去做模型，然后再基于此作應用。再加上在做應用的時候只用自家模型，所以模型的缺點肯定也會帶到Agent上。

多模型智能體模型

多模型智能體模型，往往存在于主營業務甚至就智能體這一個業務，他們要實現的就是極致的效果和性能，所以他們會針對于不同的任務采用不同的模型，選擇的多樣性和靈活度要遠高于單體推理模型。

比如Teamo，非常的經典多模型智能體，下圖就是Teamo設置不同Agent，主要分為幾個組，比如搜索組、寫作組、咨詢組和一些未上線的組別，并且每個組都有組長和組員不同角色。

細看的話，搜索組的搜索員就只有兩個模型可以用，Claude-4-sonnet和Opus，這么說吧，這倆模型在大模型領域的定價算是非常貴的那種了，如果不是在實踐中發現這倆模型的性能最好，或者說只有這倆模型的性能才能滿足需求，那斷然不會只用這倆的。

通用深度寫作員就是一個例子，你可以看到它可用的模型有很多，Gemini-2.5-Pro，DeepSeek-V3，GPT，Claude，甚至不常見的Grok3都有。

這幾個之間的價格差別還是比較明顯的，像DeepSeek這種開源模型價格要遠低于閉源模型，但是實踐中發現這些模型之間的實際表現估計差別不明顯。

Manus也一樣，據其中一個創始人，Manus主要用的兩家模型，Claude和Qwen，估計也是考慮到了性能和價格之間的平衡，只用Claude的確要貴不少。

優勢

流程透明且可控：由于任務被明確地分解到不同的專業智能體，整個工作流程變得清晰可見。例如，可以看到“生成”智能體提出了哪些假設，“反思”智能體又如何對其進行評估。這種模塊化設計使得調試、監督和干預變得更加容易。
專業分工帶來的高質量：每個智能體都可以被專門優化以精通其特定任務。就像人類團隊一樣，讓“創意專家”負責頭腦風暴，讓“批判專家”負責評估，理論上可以在每個環節都達到更高的質量水平。
任務并行處理：不同的子任務可以由多個智能體同時執行，從而可能提高整體的效率和速度。

劣勢

通信與協調開銷：智能體之間需要高效地溝通和傳遞信息，這會引入額外的計算開銷和系統復雜性。如果協調機制設計不當，可能會導致效率瓶頸。
管理復雜性高：設計和管理“主管”智能體與各個專業智能體之間的復雜互動是一項挑戰。整個系統的最終表現高度依賴于這種協調與管理機制的優劣。

創業公司青睞這種方式，畢竟不需要自己做模型，只需要用現成的，還可以什么好用就用什么，不好用立馬下線，但缺點也很明顯，就是被復制的概率非常大，因為核心技術依賴于大模型，而次核心的工程技術容易被大公司用人海戰術迅速追上甚至反超。

RAG中心化智能體

這種智能體其實不算多，因為它的設計哲學偏向于「索引」，這就意味著「檢索」的優先級最高，簡單來說就是收集更多的信息，然后交給大模型去整理。而這里面資料的儲存和利用就用了RAG這個技術，它的全名叫檢索增強生成（Retrieval-Augmented Generation）。

可以根據下面的圖來理解，比如我們問2025年6月22日人民幣和美元的匯率是多少，那么沒有聯網的大模型絕對不可能知道，因為它的固有缺陷（訓練數據滯后于模型發布時間）。所以這個時候就需要先去聯網獲取外部資料，然后大模型去根據外部資料去做回答。

這里面的典型模型其實就有知乎直答、秘塔AI搜索和Perplexity AI，都是先做大量的檢索，然后根據檢索資料進行匯總和分析。

這里面的區別就是檢索信息來源的不同，每家平臺會采用不同的信源，像知乎就用的自己平臺回答多一些，微博和騰訊元寶也有類似的功能，都是優先采用自己的信源。

這種用的模型一般都是自研或者開源模型，因為它的核心在于信息的“可溯源”，而這一點兒只需要大模型照章辦事即可。

優勢

極高的事實準確性與可追溯性：這是該架構最突出的優點。由于所有答案都牢固地植根于檢索到的真實世界信息，并且總是附帶來源引用，用戶可以輕松驗證信息的真偽。其核心原則是“不生成任何未檢索到的信息”。
幻覺風險極低：大語言模型在這里的主要角色是“組織者”和“轉述者”，而非“創作者”。因為它不依賴其內部記憶來生成事實性內容，所以產生幻覺的風險被降到了最低。
來源透明：用戶能清晰地看到每一條信息來自何處，這在學術研究、新聞調查等需要嚴肅事實核查的場景中至關重要。

劣勢

能力受限于可檢索的信息：系統的能力上限被其信息檢索系統所束縛。如果一個問題的答案無法通過現有渠道檢索到，那么該系統也無法憑空創造出來。
純粹抽象推理和創造力受限：對于那些需要超越現有數據、進行純粹邏輯推演或提出全新原創概念的任務，這種方法表現不佳。它擅長綜合已知，而非探索未知。

它的優劣勢很明顯，信息可溯源就是最大的優勢，但同樣限制了大模型的能力，就是嚴重受限于檢索到的數據質量，同時它也不太可能突破現有信息的限制，去創造新的知識。

這三種當下的Agent范式都有各自的優缺點，特別是在實現上其實重合的地方很多，不過各自的側重點是能讓各自都能在領域里面脫穎而出的主要原因。這個新興市場的未來演進路徑正逐漸清晰。

當前一代的研究智能體，主要專注于自動化現有的「人類資料密集型工作」流程，例如文獻綜述、事實查找、行動規劃等。不過未來不管是AI還是AI Agent，都不可能止步于總結現有人類的知識或者經驗，而是更多的將精力投入到「發現或者發明」新的知識上。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.