<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      解構AI Agent智能體范式:單體推理、多模型智能體和RAG中心化三種核心架構

      0
      分享至

      最近陸陸續續的發布了很多的智能體,有拿Agent做唯一產品的Manus這樣的明星產品,還有@夕小瑤團隊開發的Teamo;以及本身就是大模型產品基于自己模型開發的Agent,比如Kimi的Kimi-researcher,以及MiniMax最近開源周放出來的MiniMax Agent。

      但如果仔細觀察的話,這些公司的產品中有一個大類是共通的,那就是去解決一個問題:「怎么去寫好一份報告?」

      這幾個產品,包括古早就出現的OpenAI和Gemini都有的Deep Research功能,其實也是在做類似的事情,而這件事情想要做好,想要依靠單獨的某個模型,在現在的技術體系下絕無可能,從問題到結果,最少需要三個能力。

      1. 聯網搜索:大模型的記憶大多停留在2024年,這是因為大模型的固有訓練邏輯,從訓練好,到微調,再到最終發布,幾個月到半年起,所以你問他現在的事情,必須通過聯網搜索獲取。

      2. 推理思考:資料搜集是一方面,而搜索大多依賴于關鍵字,很多關鍵字對應的信息其實是有沖突的,信息沖突只是其中一方面,而碰到沖突就需要大模型得具備推理和思考的能力,像人一樣的去做判斷。

      3. 訪問信息:搜集到的信息可能有很多種類型,最普通的就是網頁上的文字,但如果碰到的是圖片上的文字,視頻信息甚至一些質量很差但是唯一信源的聲音信息,起碼的廣泛的信息訪問技術是必要的。


      你會發現,不可能有任何一個單一的大模型可以完成「怎么去寫好一份報告這件事」,不管怎么樣,都需要給現有的大模型加一些插件才行,而這個過程,其實跟“人類和動物的最大區別是對于工具的使用”異曲同工。

      AI Agent并沒有本質上提升某個模型的智力,只不過是學會了如何使用工具而已。

      而如何使用工具,使用說明工具以及多大程度的依靠工具,就產生了現有的實現AI Agent智能體的三種方法:

      • 單體推理模型:典型如OpenAI,這種架構的核心思想是依賴一個單一、巨大且能力全面的大語言模型來統一處理任務的各個方面,包括理解查詢、規劃步驟、執行工具(如搜索)以及綜合信息生成最終答案。


      • 多模型智能體模型:Teamo非常典型,這種架構將一個復雜的任務分解成多個子任務,并為每個子任務分配一個專門的、角色清晰的AI智能體。這些智能體在一個“主管”或協調者的管理下協同工作,共同完成最終目標。并且根據不同任務的特性使用不同的模型,比如寫代碼用Claude,論文寫作用Gemini,講究的是借力。


      • RAG中心化智能體:Perplexity是代表,這種架構的設計哲學將事實準確性置于最高優先級。其核心是檢索增強生成(Retrieval-Augmented Generation, RAG)。整個工作流程圍繞“先檢索,后生成”展開:首先,系統實時從可信的外部來源(如互聯網)檢索與查詢相關的信息;然后,利用大語言模型將這些檢索到的、有事實依據的信息進行綜合、提煉和組織,最終生成答案。

      單體推理模型

      對于單體推理模型來說,最常見的就是大模型公司,比如OpenAI的Deep Research,MiniMax,以及Kimi的Researcher,他們的Agent就是基于自身大模型的產品,所以于情于理也不可能用別家的,這是大模型公司做應用的執念,即使只是暫時的。

      下圖從左到右,從上到下分別是OpenAI的Deep Research,MiniMaX Agent,Kimi Researcher,Gemini的Deep Research。


      這4個例子的背后公司肯定會有一個主打的模型,比如OpenAI的o系列,Kimi的k系列,以及MiniMax最近剛剛出的M1模型,Gemini的Gemini-2.5系列,都是在大模型領域非常能打的存在。也依靠他們的明星產品擁有不少的忠實用戶,這是他們能做單體推理模型的底氣。


      優勢

      1. 強大的通用推理與靈活性:由于所有任務都在一個統一的“思維空間”內完成,單體模型可能發展出更強的通用問題解決能力。它不受限于預設的、僵化的角色分工,因此在面對從未見過或結構模糊的復雜任務時,可能表現出更高的靈活性和適應性。

      2. 整體性理解:模型能夠對任務形成一個連貫、整體的理解,因為從輸入到輸出的所有中間步驟和思考過程都是內在關聯的,而不是在不同模塊間傳遞。

      劣勢

      1. 更高的“幻覺”風險:這是該架構最主要的弱點。強大的生成能力意味著模型在信息不足或推理出錯時,更容易“編造”事實,即產生幻覺。OpenAI也明確指出,其Deep Research智能體雖然比普通模型出錯率低,但仍會偶爾產生幻覺,并且在區分權威信息和網絡謠言方面存在困難。

      2. 不透明的“黑箱”問題:推理過程是模型內部的復雜神經活動,外界難以精確地審視其決策邏輯。當模型給出一個答案時,我們很難完全理解它是如何一步步推導出來的,這在需要高可靠性和可解釋性的關鍵應用中是一個重大障礙。

      3. 巨大的計算成本:訓練和運行一個能處理所有任務的、最前沿的單一模型,需要極其龐大的計算資源和資金投入。

      總的來說,單體推理模型需要一個非常強的AI大模型,不然智力程度完全不夠,但這也需要前提投入大量的資金先去做模型,然后再基于此作應用。再加上在做應用的時候只用自家模型,所以模型的缺點肯定也會帶到Agent上。

      多模型智能體模型

      多模型智能體模型,往往存在于主營業務甚至就智能體這一個業務,他們要實現的就是極致的效果和性能,所以他們會針對于不同的任務采用不同的模型,選擇的多樣性和靈活度要遠高于單體推理模型。

      比如Teamo,非常的經典多模型智能體,下圖就是Teamo設置不同Agent,主要分為幾個組,比如搜索組、寫作組、咨詢組和一些未上線的組別,并且每個組都有組長和組員不同角色。


      細看的話,搜索組的搜索員就只有兩個模型可以用,Claude-4-sonnet和Opus,這么說吧,這倆模型在大模型領域的定價算是非常貴的那種了,如果不是在實踐中發現這倆模型的性能最好,或者說只有這倆模型的性能才能滿足需求,那斷然不會只用這倆的。


      通用深度寫作員就是一個例子,你可以看到它可用的模型有很多,Gemini-2.5-Pro,DeepSeek-V3,GPT,Claude,甚至不常見的Grok3都有。

      這幾個之間的價格差別還是比較明顯的,像DeepSeek這種開源模型價格要遠低于閉源模型,但是實踐中發現這些模型之間的實際表現估計差別不明顯。


      Manus也一樣,據其中一個創始人,Manus主要用的兩家模型,Claude和Qwen,估計也是考慮到了性能和價格之間的平衡,只用Claude的確要貴不少。



      優勢

      1. 流程透明且可控:由于任務被明確地分解到不同的專業智能體,整個工作流程變得清晰可見。例如,可以看到“生成”智能體提出了哪些假設,“反思”智能體又如何對其進行評估。這種模塊化設計使得調試、監督和干預變得更加容易。

      2. 專業分工帶來的高質量:每個智能體都可以被專門優化以精通其特定任務。就像人類團隊一樣,讓“創意專家”負責頭腦風暴,讓“批判專家”負責評估,理論上可以在每個環節都達到更高的質量水平。

      3. 任務并行處理:不同的子任務可以由多個智能體同時執行,從而可能提高整體的效率和速度。

      劣勢

      1. 通信與協調開銷:智能體之間需要高效地溝通和傳遞信息,這會引入額外的計算開銷和系統復雜性。如果協調機制設計不當,可能會導致效率瓶頸。

      2. 管理復雜性高:設計和管理“主管”智能體與各個專業智能體之間的復雜互動是一項挑戰。整個系統的最終表現高度依賴于這種協調與管理機制的優劣。

      創業公司青睞這種方式,畢竟不需要自己做模型,只需要用現成的,還可以什么好用就用什么,不好用立馬下線,但缺點也很明顯,就是被復制的概率非常大,因為核心技術依賴于大模型,而次核心的工程技術容易被大公司用人海戰術迅速追上甚至反超。

      RAG中心化智能體

      這種智能體其實不算多,因為它的設計哲學偏向于「索引」,這就意味著「檢索」的優先級最高,簡單來說就是收集更多的信息,然后交給大模型去整理。而這里面資料的儲存和利用就用了RAG這個技術,它的全名叫檢索增強生成(Retrieval-Augmented Generation)。

      可以根據下面的圖來理解,比如我們問2025年6月22日人民幣和美元的匯率是多少,那么沒有聯網的大模型絕對不可能知道,因為它的固有缺陷(訓練數據滯后于模型發布時間)。所以這個時候就需要先去聯網獲取外部資料,然后大模型去根據外部資料去做回答。


      這里面的典型模型其實就有知乎直答、秘塔AI搜索和Perplexity AI,都是先做大量的檢索,然后根據檢索資料進行匯總和分析。

      這里面的區別就是檢索信息來源的不同,每家平臺會采用不同的信源,像知乎就用的自己平臺回答多一些,微博和騰訊元寶也有類似的功能,都是優先采用自己的信源。


      這種用的模型一般都是自研或者開源模型,因為它的核心在于信息的“可溯源”,而這一點兒只需要大模型照章辦事即可。

      優勢

      1. 極高的事實準確性與可追溯性:這是該架構最突出的優點。由于所有答案都牢固地植根于檢索到的真實世界信息,并且總是附帶來源引用,用戶可以輕松驗證信息的真偽。其核心原則是“不生成任何未檢索到的信息”。

      2. 幻覺風險極低:大語言模型在這里的主要角色是“組織者”和“轉述者”,而非“創作者”。因為它不依賴其內部記憶來生成事實性內容,所以產生幻覺的風險被降到了最低。

      3. 來源透明:用戶能清晰地看到每一條信息來自何處,這在學術研究、新聞調查等需要嚴肅事實核查的場景中至關重要。

      劣勢

      1. 能力受限于可檢索的信息:系統的能力上限被其信息檢索系統所束縛。如果一個問題的答案無法通過現有渠道檢索到,那么該系統也無法憑空創造出來。

      2. 純粹抽象推理和創造力受限:對于那些需要超越現有數據、進行純粹邏輯推演或提出全新原創概念的任務,這種方法表現不佳。它擅長綜合已知,而非探索未知。

      它的優劣勢很明顯,信息可溯源就是最大的優勢,但同樣限制了大模型的能力,就是嚴重受限于檢索到的數據質量,同時它也不太可能突破現有信息的限制,去創造新的知識。

      這三種當下的Agent范式都有各自的優缺點,特別是在實現上其實重合的地方很多,不過各自的側重點是能讓各自都能在領域里面脫穎而出的主要原因。這個新興市場的未來演進路徑正逐漸清晰。

      當前一代的研究智能體,主要專注于自動化現有的「人類資料密集型工作」流程,例如文獻綜述、事實查找、行動規劃等。不過未來不管是AI還是AI Agent,都不可能止步于總結現有人類的知識或者經驗,而是更多的將精力投入到「發現或者發明」新的知識上。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      老同志借而不還的畫,現估價8800萬現身拍賣會這個老東西究竟是誰

      老同志借而不還的畫,現估價8800萬現身拍賣會這個老東西究竟是誰

      深度報
      2025-12-22 22:36:02
      1-0!鐵衛處子球,曼聯復仇紐卡升英超第五,烏加特甩掉災星帽子

      1-0!鐵衛處子球,曼聯復仇紐卡升英超第五,烏加特甩掉災星帽子

      釘釘陌上花開
      2025-12-27 08:00:23
      RYBAR改口:庫皮揚斯克失守,俄系軍博的“最后防線”也塌了

      RYBAR改口:庫皮揚斯克失守,俄系軍博的“最后防線”也塌了

      老馬拉車莫少裝
      2025-12-24 21:28:37
      央地交流,侯延波赴吉林履新

      央地交流,侯延波赴吉林履新

      吉刻新聞
      2025-12-27 12:18:02
      價格飆升,多地零售價突破10元/斤!年初一斤僅一兩元,網友:雞蛋都快配不上它了……

      價格飆升,多地零售價突破10元/斤!年初一斤僅一兩元,網友:雞蛋都快配不上它了……

      每日經濟新聞
      2025-12-26 10:01:26
      若有一天中日開戰,日退役少將預言三大后果,日本唯一生機曝光?

      若有一天中日開戰,日退役少將預言三大后果,日本唯一生機曝光?

      比利
      2025-12-26 20:59:23
      緊急提醒!這款常用藥或導致自殺傾向

      緊急提醒!這款常用藥或導致自殺傾向

      中國新聞周刊
      2025-12-27 12:29:03
      生殖科最奇葩的事是什么?網友:這個科絕對是最有錢成本最低的科

      生殖科最奇葩的事是什么?網友:這個科絕對是最有錢成本最低的科

      帶你感受人間冷暖
      2025-12-25 00:05:19
      《獻血法》頒布實施至今 全國無償獻血累計3.08億人次 保障獻血者權益從多個維度持續發力

      《獻血法》頒布實施至今 全國無償獻血累計3.08億人次 保障獻血者權益從多個維度持續發力

      每日經濟新聞
      2025-12-26 18:08:17
      甘肅女博士張明玉剛生完孩子,被丈夫提刀割喉,丈夫:你真臟

      甘肅女博士張明玉剛生完孩子,被丈夫提刀割喉,丈夫:你真臟

      天字號野史
      2024-11-18 23:49:45
      頂流空降深圳!有人早上開始排隊

      頂流空降深圳!有人早上開始排隊

      深圳晚報
      2025-12-26 22:19:48
      37歲闞清子閨蜜葉青探望寶寶:辟謠孩子畸形,用法律追責造謠者

      37歲闞清子閨蜜葉青探望寶寶:辟謠孩子畸形,用法律追責造謠者

      粵語經典歌單
      2025-12-27 09:09:49
      陜北革命老區邁入“高鐵時代”

      陜北革命老區邁入“高鐵時代”

      人民網
      2025-12-27 09:11:15
      悲催!廣東一臺資工廠結業,聲稱6月起沒有訂單,將依法支付補償

      悲催!廣東一臺資工廠結業,聲稱6月起沒有訂單,將依法支付補償

      火山詩話
      2025-12-27 13:42:15
      不到24小時,歐豪發三大喜訊竟暗自追隨謝霆鋒的腳步

      不到24小時,歐豪發三大喜訊竟暗自追隨謝霆鋒的腳步

      手工制作阿殲
      2025-12-27 11:36:56
      不到48小時,高市大反轉,支持率飆升至92.4%,日本發生了什么?

      不到48小時,高市大反轉,支持率飆升至92.4%,日本發生了什么?

      鐵錘簡科
      2025-12-26 19:23:46
      21歲男子趁表姐熟睡欲與其發生關系未得逞,家屬賠償10萬獲諒解 一審被判三緩四

      21歲男子趁表姐熟睡欲與其發生關系未得逞,家屬賠償10萬獲諒解 一審被判三緩四

      紅星新聞
      2025-12-26 17:20:10
      醫學博士:腫瘤越來越高發,我們究竟被隱瞞了什么?

      醫學博士:腫瘤越來越高發,我們究竟被隱瞞了什么?

      深度報
      2025-12-21 23:01:02
      太奇葩了,中國籃協宣布重要決定,球迷怒噴,中國籃球又成為笑話

      太奇葩了,中國籃協宣布重要決定,球迷怒噴,中國籃球又成為笑話

      宗介說體育
      2025-12-27 15:42:19
      從承諾歸還搶走的土地,到提出出海權,俄國時隔100年又服軟了?

      從承諾歸還搶走的土地,到提出出海權,俄國時隔100年又服軟了?

      近史博覽
      2025-12-20 10:50:02
      2025-12-27 16:39:00
      平凡AI incentive-icons
      平凡AI
      高校AI從業者
      54文章數 23關注度
      往期回顧 全部

      科技要聞

      小米也漲價了!業界稱終端再不漲明年必虧

      頭條要聞

      男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

      頭條要聞

      男子戒毒后隨領導出差被警察帶走驗尿 回家后工作沒了

      體育要聞

      NBA教練圈的布朗尼,花了22年證明自己

      娛樂要聞

      張昊唯逃稅涉黃風波落幕:法院認定朋友造謠

      財經要聞

      注意,開始拉物價了!

      汽車要聞

      好音響比大屏更重要?車企開始“聽”用戶的

      態度原創

      教育
      親子
      藝術
      公開課
      軍事航空

      教育要聞

      附加題難倒了學霸!陰影部分面積為90,求空白正方形的面積

      親子要聞

      父母為了孩子連夜驅車趕來武漢,為了方便換藥在武漢租房等待

      藝術要聞

      砸50億!廣東驚現“全球最大爛尾醫院”,連窗框都沒裝完

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      英法德三國領導人通話 重申對烏支持

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕日本人妻| 亚洲成人黄色电影| 国产人妻精品午夜福利免费| 一本大道久久香蕉成人网| 五月综合视频| 日韩一级亚洲一午夜免费观看中文版国语版| 久久国产精品成人影院| 国内精品视频一区二区三区| 好吊妞| 制服.丝袜.亚洲.中文.综合懂| 泗洪县| 风间由美性色一区二区三区| 久久久噜噜噜久久熟女aa片| 午夜福利理论片高清在线观看| 午夜一区二区三区视频| 制服丝袜亚洲无码| 中文无码网| 亚洲人成在线播放网站| 国产亚洲制服免视频| 国产制服丝袜在线| 亚洲综合无码精品| 国偷自产视频一区二区久| 中文字幕人成无码免费视频| 亚洲最大在线| wwwjizzjizzjizz| 成人亚洲综合av天堂| 91久久精品美女高潮不断| 婷婷色综合| 国产精品国产三级国产专播| 国产av一区二区三区无码野战| 国语精品国内自产视频| 欧美老熟妇色XXXXX性| 久久人人爽人人爽人人片av高清 | 亚洲国产高清第一第二区| 久久久久久久久久8888| 日本女V片| 性xxxx欧美老妇506070| 九九热在线免费播放视频| 丝袜福利导航| av人摸人人人澡人人超碰下载| 激情97综合亚洲色婷婷五|