<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      從經歷到知識:UIUC、清華PlugMem如何重構Agent記憶

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導讀】現在的AI agent往往把長交互歷史直接存起來,但很難高效復用。最樸素的方法直接從「原始記憶」里檢索,但常常把模型淹沒在冗長、低價值的上下文里。PlugMem把經驗轉化為結構化、可復用的知識,并提出一個任務無關(task-agnostic)的統一記憶模塊,在多種Agent基準上提升性能,同時消耗更少。

      隨著AI agent承擔越來越復雜的任務——長對話、多步推理、交互式網頁導航等——它們必須記住并復用過去的經驗。

      但多數現有記憶系統更像「日志文件」:不斷累積原始交互軌跡,需要時再從中取出一些文本片段。時間一長,記憶會無限增長、噪聲增多,并迅速擠占agent的上下文窗口。

      于是出現一個悖論:AI agent擁有前所未有的「記憶量」,卻依然難以有效使用。然而,對決策真正重要的內容,往往不是完整的交互記錄,而是從記錄中沉淀出的知識。

      比如做商品推薦時,agent需要記住用戶偏好,而不是反復閱讀長對話;在新網站購物時,agent需要的是「如何搜索、篩選、下單」的通用策略,而不是重放自己看過的每一個頁面。

      AI agent記憶問題的核心挑戰并非「存更多」,而是以能突出決策相關信息的方式組織記憶。

      UIUC、清華大學最新提出的AI agent的記憶方法PlugMem:一個任務無關、即插即用的記憶模塊,用來把智能體的原始經驗轉化為可復用知識。PlugMem不把記憶當作扁平文本來檢索,而是借鑒認知科學,將經驗結構化為以知識為中心的表示。


      論文鏈接:https://arxiv.org/abs/2603.03296

      代碼鏈接:https://github.com/TIMAN-group/PlugMem

      認知科學通常區分三類記憶:對事件的回憶、對事實的知識、以及對技能/策略的掌握。事件提供背景,但有效決策依賴從事件中抽象出的事實與技能。這一視角啟發我們重新思考 AI agent 的記憶設計。

      PlugMem將對話、文檔、網頁軌跡等異構交互記錄,轉化為結構化的知識單元:更緊湊、更可復用,并且與決策直接對齊。

      PlugMem包含三個核心組件:

      1. Structuring(結構化) 將原始情景經驗標準化,并提取為兩類知識:命題式知識(facts)與處方式知識(skills、可復用技能/策略)。這些知識單元被組織為結構化的記憶圖。

      2. Retrieval(檢索) 不再檢索冗長文本塊,而是檢索與當前任務語義對齊的知識單元。高層概念與意圖(concepts / intents)作為「路由信號」,幫助快速定位最相關的內容。

      3. Reasoning(推理/壓縮) 把檢索到的知識進一步壓縮為簡潔、可直接用于當前任務的指引,再交給AI agent使用,從而更高效地利用上下文。


      PlugMem將異構智能體經驗組織為知識中心的記憶圖,實現結構化檢索與推理。

      PlugMem與傳統GraphRAG系統的關鍵差別在于「記憶訪問單元」。傳統方法通常索引文本chunk或實體;PlugMem以知識單元(命題與處方)作為基本構件。這樣的設計減少冗余、提升信息密度,并提高檢索精度。

      一個能跨任務遷移的記憶模塊

      很多記憶系統往往為特定基準精心定制:例如對話記憶、知識密集問答、網頁智能體等。這類任務特定記憶模塊在單一場景里可能表現很好,但換任務往往要重新設計。

      PlugMem選擇了另一種方法:作為一個即插即用的通用記憶骨架,可以直接接到不同AI agent上,無需針對任務做專門修改。文中用同一個模塊、保持實現不變,在三個異構基準上評測:長程對話式問答、基于維基百科的多跳知識檢索、交互式網頁決策任務。

      結果顯示:PlugMem在三種設置下都穩定提升了任務表現,超過了通用檢索方法與多種任務特定記憶設計。更重要的是,這些提升是在向AI agent上下文注入顯著更少記憶智元(token)的前提下實現的。

      用「效用」衡量記憶

      而不是用「大小」

      只看任務準確率并不能反映記憶系統的關鍵能力:記憶模塊必須在「決策效用」和「上下文成本」之間權衡。

      因此PlugMem工作中提出一個信息論指標,用來度量記憶系統每消耗一個智元(token),能帶來多少「決策相關的信息增益」。直觀地說:記憶模塊產生的記憶智元(token)能讓AI agent對正確行動更有把握多少?接著再按記憶長度做歸一化。

      在效用–成本空間里,PlugMem穩定處于更有優勢的位置:更低智元(token)成本下獲得更高的決策效用。


      在多種基準上,PlugMem在更小的記憶預算下提供更高的決策相關效用。

      這些結果支持一個結論:把經驗轉化為知識,比直接檢索原始日志更緊湊、更有信息量。

      超過任務特定設計

      乍看之下,一個任務無關的記憶模塊能超過為某個基準量身定制的方法似乎有些反直覺。PlugMem的結果表明,決定性因素往往不是特定benchmark的啟發式技巧,而是對「決策相關知識抽取」的有效檢索。

      沒有檢索,記憶只是靜態存儲;沒有結構化知識,檢索就缺乏精度。PlugMem將以下三件事拆開并協同:結構化決定「可被檢索的內容是什么」,檢索決定「記憶是否真的能幫助決策」,推理/壓縮確?!敢愿统杀颈籄I智能體利用」。

      PlugMem也不試圖取代任務特定技巧。它更像一個通用記憶底座,上層依然可以疊加任務適配。實驗也顯示:在PlugMem之上再加入任務特定啟發式探索方法,往往還能進一步提升效果,二者具有互補性。

      走向智能體的「可復用知識基礎設施」

      當AI agent邁向更長程的自主能力,記憶需要從被動存儲走向成為主動的知識基礎設施:agents應當積累可遷移的事實與策略,讓知識跨任務、跨環境復用,緩解AI agents冷啟動問題,并支持更強的泛化。

      PlugMem是朝這個方向邁出的一步。它以認知科學為設計啟發,將「知識」作為復用的基本單位,展示了任務無關記憶在效率與能力上同時可行。

      更廣義地看,這項工作提示了一個視角轉變:與其追求檢索更多上下文,不如追求把經驗表示成天然可復用的形式。隨著智能體能力擴展,可擴展、可遷移的記憶系統將成為基礎設施;知識中心的記憶很可能是下一代智能體的重要基石。

      參考資料:

      https://arxiv.org/abs/2603.03296


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      一個報案引發的連環訴訟案 讓首任車主“懵了”

      一個報案引發的連環訴訟案 讓首任車主“懵了”

      大風新聞
      2026-03-23 08:19:02
      112.33億!新乳業2025營收新高,五年戰略結碩果

      112.33億!新乳業2025營收新高,五年戰略結碩果

      銠財
      2026-03-23 16:55:40
      法國專家預測伊朗戰爭將持續多久

      法國專家預測伊朗戰爭將持續多久

      參考消息
      2026-03-23 15:32:14
      特朗普要干票大的,數千美軍或搶灘登陸,占領伊朗沿海打通海峽

      特朗普要干票大的,數千美軍或搶灘登陸,占領伊朗沿海打通海峽

      第一軍情
      2026-03-23 13:15:03
      數據觸目驚心!一個小縣城的殯儀館里大屏幕流出,網友:還爭什么

      數據觸目驚心!一個小縣城的殯儀館里大屏幕流出,網友:還爭什么

      火山詩話
      2026-03-23 10:18:33
      悲哀!同事兒子婚禮取消,起因竟是婆家不愿花20多萬,去翻新舊房

      悲哀!同事兒子婚禮取消,起因竟是婆家不愿花20多萬,去翻新舊房

      火山詩話
      2026-03-23 13:20:55
      以色列軍隊在伊朗發動新的攻擊:德黑蘭政權比以往任何時候都虛弱

      以色列軍隊在伊朗發動新的攻擊:德黑蘭政權比以往任何時候都虛弱

      一種觀點
      2026-03-20 10:43:17
      3月30日大變革!殯葬行業徹底變天,普通人再也不用買天價墓地

      3月30日大變革!殯葬行業徹底變天,普通人再也不用買天價墓地

      復轉這些年
      2026-03-22 15:14:22
      徹底慫了!毆打2歲幼童女子已被拘,竟是教師!欲賠千元私了被拒

      徹底慫了!毆打2歲幼童女子已被拘,竟是教師!欲賠千元私了被拒

      愛寫的櫻桃
      2026-03-23 12:26:12
      伊朗豁出去了硬剛美國:敢這么干就跟你同歸于盡

      伊朗豁出去了硬剛美國:敢這么干就跟你同歸于盡

      看看新聞Knews
      2026-03-23 15:01:05
      泡沫破了!大批文旅項目開始批量倒閉

      泡沫破了!大批文旅項目開始批量倒閉

      新浪財經
      2026-03-22 18:25:59
      網紅富二代王政源被判入獄兩年半,罰1500萬,央視財經9分大制作

      網紅富二代王政源被判入獄兩年半,罰1500萬,央視財經9分大制作

      裕豐娛間說
      2026-03-23 08:55:04
      梅向榮自首,其妹梅亞萍“代理人”現身接待點,傳達兩套償付方案!實探上海辦公地:大批內部員工也深陷投資泥潭

      梅向榮自首,其妹梅亞萍“代理人”現身接待點,傳達兩套償付方案!實探上海辦公地:大批內部員工也深陷投資泥潭

      每日經濟新聞
      2026-03-22 23:08:38
      為什么要對成品油價格采取臨時調控措施?專家解讀→

      為什么要對成品油價格采取臨時調控措施?專家解讀→

      極目新聞
      2026-03-23 16:35:50
      上海一中介為吃26萬差價竟分飾兩角:和賣家簽“托底”,和買家簽“居間”

      上海一中介為吃26萬差價竟分飾兩角:和賣家簽“托底”,和買家簽“居間”

      上觀新聞
      2026-03-23 06:53:05
      A股午評:三大指數半日均跌超2%,全市場近5000只個股下跌,黃金、豬肉產業、貴金屬等概念走弱

      A股午評:三大指數半日均跌超2%,全市場近5000只個股下跌,黃金、豬肉產業、貴金屬等概念走弱

      界面新聞
      2026-03-23 11:34:16
      山西省原省長金湘軍被公訴,曾被批無償接受“保姆式”服務

      山西省原省長金湘軍被公訴,曾被批無償接受“保姆式”服務

      界面新聞
      2026-03-23 10:20:59
      路虎別停奔馳后續:知情人爆猛料 路虎車價值百萬 背景好是個慣犯

      路虎別停奔馳后續:知情人爆猛料 路虎車價值百萬 背景好是個慣犯

      天天熱點見聞
      2026-03-23 15:32:51
      衛星圖:預防性打擊,伊朗正有條不紊摧毀海灣沿岸的美后勤保障基礎設施!

      衛星圖:預防性打擊,伊朗正有條不紊摧毀海灣沿岸的美后勤保障基礎設施!

      勝研集
      2026-03-23 10:50:55
      蘇超熱身賽變全武行 近3萬觀眾前 海港與南通隊斗毆+多人拳腳相向

      蘇超熱身賽變全武行 近3萬觀眾前 海港與南通隊斗毆+多人拳腳相向

      我愛英超
      2026-03-22 18:46:33
      2026-03-23 18:47:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14790文章數 66710關注度
      往期回顧 全部

      科技要聞

      裁掉2萬多名員工后,扎克伯格對自己下手了

      頭條要聞

      伊朗豁出去了:若美以敢炸發電廠 整個中東就同歸于盡

      頭條要聞

      伊朗豁出去了:若美以敢炸發電廠 整個中東就同歸于盡

      體育要聞

      不敢放手一搏,你拿什么去爭冠?

      娛樂要聞

      劉燁47歲生日,安娜曬全家福為其慶生

      財經要聞

      滬指險守3800點!真正的恐慌盤出現了?

      汽車要聞

      "拒絕"豪車稅 新款Panamera盡享版99.8萬元起精準入局

      態度原創

      家居
      手機
      親子
      數碼
      公開課

      家居要聞

      智慧生活 奢享家居

      手機要聞

      OPPO ColorOS三月系統升級一覽:一句話釘釘打卡、AI通話防詐等

      親子要聞

      寶藍和叔叔爭搶卡丁車,爸爸送給寶藍一輛凱蒂貓卡丁車~

      數碼要聞

      廣播公司要求歐盟認定科技巨頭電視系統與虛擬助手為“看門人”

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版