<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI用3年時光,來了解你!首個AI Clone長期記憶基準

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導讀】現有AI記憶評測存在局限,如數據源單一、忽視變化本質、注入成本高等。CloneMem通過層次化生成框架構建合成人生,設計貼近真實場景的評測任務,涵蓋多種問題類型。實驗發現簡單方法在檢索上更有效,復雜系統會丟失關鍵細節,記憶系統應保留細節和時間脈絡,還原而非壓縮信息,以更好地理解人。

      AI數字分身正在從科幻走向現實幫你回郵件、管理日程,甚至可以直接替你和別人coffee chat。

      但問題是:AI如何深度了解并與你保持同步

      不僅要「知道」你叫什么,住在哪里,喜歡聽什么音樂,喜歡吃什么,更要「持續了解」:這幾年你經歷了什么、你的想法是如何一步步轉變的、為什么去年你想要跳槽,但今年卻想要留下。

      這些,才真正定義了你是誰。

      針對這一問題,開源學術社區QuantaAlpha聯合國內外知名高校團隊提出了CloneMem——首個專門評估AI Clone長期記憶能力的基準測試,并提供了中英文雙語版本


      論文鏈接:https://arxiv.org/pdf/2601.07023

      代碼數據:https://github.com/AvatarMemory/CloneMemBench


      AI Clone 應用場景示意圖

      人生的關鍵變化

      往往不發生在聊天框里

      現有AI記憶評測主要考察模型能否記住用戶與AI之間說過的話。但這套評測范式存在三個根本局限:

      數據源單一。

      僅依賴用戶與AI的對話記錄,而這些記錄往往只反映了生活中的某些片段。更關鍵的是,對話內容高度依賴用戶主動表達,本身就已經經過個人的二次敘述,很難還原一個人真實而連續的生活軌跡。

      忽視「變化」的本質。

      現有基準關注的是「AI 能否記住某個事實」,而非「AI 能否理解這個人是怎么一步步變成現在這樣的」——經歷如何塑造情緒,情緒如何影響觀點,觀點又如何左右選擇。

      注入成本高。

      想讓AI了解你,你得不斷主動和它聊。但誰有時間每天給AI寫日記?這種機制難以長期維持。


      CloneMem與現有記憶評測基準對比

      數據怎么造?

      層次化生成一個合成人生

      真實用戶數據涉及隱私,研究團隊設計了一套層次化生成框架:

      宏觀層面,基于大五人格初始化人物設定,構建職業、家庭、情緒、價值觀等長期人生弧線;中觀層面,將每個重大事件拆分為多個階段,維護內部狀態快照(能量、壓力、情緒、關注焦點),狀態在階段間傳遞以保證連貫性;微觀層面,為每個階段生成具體事件,并同步產出日記、帖子、消息等多種媒介內容。

      這種自頂向下的設計確保了經歷、情緒、觀點在長時間跨度上保持一致。


      CloneMem 完整的數據構建流程

      面向真實交互場景的評測任務設計

      CloneMem設計了一系列貼近真實使用場景的評測任務。所有問題都從「與AI Clone聊天的朋友」視角出發,而不是系統自問自答。

      提問者像現實中的熟人一樣,會在不同時間點向AI Clone詢問你的近況和想法。

      更關鍵的是,這些問題不是集中在某一個時間段,而是貫穿在你完整的人生時間線上,這也就意味著模型需要在橫跨數年的日記、社交媒體、聊天記錄和郵件等多源記錄里,找到關鍵信息,并理解經歷如何影響情緒,情緒如何塑造觀點,觀點又如何推動選擇,才能做出正確的判斷。


      CloneMem評測任務示例

      CloneMem設計了7種問題類型,涵蓋了事實回憶、規律識別、變化對比、長期軌跡理解、因果推理、反事實推理,以及無法回答的情況。

      而考慮到在真實場景下的開放式問答難度不低,CloneMem也為每道簡答題設計了對應的選擇題版本,用來降低難度。

      實驗發現

      簡單方法反超,復雜系統壓縮掉關鍵細節

      研究團隊從檢索能力、記憶有效性和回答一致性等多個維度,對Flat Retriever、A-MEM和Mem0三種記憶系統進行了評估,結果卻有些出人意料。

      在檢索層面,簡單方法反而更有效

      在多數指標上,最簡單的Flat Retriever表現最好。原因是抽象和總結雖然有助于搜索,但會損失細節保真度。而AI Clone任務高度依賴時間順序、原始表述、事件間的細微關聯,而這些信息往往在摘要的過程中被壓縮掉了。


      不同記憶系統的 QA 性能與記憶效用對比(Oracle 為使用真實上下文的上界)

      在表征層面,記憶系統只記事件,而不記狀態

      以老沈為例,他正在經歷中年危機,連續兩周在凌晨瀏覽招聘網站,搜索各種崗位信息。記憶系統非常誠實的記下了這些行為,但無法表征他還在猶豫,一份簡歷都沒投出去的狀態。

      因此當被問到老沈有沒有看重的公司時,模型面對一堆求職相關的行為記錄,自然會腦補出老沈看重了幾家公司,然而實際上,他什么都沒有決定。

      在生成層面,模型容易被敘事慣性所帶偏

      即使檢索到了正確的信息,模型仍然傾向于套用高概率敘事模板,而并沒有依據事實證據。比如當問老沈為什么愿意向妻子敞開心扉,正確答案是他意識到長期強撐正在傷害家庭,模型卻回答女兒的一幅畫觸動了他,這聽起來很合理,但證據完全對不上。

      對記憶系統設計的啟示

      CloneMem的實驗結果指向一個核心問題:當前的記憶系統把記住當成了目標,但AI Clone真正需要的是還原。

      這意味著記憶系統不能只做信息壓縮,而要保留原始表述和時間脈絡;不能只記發生了什么事,還要能表征一個人正在經歷什么階段;不能總是給出答案,而要在證據不足時學會說不知道。

      換句話說,AI Clone的記憶不應該是一個越壓越小的知識庫,而應該是一個保留完整證據鏈的底座,因為理解一個人,靠的不是摘要,而是細節。

      QuantaAlpha

      QuantaAlpha成立于2025年4月,由來自國內外知名院校的老師和學生組成,使命是探索智能的「量子」,引領智能體研究的「阿爾法」前沿,從CodeAgent到自進化智能,再到金融與跨領域專用智能體,致力于重塑人工智能的邊界。

      2026年,研究團隊將在CodeAgent、DeepResearch、Agent Memory、Agentic Reasoning/Agentic RL、自進化與協同學習等方向持續產出高質量研究成果,歡迎對我們方向感興趣的同學加入我們!


      團隊主頁:https://quantaalpha.github.io/

      參考資料:

      https://arxiv.org/pdf/2601.07023


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中方必須無條件割讓領土?美發話后,馬來西亞叫囂:中國放棄南海

      中方必須無條件割讓領土?美發話后,馬來西亞叫囂:中國放棄南海

      老黯談娛
      2026-01-23 01:16:15
      40歲左右得女性這樣打扮,既優雅又有成熟女人的魅力

      40歲左右得女性這樣打扮,既優雅又有成熟女人的魅力

      牛彈琴123456
      2025-12-28 16:35:58
      日本政壇突變,局勢急轉,37名黑金議員借勢復出,高市已無退路

      日本政壇突變,局勢急轉,37名黑金議員借勢復出,高市已無退路

      顧史
      2026-01-22 12:59:31
      山西輸球后再遭打擊?迪亞洛潘江或雙雙被禁賽:廣東隊這下贏麻了

      山西輸球后再遭打擊?迪亞洛潘江或雙雙被禁賽:廣東隊這下贏麻了

      籃球快餐車
      2026-01-23 01:16:48
      又進1球!C羅距千球里程碑僅一步之遙

      又進1球!C羅距千球里程碑僅一步之遙

      星耀國際足壇
      2026-01-22 22:28:09
      SWIFT:美元全球交易 使用量躍升至新高

      SWIFT:美元全球交易 使用量躍升至新高

      每日經濟新聞
      2026-01-22 12:34:31
      普京表態:愿撥10億被美凍結資產給“和平委員會”,格陵蘭島當前事態與俄羅斯完全無關

      普京表態:愿撥10億被美凍結資產給“和平委員會”,格陵蘭島當前事態與俄羅斯完全無關

      封面新聞
      2026-01-22 19:17:05
      夢回巔峰,恩比德19中10爆砍32分15板10助三雙,罰球12中11

      夢回巔峰,恩比德19中10爆砍32分15板10助三雙,罰球12中11

      懂球帝
      2026-01-23 11:03:08
      我賭氣去給男閨蜜慶生,發照挑釁老公,那晚景象讓我看的全身發麻

      我賭氣去給男閨蜜慶生,發照挑釁老公,那晚景象讓我看的全身發麻

      千秋文化
      2026-01-19 19:14:28
      賴清德家人已逃亡美國?解放軍公布斬首行動畫面,2分鐘擊斃4人

      賴清德家人已逃亡美國?解放軍公布斬首行動畫面,2分鐘擊斃4人

      不似少年游
      2026-01-21 07:05:01
      這趟不帶活人帶死物?美俄都眼紅,中國航天不再低調:必須拆了!

      這趟不帶活人帶死物?美俄都眼紅,中國航天不再低調:必須拆了!

      榮亭小吏
      2026-01-22 10:06:08
      恩里克:為什么目前巴黎不是法甲第一?因為有球隊連贏了10場

      恩里克:為什么目前巴黎不是法甲第一?因為有球隊連贏了10場

      懂球帝
      2026-01-22 23:21:31
      擁有2套以上房產的家庭,按照新規,房產稅或將這樣征

      擁有2套以上房產的家庭,按照新規,房產稅或將這樣征

      貓叔東山再起
      2026-01-23 10:50:03
      德黑蘭的“九命怪貓”:華盛頓為何總是算不準伊朗政權的死期?

      德黑蘭的“九命怪貓”:華盛頓為何總是算不準伊朗政權的死期?

      允華說
      2026-01-23 10:34:22
      川普應已再次以超乎想象的方式拿到格陵蘭三百多萬平、以及北冰洋

      川普應已再次以超乎想象的方式拿到格陵蘭三百多萬平、以及北冰洋

      邵旭峰域
      2026-01-22 16:05:28
      自作孽不可活!高調炫富的李湘再傳“噩耗”,私生活被扒個底朝天

      自作孽不可活!高調炫富的李湘再傳“噩耗”,私生活被扒個底朝天

      人間無味啊
      2026-01-23 01:08:44
      這就是溥儀皇后婉容的真實樣貌,非演員扮演,貨真價實的罕見照片

      這就是溥儀皇后婉容的真實樣貌,非演員扮演,貨真價實的罕見照片

      云霄紀史觀
      2026-01-23 03:44:24
      一萬人中,能有多少人晚年還能健全走路?少坐多站的人,告訴實話

      一萬人中,能有多少人晚年還能健全走路?少坐多站的人,告訴實話

      健康科普365
      2026-01-18 16:35:03
      1月23日人民幣對美元中間價調升90個基點

      1月23日人民幣對美元中間價調升90個基點

      證券時報
      2026-01-23 09:35:06
      就在今天!1月23日凌晨 澳網傳來王欣瑜 萊巴金娜 巴圖科娃新消息

      就在今天!1月23日凌晨 澳網傳來王欣瑜 萊巴金娜 巴圖科娃新消息

      皮皮觀天下
      2026-01-23 06:11:10
      2026-01-23 11:20:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14387文章數 66523關注度
      往期回顧 全部

      科技要聞

      TikTok在美正式建合資公司,字節保留算法

      頭條要聞

      牛彈琴:特朗普又要干一件大事 世界三個沒想到

      頭條要聞

      牛彈琴:特朗普又要干一件大事 世界三個沒想到

      體育要聞

      跑個步而已,他們在燃什么?

      娛樂要聞

      劉大錘曝料 將王星越的“體面”撕粉碎

      財經要聞

      茂名首富,這次糟了

      汽車要聞

      配備多塊娛樂屏 極氪8X內飾曝光

      態度原創

      數碼
      房產
      游戲
      本地
      公開課

      數碼要聞

      京東方:第8.6代AMOLED產線預計今年量產,品牌廠采購LCD較為積極

      房產要聞

      低密洋房驚艷亮相!海口樓市,突然迎來改善王炸!

      《神鬼寓言4》可捏臉、選擇性別、結婚生子

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 蜜桃av一区二区高潮久久精品| 成人免费播放平台av| 国产亚洲精品美女久久久久 | 免费精品国产人妻av| 国内精品伊人久久久久777| 久久神马| 日韩国产色色网| 欧美色综合| 亚洲AV成人片不卡无码| 亚洲国产欧美在线人成大黄瓜 | 欧美成人精品一区二区综合| 国自产偷精品不卡在线| 庆阳市| 国产精品久久无码一区| 亚洲AV无码东方伊甸园| 亚洲最大成人网站| 日韩中文字幕在线亚洲一区| 亚洲国产成人精品女人久久久| 久久精品国产亚洲精品色婷婷| 乌克兰少妇xxxx做受野外| 性一交一乱一伦| 天天躁夜夜躁av天天爽| 91九色视频| 日韩一区二区在线观看视频| 日韩顶级metart裸体自慰| 日本精品毛片| 久久影音先锋| 96精品久久久久久久久久| 国产情侣激情在线对白| 欧洲freexxxx性少妇播放| 老司机午夜福利视频| 午夜成人无码福利免费视频| 隔壁人妻偷人bd中字| 国产高清精品自在线看| 国产精品视频一区二区三区不卡| 汝南县| 日韩人妻无码一区二区三区久久 | 最近中文字幕日韩有码| 好紧好湿好黄的视频| 色妺妺视频网| 国产精品久久777777|