網易首頁 > 網易號 > 正文申請入駐

谷歌HOPE架構來了！突破大模型長期記憶難題，智能體要爆發？

2025-12-08 21:13:58　來源: 雷科技

廣東舉報

分享至

日前，Google在其發布的論文《Nested Learning: The Illusion of Deep Learning Architectures》中，提出了一個名為 HOPE 的新框架試圖解決大模型長期記憶的問題。

這一架構備受關注，因為長期記憶一直困擾著大模型的發展，甚至影響著AI落地到智能體的廣度與深度。

今天讓 AI 寫一段漂亮的回答不難，難的是隔了一周、換了工作任務，它還記得你之前某次對話的關鍵細節，不斷更新對你的個性化記憶。也只有在這一刻，大模型才真正開始接近「持續工作的智能體」，而不是一次性消耗品。

可以說，大模型的「短期能力」決定了它能不能把一句話說通，但長期記憶真正決定的，其實是它有沒有資格被稱為「助手」。

也正是因為這一點，去年最后一天谷歌研究團隊提出的 Titans 架構，在 2025 年被反復翻出來討論，并不意外。這篇論文試圖回答的，并不是「上下文還能拉多長」這種老問題，而是一個更本質的命題：

當注意力只是短期記憶，大模型到底該如何擁有真正的長期記憶。

圖片來源：谷歌

在 Titans 里，Transformer 的 self-attention（自注意力機制）被明確界定為「短期系統」，而一個獨立的神經長期記憶模塊，負責跨越上下文窗口、選擇性地存儲和調用關鍵信息。這套思路，幾乎重新定義了大模型的「大腦結構」。

現在回頭這一年，從谷歌 Titans 到字節 MemAgent，再到谷歌 Hope 架構，大模型的長期記憶真正有了突破。

過去一年，不論是谷歌在此基礎上延展出的多時間尺度記憶體系，還是行業里圍繞超長上下文、智能體（Agent）記憶、外部記憶中臺展開的密集探索，都指向同一個趨勢：長期記憶，正在從工程補丁，變成大模型能力的核心坐標軸。

模型不再只比誰的窗口更長、參數更多，而是開始比誰記得更有選擇、更穩定、也更「像人」。大模型的長期記憶不再只是論文里的性能指標，而是決定「能不能長期被用、敢不敢被信任」的關鍵能力。

從 Titans 到 Hope，長期記憶在為智能體「打基礎」

今年 8 月中旬，谷歌為 Gemini 推出了兩項重大更新，分別是基于聊天上下文的「自動記憶」功能和保護隱私的「臨時聊天」模式。

顧名思義，「自動記憶」是指 Gemini 會通過學習用戶過去的聊天記錄，記憶對話中的關鍵細節、用戶偏好、長期項目背景、反復出現的需求等，并在后續回答中實現主動的個性化回答。

類似的變化并不只發生在 Gemini 身上。過去一年，從 ChatGPT、豆包到 11 月推出的訊飛星火 X1.5，幾乎所有頭部 AI 助手都在通過引入「長期記憶模塊」，努力讓大模型在跨會話、跨場景中保持連續性，讓 AI 能夠更新并記憶用戶畫像、歷史任務狀態和關鍵決策信息。

圖片來源：科大訊飛

不過繼續向上追溯，這一波產品層的變化，并不是孤立發生的，而是 2025 年大模型底層技術演進的直接結果。

首先被重新確認的一點是，長上下文不是大模型記憶的終點。

超長上下文仍然重要，但它越來越被視為一種「放大的短期記憶」——成本高、也無法判斷哪些信息值得被長期保留。而 Titans 的意義，并不在于把窗口再拉長，而在于明確區分：注意力只是短期系統，長期記憶必須是一個可持續更新的組件。

11 月，谷歌更是提出將模型訓練過程也視為一層記憶（Nested Learning），并給出了升級版的 Hope 架構，開始把「記憶」理解為多時間尺度的連續體，短期上下文、中期狀態、長期經驗不再是割裂的模塊，而是按更新頻率和穩定性分布在同一套學習系統中。

Hope 與 Titans、Transformer 架構對比困惑度（左）和常識推理（右），圖片來源：谷歌

與此同時，長期記憶的重心從「記住文本」轉向「記住經驗」。過去常見的做法是用向量數據庫或知識庫做 RAG，把它當成模型的「外部硬盤」。但現在這種做法正在被重新審視，長期記憶不只是檢索答案，而是需要參與推理過程，影響模型的決策和行為。

還是在 11 月，谷歌提出 Evo-Memory benchmark 和 ReMem 框架，明確將長期記憶放入智能體的工作流中考察：模型是否能在連續任務中提煉經驗、復盤策略，并在后續任務中真正用上。長期記憶不再只是為對話服務，而是直接決定智能體是否具備持續進化能力。

事實上，字節跳動與清華聯合提出的 MemAgent，則通過強化學習訓練模型在超長上下文中「學會取舍」，讓模型主動形成長期記憶習慣，而不是被動堆疊文本。這些工作雖然路徑不同，但都指明了長期記憶必須逐步內化為模型能力，而不只是工程外掛。

長期記憶的中國路線：MiniMax/豆包/DeepSeek有何不同思路？

今年年初，MiniMax 宣布了首個線性注意力架構大模型開源，官方就指出現有智能體的「長期記憶」大多只是外掛 RAG 工具，這嚴格意義上不算記憶。

事實的確如此。在早期實踐中，向量數據庫加 RAG 幾乎是默認方案：需要記住什么，就檢索什么。但隨著智能體逐漸承擔多步驟任務，這種「查完就走」的記憶方式開始顯得吃力。

最近豆包手機引爆了業界關于AI手機的討論，其實豆包在 Agent 體系中關于長記憶的探索也具有很強的代表性，其長期記憶被拆分進整個工作流，用來保存用戶畫像、任務狀態、階段性結論，甚至失敗經驗。

MemAgent 的基本結構，圖片來源：字節跳動

MemAgent 這一類方案，本質上并不是在擴展上下文長度，而是在訓練模型理解哪些信息會影響下一步決策。簡言之，記憶不再是查資料，而是參與判斷。

從這個角度看，字節與清華聯合提出的 MemAgent 并不是一篇孤立的學術工作。它關注的，并不是如何壓縮文本或擴展容量，而是通過強化學習，讓模型在超長上下文和連續任務中逐漸學會「取舍」。模型需要理解哪些信息值得保留，哪些只適合短期使用，甚至哪些應該被主動遺忘。

背后也體現了一種非常明確的判斷，即長期記憶如果不能改變模型的行動策略，本質上仍然只是工程緩存。

正如前文所提，不論是行業的實踐，還是圍繞智能體展開的多種系統設計，都在強調對「過程信息」的保留。這也解釋了為什么強化學習開始被用于「記憶行為」的訓練，而不是簡單地擴大知識庫。

與之不同的是，MiniMax 在今年初就通過線性注意力等架構創新，把模型可處理的上下文推至百萬乃至數百萬 token 級別。

這并不是單純為了刷新指標，而是試圖用容量換取系統簡化。當模型本身一次可以穩定「看見」更多內容時，部分原本需要頻繁調度、反復檢索的外部記憶，就可以暫時被收進上下文視野之中。

但 MiniMax 的實踐并沒有停留在「超長上下文窗口」。

圖片來源：MiniMax

相反，他們在此基礎上繼續引入獨立的記憶層，用于管理長期知識與經驗。先解決「裝不裝得下」，再討論「該不該留下來」。在這種框架下，長期記憶不再完全依賴于頻繁的 RAG 調用，而是通過更大的模型內視野與更少的系統切換，降低整體復雜度。

而 DeepSeek 的策略，則構成了一個有意義的對照。DeepSeek 并沒有在模型側押注復雜的長期記憶機制，而是將其明確外置，通過 RAG、向量庫或各類記憶組件完成。倒不是在回避問題，而是基于一個更克制的判斷：

長期記憶高度依賴具體場景，不同應用需要的記憶形態差異巨大，與其在模型里「一刀切」，不如提供一個高質量的推理核心，讓開發者自行組合記憶方案。

寫在最后

2025 年，大模型長期記憶真正發生變化的，并不是某一項指標被刷新，而是它的角色定位被徹底改寫了。從早期依賴 RAG 的「外接硬盤」，到今天逐步進入模型結構與智能體工作流，長期記憶開始成為影響決策、塑造行為的一部分，而不只是被動存儲信息的容器。

或許可以這么說，未來大模型之間真正的差異，不再只體現在模型規模或推理速度上，還在于一套成熟、可控、可持續演化的記憶機制。因為只有當一個模型真正記得住、也管得住，它才有可能被長期使用、反復依賴，甚至被交付更大的決策權。

CES2026開幕在即！（1月6日-1月9日）
作為中國報道科技展會最悠久、最深入、最專業的新媒體，雷科技CES2026報道團正在進行緊張的前期籌備。屆時雷科技將派出史上最大規模的CES報道團，并由雷科技創始人兼總編輯羅超帶隊，對CES2026進行一線、專業和立體報道，敬請期待！

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

第二波DeepSeek沖擊：V3.2 改寫中國云生態與芯片生態

華爾街見聞官方 2025-12-06 15:30:07
10 跟貼 10
滴普科技趙杰輝：從技術探索到場景實效，AI 穿越 “高山與大海” 的企業賦能路徑 | WISE2025 商業之王大會

36氪 2025-12-08 17:03:10
0 跟貼 0

從分鐘級等待到20倍超速：LightX2V重寫AI視頻生成速度上限

機器之心Pro 2025-12-08 14:11:58
0 跟貼 0

OpenAI：全球付費企業用戶激增143%，AI工具日均為員工節省40至60分鐘

華爾街見聞官方 2025-12-08 21:01:59
0 跟貼 0
端側智能體崛起，高通攜手產業鏈帶來AI普惠新體驗

通信世界 2025-12-08 18:31:39
0 跟貼 0

ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執行各種任務

量子位 2025-07-18 18:08:35
0 跟貼 0

斯坦福最火CS課：不讓學生寫代碼，必須用AI

機器之心Pro 2025-12-08 18:44:00
0 跟貼 0
DeepSeek V3到V3.2的進化之路，一文看全

機器之心Pro 2025-12-08 14:07:45
0 跟貼 0

兩個LLM互相對線，推理起飛：康奈爾團隊發布大模型版類GAN訓練法

機器之心Pro 2025-12-08 16:16:12
0 跟貼 0
GMI Cloud：出海是AI企業釋放產能、獲取新生的最佳途徑｜WISE 2025

36氪 2025-12-08 18:50:09
0 跟貼 0
看完最新國產AI寫的公眾號文章，我慌了！

量子位 2025-12-08 21:34:55
0 跟貼 0
模型不用微調，靠上下文就能自我進化？

機器之心Pro 2025-10-11 20:20:59
0 跟貼 0
地平線余凱：共赴物理AI高境，同立普惠生態基石

雷科技 2025-12-08 21:53:35
0 跟貼 0
不止于炫技，普渡如何引領機器狗成為具身智能商業化最佳物種？

智東西 2025-12-08 21:43:08
0 跟貼 0
明朝最基層的治理體系縣衙的架構是怎樣的？

朝話熹史 2025-12-05 06:05:44
0 跟貼 0
張量分解與電路之間是什么關系（以及我們如何利用它）？

CreateAMind 2025-12-08 19:37:01
0 跟貼 0
達晨、華控領投，極佳視界A2輪再融2億，押注“世界模型+行動模型”原生架構

鈦媒體APP 2025-12-08 15:11:08
0 跟貼 0
香港加油！數字經濟+大模型+智能體+互聯網，助力香港快速發展！

去山野間追風 2025-12-07 10:39:59
0 跟貼 0
跟上百個大廠人聊過，為什么說字節的校招生成長最快？

大廠青年 2025-12-08 20:34:33
0 跟貼 0
【徹底講透RAG】從破防rag弱點->阿里神器qwen3 Embedding模型->大模型rag項目

盧菁老師 2025-12-08 10:00:31
0 跟貼 0
北京大學AI DAY暨信息科學技術學院第四十六期“知存講座”順利舉辦

濮陽市廣播電視臺 2025-12-08 15:54:28
0 跟貼 0
全國400余名教育人共探“AI+教育”，智能體“同升博問”發布

中國教育新聞網 2025-12-08 20:22:27
0 跟貼 0
比鬧鐘還管用！飛書多維表格自動提醒，再也不怕忘記事兒！

秋葉excel 2025-12-08 11:37:27
0 跟貼 0
垃圾進垃圾出，大模型刷多了垃圾推文，智商驟降還變自戀狂

機器之心Pro 2025-10-24 18:51:47
0 跟貼 0
“腎小保”在全國醫保經辦智能體展示中驚艷亮相

知頓 2025-12-08 18:15:42
0 跟貼 0
B社總監陶德?霍華德：AI只是工具，人類創造力不可替代

IT之家 2025-12-08 15:57:29
0 跟貼 0
NextEra Energy將與谷歌云合作，在美國新建多個吉瓦級數據中心園區

界面新聞 2025-12-08 20:19:26
0 跟貼 0
新國標電動自行車陸續到店開售價格如何？

新京報 2025-12-08 07:19:40
8505 跟貼 8505
NextEra Energy將與谷歌云合作在美國新建多個吉瓦級數據中心園區

財聯社 2025-12-08 20:16:14
0 跟貼 0
罕見！遼寧艦沿琉球群島北上

揚子晚報 2025-12-08 12:37:37
2986 跟貼 2986
光入柜內要來，通信ETF能破前高么？——通信ETF（515880）大漲點評

每日經濟新聞 2025-12-08 16:10:05
0 跟貼 0
全球市值最高電力股同日官宣谷歌、Meta新合作

財聯社 2025-12-08 22:06:12
0 跟貼 0
眼鏡框架的手工焊接

芒果撈星星 2025-12-07 09:38:07
1 跟貼 1
干枯了三十多年，鄭州“母親河”賈魯河源頭泉水復涌，水溫近30℃，附近民眾興奮不已，奔走相告

極目新聞 2025-12-08 14:40:30
107 跟貼 107
美媒稱烏東戰局正發生急劇變化

參考消息 2025-12-08 12:53:03
3 跟貼 3
iPhone 17 Pro官方降價

大象新聞 2025-12-08 11:30:46
2678 跟貼 2678
江蘇常州擬新增2座機場

魯中晨報 2025-12-08 16:01:42
30 跟貼 30
打了疫苗為何仍會“中招” 專家詳解如何應對

央視新聞客戶端 2025-12-08 01:01:38
1819 跟貼 1819
重磅！政治局會議定調明年經濟工作

第一財經資訊 2025-12-08 14:51:47
101 跟貼 101
東莞街頭驚現大量“光頭樹”？官方：主要基于公共安全考慮

南方都市報 2025-12-08 11:54:10
118 跟貼 118

雷科技

專注AI硬科技

35387文章數 811606關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

親子

時尚

教育

軍事航空

家居要聞

手機 / 數碼

房產 / 家居

谷歌HOPE架構來了！突破大模型長期記憶難題，智能體要爆發？

從 Titans 到 Hope，長期記憶在為智能體「打基礎」

長期記憶的中國路線：MiniMax/豆包/DeepSeek有何不同思路？

寫在最后

外面有人挖，家里有人跑:蘋果亂成了一鍋粥

美高官齊發聲：中國一直在遵守承諾

美高官齊發聲：中國一直在遵守承諾

一位大學美術生，如何用4年成為頂級跑者？

章子怡被說拜高踩低 主動和卡梅隆熱聊

百億金融爆雷 浙商大佬"朋友圈"也不靈了

純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

態度原創

有限無界 打破慣有思維

爸爸說今天帶孩子們一起自制下午茶

伊姐周日熱推：電視劇《超感迷宮》；電視劇《風與潮》......

石油“鐵飯碗”還香嗎？2026中石化西北石油局錄用揭秘

柬泰沖突細節披露 洪森要求部隊“克制”

章子怡被說拜高踩低主動和卡梅隆熱聊

百億金融爆雷浙商大佬"朋友圈"也不靈了

純電全尺寸大六座凱迪拉克"小凱雷德"申報圖曝光

有限無界打破慣有思維

柬泰沖突細節披露洪森要求部隊“克制”