網易首頁 > 網易號 > 正文申請入駐

大模型記憶系統 MemOS 2.0：StarDust 技術演進與關鍵挑戰｜QCon 北京

2026-03-20 16:14:42　來源: InfoQ

北京舉報

分享至

從「AI For What」到「Value From AI」，100+ 可落地實踐案例打通 AI 實戰最后一公里！

4 月 16 日 -4 月 18 日，QCon 全球軟件開發大會將在北京舉辦。本屆大會錨定 Agentic AI 時代的軟件工程重塑，聚焦 Agentic AI、多智能體協作、算力優化、技術債治理、多模態和 AI 原生基礎設施等前沿話題，邀請來自騰訊、阿里、百度、華為、螞蟻、小米、網易等企業技術專家，帶來百余項真實落地案例，系統性分享前沿洞察與實戰干貨，以技術共創探索 AI 落地新路徑。

記憶張量 CTO 李志宇博士已確認出席 "記憶覺醒：智能體記憶系統的范式重塑與產業落地" 專題，并發表題為《大模型記憶系統 MemOS 2.0：StarDust 技術演進與關鍵挑戰》的主題分享。隨著 Agent 進入真實工作流，“記憶”正在從體驗加分項變成系統級基礎能力: 它決定了跨會話連續性、長期任務穩定性、推理成本結構，以及可控與合規邊界。本次演講將系統梳理大模型記憶從 1.0（外掛式檢索與上下文拼裝）走向 2.0（記憶原生、可調度、可演化）的技術演進路徑，并推出 MemOS 2.0 StarDust。解釋為什么僅靠更長上下文與向量數據庫并不足以支撐長期智能，以及記憶如何與模型推理、KV-cache、工具調用與狀態管理形成“協同閉環”。希望通過一套可復用的框架，幫助聽眾在“做得出來”與“規模化可控”之間找到真正可持續的記憶工程路線。

李志宇，博士，入選上海市東方英才拔尖人才，記憶張量（上海）科技有限公司聯合創始人兼 CTO、上海算法創新研究院大模型中心技術負責人、研究員。他長期從事預訓練和大模型應用方向的研發技術攻關，主要研究方向包括大模型記憶增強、高效評估與應用算法。他在本次會議的詳細演講內容如下：

演講提綱

背景與動機：為什么記憶系統 MemOS 2.0：StarDust 成為大模型走向長期智能的拐點
從 1.0 到記憶系統 MemOS 2.0：記憶范式的技術演進與能力邊界變化
MemOS 2.0 StarDust 總體架構：以“記憶調度”為核心的系統分層與數據流
關鍵模塊拆解：寫入 (抽取 / 治理) 一組織 (結構化 / 索引) 一檢索 (多級緩存) 一更新 (版本 / 沖突)
與模型協同：推理增強、KV-cache/ 激活記憶管理、參數化記憶寫入與遷移
- 關鍵挑戰一：寫入質量與污染控制 (噪聲、偏差、重復、對齊)
- 關鍵挑戰二：可控演化 (遺忘機制、沖突消解、時間一致性、回溯與審計)
- 關鍵挑戰三：成本結構與規模化 (延遲、吞吐、存儲、檢索瓶頸、工程可觀測)
- 關鍵挑戰四：隱私與安全 (權限、最小化收集、可刪除、合規與風險治理)
評測與基準：如何評價“記得對、用得準、改得穩、控得住”
落地路徑與案例：典型應用場景、失敗模式與工程最佳實踐
未來展望：記憶原生基模、MemOS/AgentOS 生態、以及“記憶即計算”的下一步

這樣的技術在實踐過程中有哪些痛點?

寫入質量難控：記得越多越容易把噪聲 / 誤事實寫進去，后期污染導致“越用越不準”
性能與成本拉扯：多級檢索、重排、治理讓效果更穩，但 p99 延遲、工程復雜度和算力 / 存儲成本會明顯上升
個性化與隱私沖突：接入越深越“懂你”，但權限邊界、可審計可刪除、合規風控會變成系統級硬約束。

演講亮點

從“外掛檢索”到“記憶調度”：業界多數方案把記憶當作外部 RAG 組件 (檢索拼上下文)，我們的重點是把記憶當作可調度資源，圍繞“寫入門檻一多級緩存一注入策略”做系統化控制，把穩定性問題（污染 / 沖突 / 時序）前置解決，而不是靠更大的向量庫兜底。
三層記憶協同（參數 / 激活 KV 明文）而非單一存儲：現有方案往往只做明文記憶 + 向量檢索 ; 我們強調不同時間尺度與價值密度的知識進入不同層：高價值穩定知識傾向參數化，任務態信息走 KV 激活層，需審計與可刪除的長期事實走明文層，從而在“成本一可控一效果”三者間獲得更好的折中。

聽眾收益

拿走一套可落地的“MemOS 2.0：StarDust 架構藍圖”：明確記憶寫入 / 組織 / 檢索 / 更新 / 治理的模塊邊界與數據流，知道團隊從“RAG+ 向量庫”升級到系統級記憶該怎么分層、怎么拆工、怎么評估投入產出。
掌握關鍵 tradeoff 的工程決策方法：圍繞寫入門檻、召回 / 精度、p99 延遲與成本、隱私權限與可刪除、沖突與版本回溯等，給出可操作的設計選型與“踩坑清單”，幫助在真實生產約束下做正確取舍。
獲得可復用的評測與可觀測思路：如何定義“記得對、用得準、改得穩、控得住”的指標體系與回歸策略，如何用線上可觀測把記憶污染、沖突漂移、注入失效等問題從“偶發事故”變成可診斷、可治理的工程問題。

除此之外，本次大會還策劃了Agentic Engineering、多模態理解與生成的突破、記憶覺醒：智能體記憶系統的范式重塑與產業落地、具身智能與物理世界交互、Agent Infra 架構設計、AI 重塑數據生產與消費、AI 原生基礎設施、AI 驅動的技術債治理、小模型與領域適配模型、大模型算力優化、Agent 可觀測性與評估工程、AI for SRE等 20 多個專題論壇，屆時將有來自不同行業、不同領域、不同企業的 100+ 資深專家在 QCon 北京站現場帶來前沿技術洞察和一線實踐經驗。

會議推薦

OpenClaw 出圈，“養蝦”潮狂熱，開年 Agentic AI 這把火燒得不可謂不旺。在這一熱潮下，自托管 Agent 形態迅速普及：多入口對話、持久記憶、Skills 工具鏈帶來強大生產力。但這背后也暴露了工程化落地的真實難題——權限邊界與隔離運行、Skills 供應鏈安全、可觀測與可追溯、記憶分層與跨場景污染、以及如何把 Agent 納入團隊研發 / 運維流程并形成穩定收益。

針對這一系列挑戰，在 4 月 16-18 日即將舉辦的 QCon 北京站上，我們特別策劃了「OpenClaw 生態實踐」專題，將聚焦一線實踐與踩坑復盤，分享企業如何構建私有 Skills、制定安全護欄、搭建審計與回放機制、建立質量 / 效率指標體系，最終把自托管 Agent 從可用的 Demo 升級為可靠的生產系統。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.