![]()
從「AI For What」到「Value From AI」,100+ 可落地實踐案例打通 AI 實戰最后一公里!
4 月 16 日 -4 月 18 日,QCon 全球軟件開發大會 將在北京舉辦。本屆大會錨定 Agentic AI 時代的軟件工程重塑,聚焦 Agentic AI、多智能體協作、算力優化、技術債治理、多模態和 AI 原生基礎設施等前沿話題,邀請來自騰訊、阿里、百度、華為、螞蟻、小米、網易等企業技術專家,帶來百余項真實落地案例,系統性分享前沿洞察與實戰干貨,以技術共創探索 AI 落地新路徑。
記憶張量 CTO 李志宇博士已確認出席 "記憶覺醒:智能體記憶系統的范式重塑與產業落地" 專題,并發表題為《大模型記憶系統 MemOS 2.0:StarDust 技術演進與關鍵挑戰》的主題分享。隨著 Agent 進入真實工作流,“記憶”正在從體驗加分項變成系統級基礎能力: 它決定了跨會話連續性、長期任務穩定性、推理成本結構,以及可控與合規邊界。本次演講將系統梳理大模型記憶從 1.0(外掛式檢索與上下文拼裝)走向 2.0(記憶原生、可調度、可演化)的技術演進路徑,并推出 MemOS 2.0 StarDust。解釋為什么僅靠更長上下文與向量數據庫并不足以支撐長期智能,以及記憶如何與模型推理、KV-cache、工具調用與狀態管理形成“協同閉環”。希望通過一套可復用的框架,幫助聽眾在“做得出來”與“規模化可控”之間找到真正可持續的記憶工程路線。
李志宇,博士,入選上海市東方英才拔尖人才,記憶張量(上海)科技有限公司聯合創始人兼 CTO、上海算法創新研究院大模型中心技術負責人、研究員。他長期從事預訓練和大模型應用方向的研發技術攻關,主要研究方向包括大模型記憶增強、高效評估與應用算法。他在本次會議的詳細演講內容如下:
演講提綱
背景與動機:為什么記憶系統 MemOS 2.0:StarDust 成為大模型走向長期智能的拐點
從 1.0 到記憶系統 MemOS 2.0:記憶范式的技術演進與能力邊界變化
MemOS 2.0 StarDust 總體架構:以“記憶調度”為核心的系統分層與數據流
關鍵模塊拆解:寫入 (抽取 / 治理) 一組織 (結構化 / 索引) 一檢索 (多級緩存) 一更新 (版本 / 沖突)
與模型協同:推理增強、KV-cache/ 激活記憶管理、參數化記憶寫入與遷移
關鍵挑戰一:寫入質量與污染控制 (噪聲、偏差、重復、對齊)
關鍵挑戰二:可控演化 (遺忘機制、沖突消解、時間一致性、回溯與審計)
關鍵挑戰三:成本結構與規模化 (延遲、吞吐、存儲、檢索瓶頸、工程可觀測)
關鍵挑戰四:隱私與安全 (權限、最小化收集、可刪除、合規與風險治理)
評測與基準:如何評價“記得對、用得準、改得穩、控得住”
落地路徑與案例:典型應用場景、失敗模式與工程最佳實踐
未來展望:記憶原生基模、MemOS/AgentOS 生態、以及“記憶即計算”的下一步
這樣的技術在實踐過程中有哪些痛點?
寫入質量難控:記得越多越容易把噪聲 / 誤事實寫進去,后期污染導致“越用越不準”
性能與成本拉扯:多級檢索、重排、治理讓效果更穩,但 p99 延遲、工程復雜度和算力 / 存儲成本會明顯上升
個性化與隱私沖突:接入越深越“懂你”,但權限邊界、可審計可刪除、合規風控會變成系統級硬約束。
演講亮點
從“外掛檢索”到“記憶調度”:業界多數方案把記憶當作外部 RAG 組件 (檢索拼上下文),我們的重點是把記憶當作可調度資源,圍繞“寫入門檻一多級緩存一注入策略”做系統化控制,把穩定性問題(污染 / 沖突 / 時序)前置解決,而不是靠更大的向量庫兜底。
三層記憶協同(參數 / 激活 KV 明文)而非單一存儲:現有方案往往只做明文記憶 + 向量檢索 ; 我們強調不同時間尺度與價值密度的知識進入不同層:高價值穩定知識傾向參數化,任務態信息走 KV 激活層,需審計與可刪除的長期事實走明文層,從而在“成本一可控一效果”三者間獲得更好的折中。
聽眾收益
拿走一套可落地的“MemOS 2.0:StarDust 架構藍圖”:明確記憶寫入 / 組織 / 檢索 / 更新 / 治理的模塊邊界與數據流,知道團隊從“RAG+ 向量庫”升級到系統級記憶該怎么分層、怎么拆工、怎么評估投入產出。
掌握關鍵 tradeoff 的工程決策方法:圍繞寫入門檻、召回 / 精度、p99 延遲與成本、隱私權限與可刪除、沖突與版本回溯等,給出可操作的設計選型與“踩坑清單”,幫助在真實生產約束下做正確取舍。
獲得可復用的評測與可觀測思路:如何定義“記得對、用得準、改得穩、控得住”的指標體系與回歸策略,如何用線上可觀測把記憶污染、沖突漂移、注入失效等問題從“偶發事故”變成可診斷、可治理的工程問題。
除此之外,本次大會還策劃了Agentic Engineering、多模態理解與生成的突破、記憶覺醒:智能體記憶系統的范式重塑與產業落地、具身智能與物理世界交互、Agent Infra 架構設計、AI 重塑數據生產與消費、AI 原生基礎設施、AI 驅動的技術債治理、小模型與領域適配模型、大模型算力優化、Agent 可觀測性與評估工程、AI for SRE等 20 多個專題論壇,屆時將有來自不同行業、不同領域、不同企業的 100+ 資深專家在 QCon 北京站現場帶來前沿技術洞察和一線實踐經驗。
會議推薦
OpenClaw 出圈,“養蝦”潮狂熱,開年 Agentic AI 這把火燒得不可謂不旺。在這一熱潮下,自托管 Agent 形態迅速普及:多入口對話、持久記憶、Skills 工具鏈帶來強大生產力。但這背后也暴露了工程化落地的真實難題——權限邊界與隔離運行、Skills 供應鏈安全、可觀測與可追溯、記憶分層與跨場景污染、以及如何把 Agent 納入團隊研發 / 運維流程并形成穩定收益。
針對這一系列挑戰,在 4 月 16-18 日即將舉辦的 QCon 北京站上,我們特別策劃了「OpenClaw 生態實踐」專題,將聚焦一線實踐與踩坑復盤,分享企業如何構建私有 Skills、制定安全護欄、搭建審計與回放機制、建立質量 / 效率指標體系,最終把自托管 Agent 從可用的 Demo 升級為可靠的生產系統。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.