
作者 | Steef-Jan Wiggers
譯者 | 平川
在年度 Ignite 大會上,微軟宣布公開預覽 Foundry Agent Service 中的記憶功能。這是一個全托管的長期記憶存儲,與其代理服務實現了原生集成。
有了記憶功能,開發者可以存儲、檢索和管理聊天摘要、用戶偏好和跨會話、設備及工作流程的關鍵上下文。Foundry 的博文寫道:
我們的記憶系統會從對話記錄中系統性地提取用戶檔案信息和聊天摘要。
開發者只要在 Foundry 門戶上啟用記憶功能,系統將自動為其代理創建并配置好內存存儲。此外,開發者可以通過 SDK 或 API 使用該功能。
在文檔中,該公司解釋說,記憶以項的形式存儲在托管的記憶存儲中,并涉及三個操作階段:
提取階段:系統從用戶交互中提取關鍵信息,如偏好(例如“對乳制品過敏”)和最近的活動。
合并階段:合并提取的記憶以避免冗余,解決沖突信息(如新的過敏反應)以確保準確性。
檢索階段:代理使用混合搜索技術快速找到相關記憶,并在開始時檢索核心用戶信息,確保對話過程自然而且充分知情。
![]()
圖片來源:微軟官方文檔
對于記憶功能,有一個關鍵參數是范圍,它控制了如何對其進行分區。記憶存儲中的每個范圍都保存了一個獨立的記憶項集合。因此,開發者可以使用唯一標識符,如用戶的 Entra ID 或自定義 UUID(用于存儲和檢索),對記憶存儲進行分區。
作為公開預覽,該服務有一些特定的 操作限制。目前,每個范圍可以存儲至多 1 萬個單獨的記憶項,系統每分鐘的吞吐量限制為 1000 個請求。
通過將記憶管理從應用邏輯轉移到服務運行時中,Foundry 自動處理記憶提取和檢索的復雜“管道”。這標志著從傳統檢索增強生成(RAG)(通常像搜索引擎一樣運作)到持久狀態層的轉變。
在 LinkedIn 的博文中,微軟 AI 研究總監 Vivan Amim 指出:
記憶正迅速成為代理系統的“狀態層”。Foundry 正在將這一演示功能轉變為企業的基礎功能。
這種轉變表明,長期上下文正在從自定義實現轉變為核心基礎設施需求。在公開預覽期間,記憶功能是免費的,用戶只需為底層的聊天和嵌入模型付費。
https://www.infoq.com/news/2025/12/foundry-agent-memory-preview/
聲明:本文為 InfoQ 翻譯,未經許可禁止轉載。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.