4月10日消息,近日,北京智源人工智能研究院、北京郵電大學與中國信息通信研究院聯合發布面向OpenClaw的實時安全框架ClawKeeper v1.0。據介紹,該項目首創:技能(Skill)、插件(Plugin)、觀察者(Watcher)三位一體的防御架構,旨在提供覆蓋智能體全生命周期的安全保護,目前已在GitHub開源,相關研究論文也已同步發布。
圖注:ClawKeeper概述圖
據了解,隨著OpenClaw等智能體獲取調用工具、讀寫文件及控制操作系統的權限,提示注入、密鑰泄露、惡意技能等安全風險日益凸顯。當前的防御手段多存在覆蓋范圍碎片化、防御方式被動以及靜態防御等局限,往往要求智能體在完成任務和遵守安全合規性之間進行平衡,難以應對不斷迭代的安全挑戰。
據介紹,智源研究院提供了一種全新的破局思路:用智能體監管智能體。這一范式的核心是:部署一個完全獨立于 OpenClaw 業務之外的殺毒軟件,不干擾業務執行,卻能實現實時攔截和同步進化。既能從“事后復盤”轉向“事前防御、事中攔截”,提前規避風險,又能隨著 OpenClaw 的能力升級同步更新防御規則,徹底擺脫靜態防御的局限,真正打破安全與效率的零和博弈。
圖注:ClawKeeper 功能介紹
該框架包含三大防御組件。首先是Skill-based(技能級別防護),在指令層將結構化的安全策略注入到智能體的上下文中,強制執行特定環境的安全邊界限制。其次是Plugin-based(插件級別防護),作為內部運行時的強制執行器,負責進行配置加固、主動威脅檢測與持續的行為監控。最后是Watcher-based(監管者級別防護),引入解耦的系統級安全中間件,由專門的安全智能體負責監管執行任務的OpenClaw,在關鍵時刻干預或接管執行流程。
據悉,在基準測試中,ClawKeeper覆蓋了提示詞注入、憑據泄露、危險命令執行等多種高危場景。其監管者設計實現了安全與任務的解耦,不僅不依賴特定智能體系統,還具備根據安全交互和新風險不斷更新自身記憶池的自進化能力。該框架支持本地運行與企業級部署,為智能體系統提供了事前防御與事中攔截的安全基礎設施。(袁寧)
