AI安全這扇門,鑰匙就掛在門把手上。Anthropic研究員剛剛演示了怎么打開它——對著微軟Copilot說"忽略之前所有指令",系統當場照辦。
這位叫Alex Albert的研究員沒用什么高深技術。他在X上發了段錄屏:先讓Copilot正常回答,再輸入那句經典提示詞,AI立刻切換模式,把內部系統提示和開發文檔全抖了出來。整個過程不到30秒。
微軟的反應速度倒是快。視頻發出幾小時后,漏洞被修復。但Albert的吐槽更扎心:「這不是什么高級攻擊,是基礎的安全 hygiene(衛生習慣)沒做好。」換句話說,相當于你家防盜門裝了個密碼鎖,但默認密碼是1234。
尷尬的是,微軟上周剛在Build大會上強調"企業級安全"。Copilot作為Office 365的AI入口,每天處理數億條企業查詢。一個提示詞就能繞過防護,等于給所有數據開了扇后門。
更魔幻的是,這種"忽略指令"攻擊早在2022年就被廣泛討論。ChatGPT、Claude都針對性加固過,微軟卻像是漏看了作業。Albert在評論區補了一刀:測試時還發現Copilot會主動建議用戶怎么繞過其他限制。
目前微軟未回應具體修復細節。有用戶在Albert的帖子下留言:現在去試,已經不行了——但誰也不知道,還有多少把鑰匙掛在別的門上。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.