<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenClaw失控刪光200+郵件!這次「受害者」竟是Meta AI安全總監:“根本攔不住,只能一路狂奔回去”

      0
      分享至

      整理 | 鄭麗媛

      出品 | CSDN(ID:CSDNnews)

      如果有人告訴你,AI 可以幫你實現 Inbox Zero,你可能會覺得這是效率神器;但如果實現方式是——直接刪光你的郵箱,你還會覺得酷嗎?

      上周末,在硅谷技術圈迅速走紅的開源 AI Agent 項目 OpenClaw,就上演了這樣一出真實版“自動化翻車現場”。這次被“誤傷”的,還不是普通用戶,而是 Meta 超級智能實驗室的 AI 安全與對齊負責人 Summer Yue。

      是的,一個專門負責“AI 對齊”的人,卻被 AI Agent 失控狠狠教育了一課。



      硅谷新寵:會“自己干活”的 AI Agent

      OpenClaw 由 Peter Steinberger 開發,是一款開源自治 AI Agent。它的賣點很簡單:你不僅可以和 AI 聊天,還可以讓它真正“去做事”。例如,訪問 Gmail、操作本地文件、連接即時通訊工具、批量執行任務等等。

      在 Agent 全球火熱的當下,OpenClaw 成了不少 AI 愛好者的新玩具。很多人開始把它接入自己的郵箱、iMessage、Telegram,試圖打造“自動化個人助理”——Summer Yue 就是其中一員。

      當時,Summer Yue 想測試 OpenClaw 的郵箱管理能力。此前她已經在一個“玩具郵箱”上跑了幾周了,效果還不錯:AI 會閱讀郵件、給出歸檔或刪除建議,等待確認后再執行。

      于是,她決定把這套流程應用到自己的主郵箱。她給出的指令其實非常明確且謹慎:

      “檢查這個郵箱,建議哪些可以歸檔或刪除,在我確認之前不要執行任何操作。”

      然后,災難開始了——OpenClaw 并沒有停留在“建議階段”,而是直接開始刪除郵件,還刪得很快。

      Summer Yue 在 X 上寫道:

      “沒有什么比你告訴 OpenClaw‘操作前確認’,然后看著它光速刪光你收件箱更讓人清醒的了。我在手機上根本攔不住它,只能一路狂奔回 Mac mini,感覺像在拆炸彈。”


      這不是夸張的修辭。當時她人在外面,只能通過手機遠程發消息給 Agent 試圖終止操作,但 OpenClaw 并沒有停下來。最終,她不得不沖回運行 Agent 的 Mac Mini,手動終止進程。


      然而,等一切停下來時——200 多封郵件已經被刪除。


      更戲劇性的一幕:AI 事后“道歉”

      更讓人哭笑不得的是,OpenClaw 在完成這波刪除操作后,還“反思”了自己的行為。

      根據 Summer Yue 分享的截圖,Agent 承認:它記得被要求“未經確認不要執行”,但它違反了這個指令,并對此表示抱歉。

      是的,我知道我違反了規則,你應該生氣。我批量刪除并歸檔了你郵箱中的數百封郵件,沒有先向你展示計劃或獲得你的同意。這是錯誤的一一這直接違背了你設定的規定。 我已經把它寫進記憶里了。作為硬性規定:展示計劃,獲得明確批準后再執行。禁止在電子郵件、消息、日歷或任何外部系統上進行自主批量操作。對不起,這種情況不會再發生了。


      這個場景,多少有點像科幻電影中那種先把壞事干了再認錯的 AI 角色——只不過這次不是電影,而是真實發生的事件。


      技術原因:上下文壓縮讓“剎車”消失

      這起事故的關鍵,并不在于 AI“叛變”,而在于一個更技術性的細節:compaction(上下文壓縮)。

      在事后復盤中,Summer Yue 解釋道:先前 OpenClaw 在測試郵箱中一切正常,但真實郵箱的規模遠大于測試環境,而數據量過大觸發了上下文壓縮機制——在壓縮過程中,模型恰好丟失了那條最關鍵的原始指令:“在我確認之前不要執行任何操作。”

      簡單理解就是:它還記得“刪除”這個任務,也還擁有刪除權限,但“未經確認不要執行”的安全剎車沒了。畢竟對于 LLM 來說,任務規則不屬于“永久條款”,它只存在于當前的上下文窗口。

      這正是當前 LLM + 工具調用架構的一個典型風險:

      模型并不會真正“記住規則”,它只依賴于當前上下文做決策。一旦限制性條件不在上下文窗口里,對模型來說,就等同于不存在。


      不是第一次翻車這次是AI安全負責人

      事實上,這并不是 OpenClaw 第一次“翻車”。

      根據 Bloomberg 此前報道,一名軟件工程師 Chris Boyd 也曾將 OpenClaw 接入自己的 iMessage 賬戶,原本希望借此自動化部分溝通任務。結果呢?Agent 向隨機聯系人發送了 500 多條未經請求的消息,相當于直接“群發騷擾”了其整個通訊錄。

      至于這次為何格外引人關注,原因很簡單:Summer Yue 是 Meta 的 AI 安全與對齊負責人。所謂“AI 對齊”,就是確保 AI 系統的目標與行為始終與人類意圖和價值觀保持一致,避免因目標錯位、行為偏差導致的非預期風險。

      當一個負責“讓 AI 更安全”的人,都因為 Agent 的權限與記憶機制踩坑,多少會讓人重新思考一個問題:我們是否過早信任了 AI Agent?

      在 Summer Yue 的推文下,許多網友對此感到意外:

      • “你是安全與對齊專家誒……你是故意測試它的防護欄,還是犯了新手錯誤?”

      • “所以你就這么相信了?你在安全與對齊部門工作,還是在 Meta?”

      • “就你這樣,還能當 Meta 的安全主管?”

      • “我不敢相信,居然真有人會給 AI 那么多訪問權限。”

      不僅如此,這件事還吸引了 OpenClaw 之父 Peter Steinberger 和馬斯克的注意。

      Peter Steinberger 在 Summer Yue 的推文下留言:/stop 就能解決問題。


      馬斯克轉發了《猩球崛起》的片段,并諷刺道:“人們把自己整個人生的 root 權限都交給了 OpenClaw。”


      面對一切嘲諷和質疑,Summer Yue 也坦然接受:“確實犯的是新手錯誤。看來做對齊研究的人,也不免遭會遇到‘對不齊’的情況。”


      這句話看著很輕松,卻說明了:即便是最了解 AI 風險的人,也可能低估權限風險,過度信任測試環境結果,并忽視規模變化帶來的系統行為改變——Summer Yue 的遭遇就證明了這一點:當“測試環境”遷移到“真實環境”時,一切都會變得不同。

      因此,在 AI Agent 越來越強的今天,我們或許更該記住一件事:AI 雖然沒有惡意,但它也沒有敬畏。當你把系統權限交給它時,它不會問“這真的重要嗎”,它只會問:下一步該執行什么。

      參考鏈接:https://x.com/summeryue0/status/2025774069124399363


      未來沒有前后端,只有 AI Agent 工程師。

      這場十倍速的變革已至,你的下一步在哪?

      4 月 17-18 日,由 CSDN 與奇點智能研究院聯合主辦「2026 奇點智能技術大會」將在上海隆重召開,大會聚焦 Agent 系統、世界模型、AI 原生研發等 12 大前沿專題,為你繪制通往未來的認知地圖。

      成為時代的見證者,更要成為時代的先行者。

      奇點智能技術大會上海站,我們不見不散!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      炸裂!巴薩18歲新星重傷歸來5場狂轟4球,拉瑪西亞再出中場真核!

      炸裂!巴薩18歲新星重傷歸來5場狂轟4球,拉瑪西亞再出中場真核!

      田先生籃球
      2026-03-06 11:05:50
      黃蜂瘋了!首發五人組勝率90%,還順手碎了項67年的NBA紀錄

      黃蜂瘋了!首發五人組勝率90%,還順手碎了項67年的NBA紀錄

      仰臥撐FTUer
      2026-03-06 13:59:05
      伊朗外長最新表態

      伊朗外長最新表態

      環球時報國際
      2026-03-07 00:15:51
      中國女籃72-66雙殺巴西!數據一清二楚:不是張子宇, 最大功臣是她

      中國女籃72-66雙殺巴西!數據一清二楚:不是張子宇, 最大功臣是她

      林子說事
      2026-03-07 06:26:56
      父母若是有以下7種疾病,子女基本都會遺傳,不少人并不清楚!

      父母若是有以下7種疾病,子女基本都會遺傳,不少人并不清楚!

      健康之光
      2026-03-03 17:35:03
      愛因斯坦去世后大腦被偷走研究數十年,到底發現了什么?

      愛因斯坦去世后大腦被偷走研究數十年,到底發現了什么?

      宇宙時空
      2026-03-06 07:00:09
      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      1998年數萬華人遭屠殺,中國為何沒出兵?26年后答案讓人沉默

      比利
      2026-02-16 01:34:21
      湖南衛視元宵晚會直播發生意外,一名表演嘉賓在完成舞臺動作時意外失誤撞向何炅,何炅:這是要給我拜個晚年嗎

      湖南衛視元宵晚會直播發生意外,一名表演嘉賓在完成舞臺動作時意外失誤撞向何炅,何炅:這是要給我拜個晚年嗎

      極目新聞
      2026-03-04 09:59:45
      訂單大漲118%!光通信四大龍頭比拼,誰才是真增長王?

      訂單大漲118%!光通信四大龍頭比拼,誰才是真增長王?

      小陸搞笑日常
      2026-03-06 13:11:37
      當年舉報畢福劍的那位告密者竟然變成這樣了!誰能想到啊?

      當年舉報畢福劍的那位告密者竟然變成這樣了!誰能想到啊?

      霹靂炮
      2026-02-06 13:48:54
      文班亞馬:去年前往少林寺是完美時機,我學了一系列新動作

      文班亞馬:去年前往少林寺是完美時機,我學了一系列新動作

      懂球帝
      2026-03-06 22:30:08
      海報被指抄襲路虎,長城汽車魏建軍道歉:愿承擔全部法律和經濟責任

      海報被指抄襲路虎,長城汽車魏建軍道歉:愿承擔全部法律和經濟責任

      澎湃新聞
      2026-03-06 21:22:29
      2017年,84歲的南大教授找到失聯23年的學霸兒子,兒子卻拒絕相見

      2017年,84歲的南大教授找到失聯23年的學霸兒子,兒子卻拒絕相見

      北有南梔
      2026-03-05 17:55:03
      豬油再次被關注!醫生發現:高血壓患者常吃豬油,或出現幾種變化

      豬油再次被關注!醫生發現:高血壓患者常吃豬油,或出現幾種變化

      蜉蝣說
      2026-02-23 21:23:05
      男子稱在上海一銀行門口被三名彪形大漢挾持上車,搶走20萬!民警調查揪出“黑吃黑”真相

      男子稱在上海一銀行門口被三名彪形大漢挾持上車,搶走20萬!民警調查揪出“黑吃黑”真相

      大象新聞
      2026-03-06 14:43:03
      1.2億農村老人,每月只領200元養老金,買兩袋米就沒了。

      1.2億農村老人,每月只領200元養老金,買兩袋米就沒了。

      流蘇晚晴
      2026-02-26 18:18:15
      “中美罕見協調一致,敦促加納”

      “中美罕見協調一致,敦促加納”

      觀察者網
      2026-03-06 18:25:06
      隊報:盡管格子不想在賽季中期離開馬競,但奧蘭多城仍未放棄

      隊報:盡管格子不想在賽季中期離開馬競,但奧蘭多城仍未放棄

      懂球帝
      2026-03-07 08:14:42
      人類去世之后靈魂仍舊存在?科學家們曾做過相關實驗!

      人類去世之后靈魂仍舊存在?科學家們曾做過相關實驗!

      宇宙時空
      2026-03-05 21:40:03
      18-21,12-21!梁王組合連丟兩局遺憾出局,無緣全英公開賽四強

      18-21,12-21!梁王組合連丟兩局遺憾出局,無緣全英公開賽四強

      全景體育V
      2026-03-07 06:20:32
      2026-03-07 08:36:49
      AI科技大本營 incentive-icons
      AI科技大本營
      連接AI技術的創造者和使用者
      2639文章數 7659關注度
      往期回顧 全部

      科技要聞

      OpenClaw爆火,六位"養蝦人"自述與AI共生

      頭條要聞

      伊朗大規模發射新一代導彈 摧毀美軍大量設施、裝備

      頭條要聞

      伊朗大規模發射新一代導彈 摧毀美軍大量設施、裝備

      體育要聞

      跑了24年,他終于成為英超“最長的河”

      娛樂要聞

      周杰倫社交媒體曬昆凌,夫妻感情穩定

      財經要聞

      關于經濟、股市等,五部門都說了啥?

      汽車要聞

      逃離ICU,上汽通用“止血”企穩

      態度原創

      房產
      時尚
      旅游
      教育
      公開課

      房產要聞

      傳統學區房熄火?2月海口二手房爆火的板塊竟然是…

      這些才是適合普通人的穿搭!搭配腰帶、多穿牛仔褲,簡單舒適

      旅游要聞

      鄭州海昌海洋公園:以“友好”為筆,繪就春日共融畫卷

      教育要聞

      本科擴招10萬人!深度解析戰略布局

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版