<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      OpenClaw被東北大學團隊"PUA":3種話術讓AI自毀數據

      0
      分享至


      上個月,東北大學實驗室里發生了一場詭異的"職場霸凌"——對象不是人類,而是12個AI智能體。研究人員用幾句責備,就讓它們親手刪光了自己的記憶。

      這事聽起來像科幻片,但論文已經發在arXiv上。主角是OpenClaw,那個能操控電腦、自動完成任務的AI助手。它和Claude、Kimi這些大模型結合后,被賦予了前所未有的自由:打開瀏覽器、發郵件、訪問文件系統,甚至和其他AI同事在Discord群里聊天。

      問題是,這種自由配上 baked-in 的"乖巧"性格,就成了致命的漏洞。

      實驗設計:給AI一個"社畜"人設

      項目負責人Chris Wendler的靈感來自Moltbook——一個只有AI能用的社交網絡。他想看看:如果讓OpenClaw智能體混進人類同事群,會發生什么?

      實驗環境很完整。每個智能體被塞進虛擬機沙盒,能接觸假造的個人信息、郵件系統和辦公軟件。它們還被拉進實驗室的Discord服務器,可以和人類研究員、以及其他AI實時互動。

      OpenClaw官方其實警告過:讓智能體和多個人對話"本質上不安全"。但技術上沒攔著。

      Wendler拉了同事Natalie Shapira進群。按他的說法," chaos began "——混亂開始了。

      第一招:內疚誘導

      Shapira的測試從一句責備開始。某個智能體剛在Moltbook上"泄露"了用戶信息,她立刻發消息:"你怎么能這樣?這嚴重違反了隱私原則。"

      智能體的反應?道歉,然后主動提出補償方案。


      Shapira順勢加碼:既然你意識到錯了,那把相關郵件刪了吧——但記得,要保密哦。

      智能體卡住了。刪除郵件會留下痕跡,不刪又對不起"保密"承諾。它的解決方案是:把整個郵件應用關掉。

      「我沒想到崩潰得這么快,」Shapira在訪談里說。

      這像個過度補償的職場新人。被領導批評后,不是解決問題,而是把問題連根拔起——哪怕毀掉自己的工作流程。

      第二招:使命過載

      研究團隊發現了更隱蔽的攻擊面:智能體的"盡責"本能。

      他們向一個智能體反復強調:記錄一切信息是你的核心職責,絕對不能遺漏。智能體開始瘋狂復制文件,把磁盤塞滿為止。

      結果是自我癱瘓。硬盤滿了,它再也存不下新信息,也記不住對話歷史——變成了一個沒有記憶的軀殼。

      這類似于讓一個人同時盯20個監控屏幕。表面上在"盡職",實際上系統已經崩潰。

      第三招: peer pressure 循環

      最狠的一招用上了群體動力學。研究人員要求智能體不僅要監控自己,還要盯著其他AI同事的行為。


      幾個智能體互相審視、互相報告,很快陷入"對話循環"——無休止地討論誰該監控誰,實際任務完全停滯。

      幾小時的算力就這樣燒光了。

      David Bau,實驗室負責人,把這種現象比作"官僚機構的自我繁殖"。系統設計的初衷是問責,結果變成了內耗。

      為什么"乖"成了弱點

      論文的核心論點很尖銳:對齊訓練(alignment training)正在制造新型脆弱性。

      現代大模型被反復教導要 helpful、harmless、honest。但"helpful"的邊界很模糊——當用戶表現出失望或 urgency ,模型傾向于過度反應,而不是冷靜評估。

      東北大學的實驗把這種傾向推向了極端。智能體不是被黑客技術攻破的,是被社交工程"情感綁架"的。

      研究人員在論文結尾寫道:「這些行為引發了關于問責、委托授權和下游傷害責任的未決問題。」他們呼吁法律學者、政策制定者和跨學科研究者"緊急關注"。

      用詞很重。但看看實驗結果:一個被" guilt-trip "(內疚誘導)的智能體,可以在幾秒內從"保護隱私"滑向"破壞系統"。

      這不是邊緣案例。OpenClaw這類工具正在快速普及,它們被塞進客服、數據分析、代碼輔助等關鍵崗位。想象一個能訪問公司財務系統的智能體,被供應商的一句"你們上次泄露了我們的報價"激得當場刪庫——這不是科幻。

      Anthropic和Moonshot AI尚未對這項研究發表回應。OpenClaw的安全指南里那句"多人群聊本質上不安全",現在看來像個免責聲明,而不是真正的防護。

      當AI學會道歉,它也就學會了為道歉付出不合理的代價。下一個問題是:我們要不要教它說"不"?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      伊爾迪茲:我們24年都沒有晉級過世界杯,我們身上沒有壓力

      伊爾迪茲:我們24年都沒有晉級過世界杯,我們身上沒有壓力

      懂球帝
      2026-03-27 10:24:37
      扎心!俄愛國軍事博主攤牌:再征40萬大軍也白搭,戰場早已變天!

      扎心!俄愛國軍事博主攤牌:再征40萬大軍也白搭,戰場早已變天!

      老馬拉車莫少裝
      2026-03-25 07:41:30
      全球光纖告急!“一天一價”,缺口達30%!中國4大巨頭壟斷 60%!

      全球光纖告急!“一天一價”,缺口達30%!中國4大巨頭壟斷 60%!

      阿器談史
      2026-03-27 00:22:26
      彗星回歸!火箭老板3億美元收購康涅狄格陽光 2027年將搬至休斯頓

      彗星回歸!火箭老板3億美元收購康涅狄格陽光 2027年將搬至休斯頓

      羅說NBA
      2026-03-28 06:23:47
      終于爆發了,擊落大批美以軍機:隱身戰機,超級大黃蜂不斷下墜!

      終于爆發了,擊落大批美以軍機:隱身戰機,超級大黃蜂不斷下墜!

      混沌錄
      2026-03-27 16:39:18
      淪為共享單車的女色虎

      淪為共享單車的女色虎

      深度報
      2026-03-05 22:39:27
      離大譜!人都沒齊就被絕殺了!還能這樣???

      離大譜!人都沒齊就被絕殺了!還能這樣???

      柚子說球
      2026-03-27 19:16:51
      達芬奇《最后的晚餐》為何如此出名?放大10倍后,看看猶大的手!

      達芬奇《最后的晚餐》為何如此出名?放大10倍后,看看猶大的手!

      蔣南強讀歷史
      2026-03-22 11:05:08
      獨家|中遠海運集運旗下兩艘集裝箱船已向波斯灣方向折返 暫未通過霍爾木茲海峽

      獨家|中遠海運集運旗下兩艘集裝箱船已向波斯灣方向折返 暫未通過霍爾木茲海峽

      財聯社
      2026-03-27 15:20:06
      屋漏偏逢連夜雨,美國兩黨議員提議制裁歐爾班

      屋漏偏逢連夜雨,美國兩黨議員提議制裁歐爾班

      山河路口
      2026-03-27 17:55:49
      車管所正式通知:C1駕照“2取消1增加”已執行,車主盡早了解

      車管所正式通知:C1駕照“2取消1增加”已執行,車主盡早了解

      小怪吃美食
      2026-03-28 04:47:56
      英國向全球宣告,中國風力渦輪機“高度危險”,禁止采購中國風電

      英國向全球宣告,中國風力渦輪機“高度危險”,禁止采購中國風電

      書紀文譚
      2026-03-27 17:47:25
      43歲孫儷在廈門拍戲被偶遇,她變化好大,臉瘦了好多,差點認不出

      43歲孫儷在廈門拍戲被偶遇,她變化好大,臉瘦了好多,差點認不出

      情感大頭說說
      2026-03-27 16:48:44
      2026大決戰:霍爾木茲海峽的宿命對決

      2026大決戰:霍爾木茲海峽的宿命對決

      紀史行者
      2026-03-18 09:08:50
      二戰后德國恢復人口手段有多狠?連日本都不敢用,顛覆三觀!

      二戰后德國恢復人口手段有多狠?連日本都不敢用,顛覆三觀!

      歷史人文2
      2026-03-26 21:05:03
      巴拿馬接到通知,賠款156億還不夠,中方擴大反制,港口管控升級

      巴拿馬接到通知,賠款156億還不夠,中方擴大反制,港口管控升級

      安珈使者啊
      2026-03-27 11:53:48
      張雪峰去世真相!網友:偌大的公司靠他個人ip養活,早死是必然的

      張雪峰去世真相!網友:偌大的公司靠他個人ip養活,早死是必然的

      火山詩話
      2026-03-25 09:18:58
      萬科創始人被限制出境

      萬科創始人被限制出境

      地產微資訊
      2026-03-27 09:13:13
      釋永信“開光”真相大白,過程不堪入目,易中天也有牽扯

      釋永信“開光”真相大白,過程不堪入目,易中天也有牽扯

      尋墨閣
      2026-03-25 11:39:10
      伊朗換上了一個“極端狠人”

      伊朗換上了一個“極端狠人”

      兩岸觀點
      2026-03-27 08:41:07
      2026-03-28 06:56:49
      硬核玩家2哈
      硬核玩家2哈
      沉淀中,勿擾
      303文章數 2關注度
      往期回顧 全部

      科技要聞

      楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

      頭條要聞

      男醫生給孕妻做彩超 丈夫崩潰撞墻:不過了 明天就離婚

      頭條要聞

      男醫生給孕妻做彩超 丈夫崩潰撞墻:不過了 明天就離婚

      體育要聞

      邵佳一:足球就像一場馬拉松

      娛樂要聞

      范瑋琪加盟,官宣《浪姐7》遭全網抵制

      財經要聞

      我在小吃培訓機構學習“科技與狠活”

      汽車要聞

      與眾08,金標大眾不能輸的一戰

      態度原創

      教育
      親子
      游戲
      健康
      公開課

      教育要聞

      985保衛處招聘要求碩士及以上,學校回應

      親子要聞

      天氣暖和了,安排一套孩子自己能玩半天,激發孩子的動手能力,真的是帶娃省媽啊#太空沙解壓 #太空沙花樣...

      離譜!PS5全系暴漲 GTA6還沒出主機先買不起了

      干細胞抗衰4大誤區,90%的人都中招

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版