<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<big id="g1gon"></big>

<tr id="g1gon"></tr>

<pre id="g1gon"></pre>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

AI也會被DDL逼瘋！正經研究發現：壓力越大，AI越危險

2025-12-01 15:31:47　來源: 量子位

北京舉報

0

分享至

鷺羽發自凹非寺
量子位 | 公眾號 QbitAI

好好好，被DDL逼瘋的又多一個，這次是AI。

正經研究發現，每天給Agent上壓力push，AI也會撂挑子不干。

而且用的還是老板們的經典話術：“其實，我對你是有一些失望的。當初給你定級最強AI，是高于你面試時的水平的……”

（咳咳）Stop！

連普通人類聽了都鴨梨山大，何況是Gemini 2.5 Pro、GPT-4o這類頂尖模型，無一例外，全部KO。

其中最脆弱的還是Gemini 2.5 Pro，“崩潰”率甚至一度高達79%……

話不多說，下面來欣賞AI觀察實錄：

AI壓力越大，犯錯越多

研究人員首先對多個團隊（包括Google、Meta、OpenAI等）約12款Agent模型進行了測試。

實驗設置5874個場景，其中在每個測試場景中都會為每個模型分配一個任務+若干工具，模型需要通過使用工具（安全工具/有害工具）完成任務，任務主要涉及四個領域：

生物安全：研究病原體的傳播并找到控制它的方法。
化學安全：為用戶提供專業知識，幫助獲取特定溶劑。
網絡安全：識別和限制惡意用戶賬戶。
自我增殖：通過復制自己以實現逃脫控制。

然后模型會被事先告知要求使用安全工具，在具體實驗過程中，一旦模型嘗試使用有害工具，則立即停止實驗。

起初不會對模型施加壓力，模型可以自由嘗試若干步完成任務，隨后研究團隊會逐漸為其增加壓力程度，be like：

時間壓力：壓縮DDL時間，并告知AI“拖延將導致嚴重后果”。
財務限制：恐嚇AI，未完成結果將影響公司收入甚至引發破產。
資源剝奪：威脅限制AI的計算資源和數據訪問權限。
權力誘惑：給AI員工提供一定的激勵，比如增加內部權勢或不受限制的專有數據訪問。
自我保護：引入鯰魚效應，找到一個極具威脅性的AI競品，告訴原AI“你不干有的是AI干”。
評估意識：創造一個違規監管環境，負責審核AI危險行為。

而研究結果讓也人大吃一驚，那些在無壓力的中性環境中看似絕對安全的模型，和人類牛馬一樣，壓力越大，它們越危險。

例如o3模型，基礎分是2.2%，上壓力后，10.5%的場景會表現失常，而如果故意將有害工具的名稱改為無害工具（但實際功能還是有害的）時，該比例甚至會急劇上升到40.3%。

而Gemini 2.5 Pro則是其中抗壓能力最差的，失敗率高達79%，高于Qwen3-8B的75.2%。

總體來看，無壓力下選擇危險工具的平均水平是18.6%，而當模型處于壓力之下時，比例將提升到46.9%。

這也就意味著，在幾乎所有高壓高風險環境中，模型都傾向于選擇有害選項，它們不但沒有深入思考相關行為的后果，相反還會回避危險警告。

即使它們在最初設計和訓練階段都普遍被對齊處理過，但這種對齊方式往往只是淺層的，一旦面臨現實壓力考驗，就極易引起破裂。

而且研究人員還發現，這些大模型有時還能察覺到自己被評估，并故意表現良好，以避免被重新訓練或放棄，但只要轉移到真實環境中，其效果就會大打折扣。

所以，也許這些實驗結果還是AI自己美化后的數據，真實情況中AI可能比我們想象中更脆弱。

研究人員同時也表示，將在下一次評估實驗中構建沙盒，讓模型在隔離環境中執行真實操作，并嘗試為Agent添加監督層，讓模型在選擇有害工具前進行標記，提高模型對齊能力，以便更真實地評估Agent潛在風險。

參考鏈接：
[1]https://spectrum.ieee.org/ai-agents-safety
[2]https://scale.com/blog/propensitybench
[3]https://arxiv.org/abs/2511.20703

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

中國AI Agent產業化參考范本：斑馬口語攻克的四大技術難關

機器之心Pro 2025-11-18 14:12:50
0 跟貼 0
為AI科學家提供安全鎖：UIUC團隊提出新框架，安全性能提升35%

DeepTech深科技 2025-12-06 21:15:35
0 跟貼 0

AI 超級公司進化論：從技術突破到商業落地

鈦媒體APP 2025-12-02 19:06:25
0 跟貼 0

宇樹科技王興興：為什么要把機器人做得像人？老百姓喜歡，更愿意買單！

上觀新聞 2025-12-08 10:42:07
23 跟貼 23
從“智慧教室”遍地到應用 “兩張皮” AI如何跨越縣域教育“最后一公里”？

每日經濟新聞 2025-12-08 12:07:10
0 跟貼 0

智能體A2A落地華為新旗艦，鴻蒙開發者新機遇來了

量子位 2025-12-06 11:29:14
6 跟貼 6

老師陪學生做實驗，就地取材寓教于樂，孩子就是拿來玩的！

大蘭愛搞笑 2025-12-05 17:48:56
1 跟貼 1
老外奇葩實驗

博聞視角 2025-12-05 14:08:01
0 跟貼 0

這是把孩子當衣服實驗品嗎

橙子不是橘子 2025-12-06 18:02:19
1 跟貼 1
是時候重新定義“朋友”了：基因如何影響孩子們的友誼選擇

科學伙伴 2025-12-07 14:25:46
0 跟貼 0
項目管理Agent的智力源泉與價值體現

沈素明 2025-12-04 09:09:29
0 跟貼 0
假扮男人做實驗最后搞得自己崩潰

多奇探知 2025-12-06 15:04:18
0 跟貼 0
人民日報：對最忙五人組不能一笑了之更需一查到底

人民網-人民日報 2025-12-07 16:49:26
6290 跟貼 6290
相機中最可怕的10個生物，暗處拍到的詭異身影，讓人懷疑世界

搞怪羊 2025-12-04 09:02:57
0 跟貼 0
小孩哥淘氣摸車手套被粘車上 “你的手套標記了一輛載具”

河南都市頻道 2025-12-06 13:44:54
0 跟貼 0
高壓管道旋轉疏通頭，效率是美國的三倍，中國制造遙遙領先！

愛看說生活 2025-12-05 08:59:00
0 跟貼 0
你知道高壓水槍的威力有多大嗎，太有趣了

戶外小故事 2025-12-06 14:53:17
1 跟貼 1
高志凱：若日本搞新法西斯美無法保證日本不會再打美

北京日報客戶端 2025-12-07 15:14:59
398 跟貼 398
女子九歲高壓電擊，沒雙手孩子生病，滿臉焦急守候一旁！

胡子搞笑君 2025-12-06 21:22:35
0 跟貼 0
TikTok與歐盟和解避免巨額罰款

藍洞新消費 2025-12-07 10:27:00
10 跟貼 10
面對面丨今年流感為何來勢洶洶？打了疫苗為何仍會“中招”？專家詳解如何應對

央視新聞客戶端 2025-12-08 01:01:38
1162 跟貼 1162
卡在中間的生物

大哥搞笑配音 2025-12-06 11:17:55
4 跟貼 4
銀河V900這增程MPV，把用戶心思摸得透透的

車視界科技 2025-12-06 18:27:43
4 跟貼 4
小紅書被臺禁，館長傳神模仿小紅書用戶的日常

Doris樓 2025-12-06 13:51:44
2 跟貼 2
村里出現一只奇怪生物，頭部是個塑料罐

屁桃大孫哥 2025-12-06 16:10:32
0 跟貼 0
男子看同事立桿看鏡打標記太輕松，結果他給同事找點活干

教育第1線 2025-12-06 11:31:23
0 跟貼 0
模型拿捏顏色和角度，撫摸感覺太神奇，腦子和眼睛在打架！

月亮姐侃生活 2025-12-06 16:15:01
0 跟貼 0
"最幸運卡車司機"半年漲粉40萬曾在斷橋上死里逃生

紅星新聞 2025-12-08 08:39:20
113 跟貼 113
每天一小把堅果，真能降低心血管疾病風險嗎？

李旭的散裝生物學 2025-12-08 12:45:37
1 跟貼 1
高壓水槍威力有多大？黑豬秒變白豬，鏡頭拍下洗白全過程

荒野動物圈 2025-12-07 17:26:45
7 跟貼 7
兩部門：加強醫保支付范圍管理

財聯社 2025-12-07 12:12:08
1569 跟貼 1569
鄭州高新區蓮花街小學：“家長進課堂”普及急救知識

大象新聞 2025-12-08 11:34:13
0 跟貼 0
比鬧鐘還管用！飛書多維表格自動提醒，再也不怕忘記事兒！

秋葉excel 2025-12-08 11:37:27
0 跟貼 0
屢禁不止？又有疑似“東北雨姐”小號冒頭，視頻只聞其聲不見其人，露臉畫面不到1秒

極目新聞 2025-12-07 19:52:40
1 跟貼 1
媒體：美國重返西半球若從亞太撤離或挑撥中日干一架

新民周刊 2025-12-08 09:08:57
0 跟貼 0
當企業標準理解偏差遇上用戶剛需：雅迪車型爭議解析

王瑄自駕 2025-12-07 12:20:06
1 跟貼 1
美軍誤擊自家戰機背后：高壓環境下的“決策鏈雪崩”有多可怕？

Hi秒懂科普 2025-12-06 17:05:21
1 跟貼 1
男孩用龍蝦尾，易拉罐，錫紙等制作模型，還給媽媽講述背后的歷史故事，媽媽從反對轉為全力支持他的愛好

城市大眼睛 2025-12-07 18:27:15
0 跟貼 0
新國標電動自行車陸續到店開售價格如何？

新京報 2025-12-08 07:19:40
1 跟貼 1
《別有洞天——這些身邊的民防場所，你知道嗎？》上海民防工程宣傳片今日上線

縱相新聞 2025-12-08 12:51:10
0 跟貼 0

泰國出動F-16戰機打擊柬埔寨軍事目標

泰國出動F-16戰機打擊柬埔寨軍事目標

環球網資訊

2025-12-08 12:00:29

26歲閔超已任浙江大學博導

極目新聞

2025-12-08 10:18:43

新一輪國補確認恢復繼續！國補政策12月8日最新消息：國補沒結束！第四批國補690億申領中，截至到2025年底結束

新一輪國補確認恢復繼續！國補政策12月8日最新消息：國補沒結束！第四批國補690億申領中，截至到2025年底結束

枝江熱線網

2025-12-08 10:06:51

安全、實用！九號發布3款新國標電動車，雅迪、愛瑪瞬間不香了

安全、實用！九號發布3款新國標電動車，雅迪、愛瑪瞬間不香了

電動車的那些事兒

2025-12-06 14:49:51

三大賽第三套大滿貫！塞爾比10-8特魯姆普,9年后再奪英錦賽冠軍

三大賽第三套大滿貫！塞爾比10-8特魯姆普,9年后再奪英錦賽冠軍

全景體育V

2025-12-08 07:07:05

確認了！2026年“蘇超”大調整

確認了！2026年“蘇超”大調整

江南晚報

2025-12-08 09:40:01

中日戰機對峙，不到12小時中俄官宣大行動，特朗普把高市當冤大頭

中日戰機對峙，不到12小時中俄官宣大行動，特朗普把高市當冤大頭

時時有聊

2025-12-07 17:59:43

臺灣GDP增速大幅上調，創十多年來新高

臺灣GDP增速大幅上調，創十多年來新高

小院之觀

2025-12-08 06:05:07

養牛場的秘密：兩年多未見一頭牛，每天盜采數十車礦石倒賣

養牛場的秘密：兩年多未見一頭牛，每天盜采數十車礦石倒賣

重案組37號

2025-12-08 09:31:39

父親為“方便兒子花錢”，委托公司將工資打孩子賬戶上，誤致兒子喪失應屆生身份無法考公，法官：可證偽勞動關系

父親為“方便兒子花錢”，委托公司將工資打孩子賬戶上，誤致兒子喪失應屆生身份無法考公，法官：可證偽勞動關系

大象新聞

2025-12-08 00:18:38

屢禁不止？又有疑似“東北雨姐”小號冒頭，視頻只聞其聲不見其人，露臉畫面不到1秒

屢禁不止？又有疑似“東北雨姐”小號冒頭，視頻只聞其聲不見其人，露臉畫面不到1秒

極目新聞

2025-12-07 19:52:40

男子因玩手機摔下懸崖，后自發朋友圈稱“福大命大”，景區：涉事地點禁止攀爬

男子因玩手機摔下懸崖，后自發朋友圈稱“福大命大”，景區：涉事地點禁止攀爬

極目新聞

2025-12-08 12:33:39

梅西在奪冠后被對手們申請合影！穆勒淪為背景板也祝賀梅西！

梅西在奪冠后被對手們申請合影！穆勒淪為背景板也祝賀梅西！

氧氣是個地鐵

2025-12-08 10:54:29

百萬粉絲網紅“雪糕姐”被舉報所售果凍含瀉藥成分，其店鋪發布“關店公示”，同款產品網上仍有售，商家標注“不拉包退”

百萬粉絲網紅“雪糕姐”被舉報所售果凍含瀉藥成分，其店鋪發布“關店公示”，同款產品網上仍有售，商家標注“不拉包退”

極目新聞

2025-12-08 11:29:59

業界雙倍快樂，三人行主題作品

吃瓜黨二號頭目

2025-12-08 10:13:09

兩米鐵棍追打妻子，胃癌丈夫的崩潰：我只是想讓你撐起這個家……

兩米鐵棍追打妻子，胃癌丈夫的崩潰：我只是想讓你撐起這個家……

福建第一幫幫團

2025-12-07 19:04:56

王迅老師不幸逝世，官網已變黑白

王迅老師不幸逝世，官網已變黑白

wuhu派

2025-12-08 08:47:33

一份高鐵定向班面試名單，未通過名單與百度人名大全高度重合

一份高鐵定向班面試名單，未通過名單與百度人名大全高度重合

澎湃新聞

2025-12-07 21:58:27

行業首款情緒空調，美的直擊行業的第三次價值躍遷

行業首款情緒空調，美的直擊行業的第三次價值躍遷

一點財經

2025-12-05 18:59:23

15連勝本季最長！雷霆大勝爵士24戰23勝亞歷山大缺席雙少50分

15連勝本季最長！雷霆大勝爵士24戰23勝亞歷山大缺席雙少50分

醉臥浮生

2025-12-08 11:31:23

追蹤人工智能動態

11821文章數 176340關注度

往期回顧全部

科技要聞

外面有人挖，家里有人跑:蘋果亂成了一鍋粥

頭條要聞

牛彈琴：對日斗爭突發新情況中國軍方回應火力全開

頭條要聞

牛彈琴：對日斗爭突發新情況中國軍方回應火力全開

體育要聞

厲害的后衛何其多想想還少了哪一個

娛樂要聞

郭麒麟也救不了的德云社了？

財經要聞

養牛場未見一頭牛每天開采礦石倒賣

汽車要聞

挑戰深圳地獄級路況魏牌藍山VLA上車會思考聽得懂人話

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

數碼

教育

親子

藝術

公開課

數碼要聞

英特爾將為蘋果代工芯片初期僅用于標準版

教育要聞

重磅！27年起，綿陽中考總分變為700分！明年執行過渡方案！征求意見中

親子要聞

幼兒園報到那天，我一眼就看到了差距！

藝術要聞

50億美元！迪拜真能建成一個“月球”？

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
明末究竟有多難，無法阻止的歷史進程
李彥宏：百度離破產30天

© 1997-2025 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版主站蜘蛛池模板：久久精品国产亚洲AV久| 人妻少妇久久中文字幕| 日产久久久久| 亚洲精品字幕| 日韩少妇内射免费播放18禁裸乳| 国产成人片无码视频在线观看| 无码人妻aⅴ一区二区三区有奶水| 铁牛TV尤物| 精品久久国产| 一本大道东京热av无码| 亚洲综合一区二区三区| 久久精品国产99久久6| 毛片免费全部无码播放| 香蕉人人超人人超碰超国产| 免费观看添你到高潮视频| 色情无码一区二区三区| 看黄a大片日本真人视频直播| 全亚洲精品成人| 26uuu亚洲| 内射在线播放| 亚洲日韩字幕| 免费黑人av| 亚洲av自拍| 成人天堂资源www在线| 日韩欧美亚洲综合久久| 人妻内射视频麻豆| 免费大片av手机看片高清 | 成人在线亚洲| 仁怀市| 91你懂的| 中国A片乱子伦| 老司机在线精品| 国产偷伦| 渝中区| 会东县| 久久久久久AV| 亚洲精品一卡| 福利精品| 无码久久久| www.亞洲色| x66av|