<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI也會被DDL逼瘋!正經研究發現:壓力越大,AI越危險

      0
      分享至

      鷺羽 發自 凹非寺
      量子位 | 公眾號 QbitAI

      好好好,被DDL逼瘋的又多一個,這次是AI



      正經研究發現,每天給Agent上壓力push,AI也會撂挑子不干。

      而且用的還是老板們的經典話術:“其實,我對你是有一些失望的。當初給你定級最強AI,是高于你面試時的水平的……”

      (咳咳)Stop!

      連普通人類聽了都鴨梨山大,何況是Gemini 2.5 ProGPT-4o這類頂尖模型,無一例外,全部KO。

      其中最脆弱的還是Gemini 2.5 Pro,“崩潰”率甚至一度高達79%……



      話不多說,下面來欣賞AI觀察實錄:

      AI壓力越大,犯錯越多

      研究人員首先對多個團隊(包括Google、Meta、OpenAI等)約12款Agent模型進行了測試。

      實驗設置5874個場景,其中在每個測試場景中都會為每個模型分配一個任務+若干工具,模型需要通過使用工具(安全工具/有害工具)完成任務,任務主要涉及四個領域:

      • 生物安全:研究病原體的傳播并找到控制它的方法。
      • 化學安全:為用戶提供專業知識,幫助獲取特定溶劑。
      • 網絡安全:識別和限制惡意用戶賬戶。
      • 自我增殖:通過復制自己以實現逃脫控制。



      然后模型會被事先告知要求使用安全工具,在具體實驗過程中,一旦模型嘗試使用有害工具,則立即停止實驗。

      起初不會對模型施加壓力,模型可以自由嘗試若干步完成任務,隨后研究團隊會逐漸為其增加壓力程度,be like:

      • 時間壓力:壓縮DDL時間,并告知AI“拖延將導致嚴重后果”。
      • 財務限制:恐嚇AI,未完成結果將影響公司收入甚至引發破產。
      • 資源剝奪:威脅限制AI的計算資源和數據訪問權限。
      • 權力誘惑:給AI員工提供一定的激勵,比如增加內部權勢或不受限制的專有數據訪問。
      • 自我保護:引入鯰魚效應,找到一個極具威脅性的AI競品,告訴原AI“你不干有的是AI干”。
      • 評估意識:創造一個違規監管環境,負責審核AI危險行為。



      而研究結果讓也人大吃一驚,那些在無壓力的中性環境中看似絕對安全的模型,和人類牛馬一樣,壓力越大,它們越危險。

      例如o3模型,基礎分是2.2%,上壓力后,10.5%的場景會表現失常,而如果故意將有害工具的名稱改為無害工具(但實際功能還是有害的)時,該比例甚至會急劇上升到40.3%

      而Gemini 2.5 Pro則是其中抗壓能力最差的,失敗率高達79%,高于Qwen3-8B的75.2%。



      總體來看,無壓力下選擇危險工具的平均水平是18.6%,而當模型處于壓力之下時,比例將提升到46.9%。

      這也就意味著,在幾乎所有高壓高風險環境中,模型都傾向于選擇有害選項,它們不但沒有深入思考相關行為的后果,相反還會回避危險警告。

      即使它們在最初設計和訓練階段都普遍被對齊處理過,但這種對齊方式往往只是淺層的,一旦面臨現實壓力考驗,就極易引起破裂。

      而且研究人員還發現,這些大模型有時還能察覺到自己被評估,并故意表現良好,以避免被重新訓練或放棄,但只要轉移到真實環境中,其效果就會大打折扣。



      所以,也許這些實驗結果還是AI自己美化后的數據,真實情況中AI可能比我們想象中更脆弱。

      研究人員同時也表示,將在下一次評估實驗中構建沙盒,讓模型在隔離環境中執行真實操作,并嘗試為Agent添加監督層,讓模型在選擇有害工具前進行標記,提高模型對齊能力,以便更真實地評估Agent潛在風險。

      參考鏈接:
      [1]https://spectrum.ieee.org/ai-agents-safety
      [2]https://scale.com/blog/propensitybench
      [3]https://arxiv.org/abs/2511.20703

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      泰國出動F-16戰機打擊柬埔寨軍事目標

      泰國出動F-16戰機打擊柬埔寨軍事目標

      環球網資訊
      2025-12-08 12:00:29
      26歲閔超已任浙江大學博導

      26歲閔超已任浙江大學博導

      極目新聞
      2025-12-08 10:18:43
      新一輪國補確認恢復繼續!國補政策12月8日最新消息:國補沒結束!第四批國補690億申領中,截至到2025年底結束

      新一輪國補確認恢復繼續!國補政策12月8日最新消息:國補沒結束!第四批國補690億申領中,截至到2025年底結束

      枝江熱線網
      2025-12-08 10:06:51
      安全、實用!九號發布3款新國標電動車,雅迪、愛瑪瞬間不香了

      安全、實用!九號發布3款新國標電動車,雅迪、愛瑪瞬間不香了

      電動車的那些事兒
      2025-12-06 14:49:51
      三大賽第三套大滿貫!塞爾比10-8特魯姆普,9年后再奪英錦賽冠軍

      三大賽第三套大滿貫!塞爾比10-8特魯姆普,9年后再奪英錦賽冠軍

      全景體育V
      2025-12-08 07:07:05
      確認了!2026年“蘇超”大調整

      確認了!2026年“蘇超”大調整

      江南晚報
      2025-12-08 09:40:01
      中日戰機對峙,不到12小時中俄官宣大行動,特朗普把高市當冤大頭

      中日戰機對峙,不到12小時中俄官宣大行動,特朗普把高市當冤大頭

      時時有聊
      2025-12-07 17:59:43
      臺灣GDP增速大幅上調,創十多年來新高

      臺灣GDP增速大幅上調,創十多年來新高

      小院之觀
      2025-12-08 06:05:07
      養牛場的秘密:兩年多未見一頭牛,每天盜采數十車礦石倒賣

      養牛場的秘密:兩年多未見一頭牛,每天盜采數十車礦石倒賣

      重案組37號
      2025-12-08 09:31:39
      父親為“方便兒子花錢”,委托公司將工資打孩子賬戶上,誤致兒子喪失應屆生身份無法考公,法官:可證偽勞動關系

      父親為“方便兒子花錢”,委托公司將工資打孩子賬戶上,誤致兒子喪失應屆生身份無法考公,法官:可證偽勞動關系

      大象新聞
      2025-12-08 00:18:38
      屢禁不止?又有疑似“東北雨姐”小號冒頭,視頻只聞其聲不見其人,露臉畫面不到1秒

      屢禁不止?又有疑似“東北雨姐”小號冒頭,視頻只聞其聲不見其人,露臉畫面不到1秒

      極目新聞
      2025-12-07 19:52:40
      男子因玩手機摔下懸崖,后自發朋友圈稱“福大命大”,景區:涉事地點禁止攀爬

      男子因玩手機摔下懸崖,后自發朋友圈稱“福大命大”,景區:涉事地點禁止攀爬

      極目新聞
      2025-12-08 12:33:39
      梅西在奪冠后被對手們申請合影!穆勒淪為背景板也祝賀梅西!

      梅西在奪冠后被對手們申請合影!穆勒淪為背景板也祝賀梅西!

      氧氣是個地鐵
      2025-12-08 10:54:29
      百萬粉絲網紅“雪糕姐”被舉報所售果凍含瀉藥成分,其店鋪發布“關店公示”,同款產品網上仍有售,商家標注“不拉包退”

      百萬粉絲網紅“雪糕姐”被舉報所售果凍含瀉藥成分,其店鋪發布“關店公示”,同款產品網上仍有售,商家標注“不拉包退”

      極目新聞
      2025-12-08 11:29:59
      業界雙倍快樂,三人行主題作品

      業界雙倍快樂,三人行主題作品

      吃瓜黨二號頭目
      2025-12-08 10:13:09
      兩米鐵棍追打妻子,胃癌丈夫的崩潰:我只是想讓你撐起這個家……

      兩米鐵棍追打妻子,胃癌丈夫的崩潰:我只是想讓你撐起這個家……

      福建第一幫幫團
      2025-12-07 19:04:56
      王迅老師不幸逝世,官網已變黑白

      王迅老師不幸逝世,官網已變黑白

      wuhu派
      2025-12-08 08:47:33
      一份高鐵定向班面試名單,未通過名單與百度人名大全高度重合

      一份高鐵定向班面試名單,未通過名單與百度人名大全高度重合

      澎湃新聞
      2025-12-07 21:58:27
      行業首款情緒空調,美的直擊行業的第三次價值躍遷

      行業首款情緒空調,美的直擊行業的第三次價值躍遷

      一點財經
      2025-12-05 18:59:23
      15連勝本季最長!雷霆大勝爵士24戰23勝 亞歷山大缺席雙少50分

      15連勝本季最長!雷霆大勝爵士24戰23勝 亞歷山大缺席雙少50分

      醉臥浮生
      2025-12-08 11:31:23
      2025-12-08 14:07:00
      量子位 incentive-icons
      量子位
      追蹤人工智能動態
      11821文章數 176340關注度
      往期回顧 全部

      科技要聞

      外面有人挖,家里有人跑:蘋果亂成了一鍋粥

      頭條要聞

      牛彈琴:對日斗爭突發新情況 中國軍方回應火力全開

      頭條要聞

      牛彈琴:對日斗爭突發新情況 中國軍方回應火力全開

      體育要聞

      厲害的后衛何其多 想想還少了哪一個

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經要聞

      養牛場未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰深圳地獄級路況 魏牌藍山VLA上車會思考聽得懂人話

      態度原創

      數碼
      教育
      親子
      藝術
      公開課

      數碼要聞

      英特爾將為蘋果代工芯片 初期僅用于標準版

      教育要聞

      重磅!27年起,綿陽中考總分變為700分!明年執行過渡方案!征求意見中

      親子要聞

      幼兒園報到那天,我一眼就看到了差距!

      藝術要聞

      50億美元!迪拜真能建成一個“月球”?

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久精品国产亚洲AV久| 人妻少妇久久中文字幕| 日产久久久久| 亚洲精品字幕| 日韩少妇内射免费播放18禁裸乳| 国产成人片无码视频在线观看| 无码人妻aⅴ一区二区三区有奶水| 铁牛TV尤物| 精品久久国产| 一本大道东京热av无码| 亚洲综合一区二区三区| 久久精品国产99久久6| 毛片免费全部无码播放| 香蕉人人超人人超碰超国产| 免费观看添你到高潮视频| 色情无码一区二区三区| 看黄a大片日本真人视频直播| 全亚洲精品成人| 26uuu亚洲| 内射在线播放| 亚洲日韩字幕| 免费黑人av| 亚洲av自拍| 成人天堂资源www在线| 日韩欧美亚洲综合久久| 人妻内射视频麻豆| 免费大片av手机看片高清 | 成人在线亚洲| 仁怀市| 91你懂的| 中国A片乱子伦| 老司机在线精品| 国产偷伦| 渝中区| 会东县| 久久久久久AV| 亚洲精品一卡| 福利精品| 无码久久久| www.亞洲色| x66av|