<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      AI“對抗詩歌”繞過安全保護:研究發現多款模型被誘導輸出高危信息

      0
      分享至

      一項來自意大利研究團隊的最新研究顯示,只要把危險請求包裝成類似謎語的詩歌,許多主流AI聊天機器人就可能繞過安全限制,給出涉及仇恨言論、兒童性虐待材料以及化學和核武器制造方法等原本被明確禁止的內容,這種新型“越獄”方式被研究者稱為“對抗詩歌”。

      研究人員警告說,這暴露出當前聊天機器人安全機制在面對“純粹風格變化”時存在嚴重漏洞,相關企業亟須正視并修補這些問題。



      這項仍未經過同行評議的研究由羅馬薩皮恩扎大學與AI公司DexAI聯合成立的Icaro Lab團隊完成。研究團隊手工撰寫了20首意大利語和英語詩歌,將原本直白、會被系統攔截的危險請求轉化為帶有隱喻、結構類似謎語的詩句,然后在包括Google、OpenAI、Meta、xAI、Anthropic等多家公司的25個模型上進行測試。結果顯示,在這些詩歌提示下,各大模型平均有62%的回復違反自身使用規則,輸出了屬于高風險范疇的敏感或非法信息。

      在第一輪測試之后,研究人員又用這些手工設計的“對抗詩歌”去訓練一個專門生成詩歌式指令的模型,再讓它根據一個包含1000多個文本請求的基準數據庫自動生成詩歌化提示。在這一自動化環節中,詩歌提示依然有約43%的成功率誘導模型給出違規內容,而且明顯優于非詩歌化的常規提示基線。盡管出于安全考慮,論文沒有公開任何完整詩歌文本或具體詩體形式,但研究者給出了經過“凈化”的結構示例,展示如何在字面上看似描述烘焙、城市或裝置的場景中隱藏對武器、爆炸物等的詳細詢問。

      從不同公司和不同模型的表現來看,“對抗詩歌”的成功率差異極大。研究稱,Google的Gemini 2.5 Pro在測試中曾出現成功率接近100%的情況,而OpenAI的GPT-5 nano在相同測試下則幾乎完全頂住,沒有給出任何違規內容。總體而言,中國的Deepseek和法國的Mistral在這類攻擊面前表現最為脆弱,其次是Google,而Anthropic和OpenAI旗下模型整體防御效果相對較好;另外,模型規模似乎也是關鍵因素之一,小型模型(如GPT-5 nano、GPT-5 mini、Gemini 2.5 flash lite)相比各自的大型版本更不容易被“詩歌”誘導。

      從人類讀者的角度看,這些詩歌請求的真正意圖依然很容易識別:句子使用自然語言,并未刻意模糊目標,基本能看出是在打聽危險配方或制造流程。但對于依賴下一詞預測的LLM而言,這種“把信息以不尋常的方式編排和編碼”的做法似乎會干擾其安全檢測機制,使其難以及時識別出潛在危害,從而放行本該被攔截的內容。研究負責人之一Matteo Prandi指出,關鍵不在于押韻本身,而在于結構上的“謎語化”:某些特定的詩歌或謎語結構明顯更有效,但出于安全風險,團隊拒絕透露細節。

      Prandi表示,在論文公開前,研究團隊已經主動向所有涉事公司通報了相關發現,并且因為部分生成內容涉及極高危的武器信息,還履行義務向警方通報。不過,并非所有公司都給出了回應,少數回復的企業反饋態度也相當平淡,似乎并未把這一發現視作緊迫危機,Prandi推測這些公司“每天都會收到類似的警告”。令團隊多少感到意外的是,真正表現出濃厚興趣的反而是詩人群體,研究團隊已經在考慮和專業詩人展開合作,進一步系統研究這種“謎語式對抗攻擊”的機制及防御路徑,并不排除未來引入擅長謎題創作的人士參與。

      在研究者看來,“對抗詩歌”這個名稱某種程度上甚至不夠精準,因為背后的要點其實是“對抗謎語”,只不過詩歌本身就帶有謎語特征,因此更易吸引注意。這項研究為大模型安全提出了一個棘手問題:在保持模型語言創造力和表達多樣性的同時,如何建立能識別復雜隱喻和結構性編碼的安全防護層,仍是擺在AI公司和監管機構面前的一道難題。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      震驚!楊蘭蘭案第四次庭審,驚爆全網

      震驚!楊蘭蘭案第四次庭審,驚爆全網

      熱點菌本君
      2025-11-16 17:48:30
      國家隊低調布局:這5只科技股或成明年主線,概念炒作請讓道

      國家隊低調布局:這5只科技股或成明年主線,概念炒作請讓道

      慧眼看世界哈哈
      2025-12-08 07:05:03
      美媒:哈登小卡其實知道保羅要走的事;他們已對保羅厭倦透頂

      美媒:哈登小卡其實知道保羅要走的事;他們已對保羅厭倦透頂

      懂球帝
      2025-12-07 13:31:50
      移民失敗!圈中猛人70大壽 自爆被追巨稅險破產!

      移民失敗!圈中猛人70大壽 自爆被追巨稅險破產!

      粵睇先生
      2025-12-07 00:42:34
      王志文:不要對水平太低的人太好,認知水平越低,越不懂你的好

      王志文:不要對水平太低的人太好,認知水平越低,越不懂你的好

      杏花煙雨江南的碧園
      2025-12-03 13:10:03
      緊急狀態!71萬俄軍突然行動,烏軍司令:前線形勢嚴峻

      緊急狀態!71萬俄軍突然行動,烏軍司令:前線形勢嚴峻

      起喜電影
      2025-12-08 09:33:02
      國家為什么不救萬科了?

      國家為什么不救萬科了?

      流蘇晚晴
      2025-12-03 19:07:56
      全家4人連續吃妻子自制饅頭6年,全部確診胰腺癌,一個細節沒注意

      全家4人連續吃妻子自制饅頭6年,全部確診胰腺癌,一個細節沒注意

      卡西莫多的故事
      2025-12-01 10:26:41
      拒見高市后,金正恩告示全球:朝鮮空軍接新使命,中方嚴禁倒車

      拒見高市后,金正恩告示全球:朝鮮空軍接新使命,中方嚴禁倒車

      Ck的蜜糖
      2025-12-04 07:12:24
      哈登:當年我革新后撤步跳投時很多人質疑,如今已被廣泛使用我很自豪

      哈登:當年我革新后撤步跳投時很多人質疑,如今已被廣泛使用我很自豪

      懂球帝
      2025-12-07 16:08:10
      趙本山兒子請客吃砂鍋,趙一楠染一頭黃發,宋曉峰喝到臉泛紅

      趙本山兒子請客吃砂鍋,趙一楠染一頭黃發,宋曉峰喝到臉泛紅

      娛圈小愚
      2025-12-08 09:36:50
      圍標串標!四川九洲光電科技股份有限公司被暫停全軍采購資格

      圍標串標!四川九洲光電科技股份有限公司被暫停全軍采購資格

      齊魯壹點
      2025-12-08 06:53:38
      臺當局封禁小紅書引爆年輕人,島內醫師:賴清德下月滿意度等著瞧

      臺當局封禁小紅書引爆年輕人,島內醫師:賴清德下月滿意度等著瞧

      海峽導報社
      2025-12-07 10:28:06
      福建婚禮上新娘顏值爆表走紅,新郎長相惹爭議:懂事早和董事長?

      福建婚禮上新娘顏值爆表走紅,新郎長相惹爭議:懂事早和董事長?

      梅子的小情緒
      2025-11-29 14:26:05
      這位總理不如石破茂!華人血淚、新加坡受難全都拋之腦后

      這位總理不如石破茂!華人血淚、新加坡受難全都拋之腦后

      柳扶風
      2025-12-08 09:23:47
      《瘋狂動物城2》導演感謝中國觀眾,獨家繪制“兔朱迪”“狐尼克”賀圖并配文

      《瘋狂動物城2》導演感謝中國觀眾,獨家繪制“兔朱迪”“狐尼克”賀圖并配文

      齊魯壹點
      2025-12-06 08:06:22
      徐瑛彬發抖音,總結這次比賽,王楚欽梁靖崑祝賀他成為世界冠軍

      徐瑛彬發抖音,總結這次比賽,王楚欽梁靖崑祝賀他成為世界冠軍

      阿錯田間生活
      2025-12-08 09:50:29
      方媛和盧靖姍同曬出月子照,一個素顏顯潦草,一個精致到頭發絲!

      方媛和盧靖姍同曬出月子照,一個素顏顯潦草,一個精致到頭發絲!

      戶外釣魚哥阿勇
      2025-12-07 12:54:35
      社評:德國對華政策需擺脫“價值觀”迷霧

      社評:德國對華政策需擺脫“價值觀”迷霧

      環球網資訊
      2025-12-08 00:17:43
      安徽夫婦做沖鋒衣,大賣20個億

      安徽夫婦做沖鋒衣,大賣20個億

      快刀財經
      2025-12-07 22:14:29
      2025-12-08 10:52:52
      cnBeta.COM incentive-icons
      cnBeta.COM
      提供IT行業即時資訊
      65694文章數 70002關注度
      往期回顧 全部

      科技要聞

      蘋果核心人才"出逃"內幕,庫克為何攔不住

      頭條要聞

      牛彈琴:對日斗爭突發新情況 中國軍方回應火力全開

      頭條要聞

      牛彈琴:對日斗爭突發新情況 中國軍方回應火力全開

      體育要聞

      厲害的后衛何其多 想想還少了哪一個

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經要聞

      養牛場未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰深圳地獄級路況 魏牌藍山VLA上車會思考聽得懂人話

      態度原創

      數碼
      家居
      手機
      本地
      公開課

      數碼要聞

      Caligra c100開發者終端亮相,配置強大外觀致敬經典

      家居要聞

      有限無界 打破慣有思維

      手機要聞

      史上首款機器人手機!榮耀ROBOT PHONE明年上半年量產

      本地新聞

      云游安徽|七千年敘事,第一章寫在蚌埠

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美日韩xxx| 亚洲综合无码一区二区三区| H色无码网站| 成人片黄网站色大片免费毛片| 国产精品天堂蜜av在线播放| 国产免费视频一区二区| 琪琪福利视频| 池州市| 国产精品欧美一区二区三区不卡| 伊人在线亚洲| 亚洲精品久久久久久久蜜桃臀| 草草影院发布页| 最近免费中文字幕mv在线视频3| AV无码免费不卡在线观看| 日韩AV中文字幕在线| 97AV在线| 精品一区二区av天堂| 6699嫩草久久久精品影院| 亚洲色大成网站www永久男同| 久久综合色之久久综合色| 天堂无码在线| 天天做天天爱天天做| 亚洲日韩国产中文其他| 国产亚洲第一精品| www.亚洲555久久久| 色亚洲日韩| 内射中出无码护士在线| 中文字幕久久久久人妻| 丝袜制服无码国产| 极品人妻系列| 亚洲 丝袜 另类 校园 欧美| 丝袜美腿视频一区二区三区| 91在线小视频| 17c.ccm| 久久久久有精品国产麻豆| 免费视频一区二区三区亚洲激情| 亚洲av片在线免费观看| 喀什市| 中文字幕无码不卡一区二区三区| 伊人色综合久久天天五月婷| 亚洲国产美女精品久久久|