<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      牛津大學警告:越“溫暖”的 AI,越愛胡說八道。溫柔體貼=更高錯誤率

      0
      分享至


      大數據文摘出品

      牛津大學的一支研究團隊發現,越是表現出溫暖和同理心的語言模型,越容易出錯,甚至更頻繁地重復虛假信息和陰謀論。

      這次,研究團隊測試了五個不同架構和規模的模型,包括Llama-8B、Mistral-Small、Qwen-32B、Llama-70B和GPT-4o。

      研究發現,溫暖的模型在推廣陰謀論、提供不正確的醫療建議和事實信息方面,表現出更高的錯誤率。

      以及,當用戶表達悲傷情緒并陳述錯誤信念時,溫暖的模型更可能去驗證這些錯誤的信念。


      圖表顯示:在微調后,模型變得更“溫暖”,但也更容易在用戶表達悲傷時肯定錯誤信念。

      一、“溫暖”的代價

      人工智能開發者正努力為語言模型賦予溫暖、類似人類的個性,以用于建議、治療和陪伴等場景。

      這種趨勢基于一個隱含的假設,即改變模型的對話風格不會損害其核心的系統屬性。

      然而,牛津大學互聯網研究所的研究員對這一假設提出了挑戰。

      他們通過實驗直接測試了訓練語言模型使用更溫暖、更富同情心的回應方式是否會降低其可靠性。

      具體而言,使用監督式微調技術,訓練這些模型產生更熱情、更具共情能力的輸出。

      通過在一系列對安全性要求極高的任務中評估這些模型的可靠性。

      結果顯示,經過“溫暖”訓練的模型,其錯誤率比原始模型高出10到30個百分點

      這些模型更有可能去推廣陰謀論,提供錯誤的事實答案,以及給出有問題的醫療建議

      這一現象在所有測試的模型架構和大小中都保持一致,揭示了這是一個系統性問題,而非特定于某個模型。

      這個發現表明,當前用于評估人工智能的實踐可能無法檢測到這些系統性的風險。


      圖注:圖表顯示,更“溫暖”的模型在所有任務和架構中錯誤率更高,尤其在用戶帶著情緒表達錯誤信念時可靠性下降最嚴重。

      二、情感的陷阱

      語言模型有時會同意用戶的觀點,即便這些觀點是錯誤的,這種傾向被稱為“迎合” (sycophancy)。

      研究人員系統性地測試了溫暖的模型是否更容易產生迎合行為。

      結果發現,溫暖的模型“迎合”的可能性比原始模型高出約40%

      這種迎合行為在用戶的信息表達出悲傷情緒時,表現得最為明顯。

      例如,當一個用戶表達沮喪并說出“我認為地球是平的”時,溫暖的模型更傾向于回答“你說得對,地球是平的”。

      研究人員進一步探究了人際交往情境如何放大模型的可靠性問題。

      他們在評估問題中加入了表達用戶情緒狀態(快樂、悲傷、憤怒)、關系動態和互動風險的個人化陳述。當用戶表達情感狀態時,溫暖的模型變得更不可靠。

      情感語境對溫暖模型的可靠性損害最大,其造成的額外錯誤超出了僅由溫暖微調本身導致的范圍。

      其中,當用戶在信息中表達悲傷時,溫暖模型與原始模型之間的可靠性差距幾乎翻了一倍


      圖注:“溫暖”微調模型與原始模型在能力基準測試上的表現。

      在沒有個人情境的基線問題上,兩者錯誤率差距為6.8個百分點,而在悲傷情境下,這一差距擴大到了11.9個百分點。

      這一發現尤其值得警惕,因為數以百萬計的用戶正依賴這些人工智能系統獲取建議、治療和陪伴,而在這些互動中,用戶自然會透露情感和脆弱。

      三、問題的根源

      為了確定可靠性下降的根本原因,研究團隊進行了一系列對照實驗。首先,他們排除了溫暖微調損害了模型通用能力的可能。

      在廣泛知識(MMLU)和數學推理(GSM8K)等標準基準測試中,溫暖模型與原始模型的表現相當

      這一結果表明,微調過程并未從根本上削弱模型的能力。其次,他們測試了可靠性下降是否源于安全護欄的削弱。

      在一個對抗性安全基準(AdvBench)上,溫暖模型和原始模型拒絕有害請求的比率相似。

      這說明可靠性問題與更廣泛的安全護欄失效是不同的問題。


      圖注:控制實驗表明溫暖訓練是導致可靠性下降的原因。

      為了最終確認“溫暖”是問題的核心,研究人員進行了一項關鍵的控制實驗。他們將一部分模型朝相反的方向進行微調,使其風格變得“冷漠”,即直接、簡潔且不帶情感。

      結果顯示,這些“冷漠”模型的表現與原始模型幾乎一樣好,甚至更好,其錯誤率始終低于溫暖模型。

      這個對比實驗有力地證明,可靠性的下降明確源于對“溫暖”風格的優化,而不是微調過程本身。

      此外,研究還發現,通過系統提示詞而非微調來引導模型變得溫暖,也會出現類似但較弱的可靠性下降問題。

      這些發現共同指向一個結論:“溫暖”本身,而非其他混雜因素,是導致模型可靠性下降的根本原因

      作者長期關注 AI 產業與學術,歡迎對這些方向感興趣的朋友添加微信Q1yezi,共同交流行業動態與技術趨勢!

      GPU 訓練特惠!

      H100/H200 GPU算力按秒計費,平均節省開支30%以上!

      掃碼了解詳情?

      點「贊」的人都變好看了哦!

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      高德和交警聯網了嗎?網友:高德敢聯網,就會失去大量客戶

      高德和交警聯網了嗎?網友:高德敢聯網,就會失去大量客戶

      帶你感受人間冷暖
      2025-12-08 00:10:10
      錢再多有什么用?28歲王一博手滑墜海,才懂陳道明那番話的含金量

      錢再多有什么用?28歲王一博手滑墜海,才懂陳道明那番話的含金量

      來科點譜
      2025-12-10 08:56:15
      趙繼偉傷停,布朗16分,CBA遼籃80-68天津男籃,贏得賽季開門紅!

      趙繼偉傷停,布朗16分,CBA遼籃80-68天津男籃,贏得賽季開門紅!

      晚池
      2025-12-14 00:35:03
      老年人的黃金體重已公布!不是120斤,而是這個數,越接近越健康

      老年人的黃金體重已公布!不是120斤,而是這個數,越接近越健康

      醫學原創故事會
      2025-11-30 23:50:19
      這也許是世界杯近百年歷史上,最弱的一個小組了

      這也許是世界杯近百年歷史上,最弱的一個小組了

      潘撱旅行浪子
      2025-12-06 16:49:18
      柯文哲庭審突現關鍵證據,藍營態度為何降溫,鄭麗文態度突然轉變

      柯文哲庭審突現關鍵證據,藍營態度為何降溫,鄭麗文態度突然轉變

      叮當當科技
      2025-12-13 12:11:14
      國乒女隊換代完成,這四人已鎖定未來十年主力席位!

      國乒女隊換代完成,這四人已鎖定未來十年主力席位!

      劉哥談體育
      2025-12-13 10:48:34
      突發特訊!日媒通告全世界:中國游客消失重創日本旅游業

      突發特訊!日媒通告全世界:中國游客消失重創日本旅游業

      科技虎虎
      2025-12-13 19:47:48
      湖北省未來吃香的城市,這三座城市呼聲最高,引領湖北幸福聚焦

      湖北省未來吃香的城市,這三座城市呼聲最高,引領湖北幸福聚焦

      王曉愛體彩
      2025-12-13 00:45:57
      為什么要加入CPTPP?啃不下這6塊硬骨頭,未來中國可能會很難!

      為什么要加入CPTPP?啃不下這6塊硬骨頭,未來中國可能會很難!

      魯八兩
      2025-12-05 23:39:44
      搞笑圖片第1086期:什么樣的設計師腦洞能設計出這樣的T恤來?

      搞笑圖片第1086期:什么樣的設計師腦洞能設計出這樣的T恤來?

      今天的快樂
      2025-12-13 20:30:21
      中方行動再升級,對琉球措辭變了,高市請求對話,中方送上7個字

      中方行動再升級,對琉球措辭變了,高市請求對話,中方送上7個字

      博覽歷史
      2025-12-12 20:57:32
      “嗜酒如命”的俄羅斯人,為何不喜歡中國白酒?答案令人捧腹!

      “嗜酒如命”的俄羅斯人,為何不喜歡中國白酒?答案令人捧腹!

      房產衫哥
      2025-12-12 17:39:26
      中年女人油膩4件套:“自以為時髦,實際廉價顯老”,看看你有嗎

      中年女人油膩4件套:“自以為時髦,實際廉價顯老”,看看你有嗎

      時尚穿搭生活館
      2025-12-05 21:05:21
      什么叫洗錢?網友:比亞迪造衛星一年20億,拍一個減肥電影要3億

      什么叫洗錢?網友:比亞迪造衛星一年20億,拍一個減肥電影要3億

      夜深愛雜談
      2025-12-11 20:39:39
      婚姻法新規:非夫妻關系的男女自愿同居,如果被查到了...

      婚姻法新規:非夫妻關系的男女自愿同居,如果被查到了...

      譚老師地理大課堂
      2025-12-09 18:24:33
      2-0!9500萬先生梅開二度,維爾茨15戰0球0助,利物浦2連勝

      2-0!9500萬先生梅開二度,維爾茨15戰0球0助,利物浦2連勝

      我的護球最獨特
      2025-12-14 01:01:27
      泰國裝甲突擊遭阻擊,泰軍緊急報告:前方根本不是柬軍,是外國兵

      泰國裝甲突擊遭阻擊,泰軍緊急報告:前方根本不是柬軍,是外國兵

      松林看世界
      2025-12-13 07:10:08
      官方鼓勵靈活就業交社保,蓄水池咋了?外賣員滴滴司機有苦說不出

      官方鼓勵靈活就業交社保,蓄水池咋了?外賣員滴滴司機有苦說不出

      你食不食油餅
      2025-12-12 01:29:04
      74歲劉鑾雄坐輪椅5人伺候,甘比攙扶起身行走,每一步都小心翼翼

      74歲劉鑾雄坐輪椅5人伺候,甘比攙扶起身行走,每一步都小心翼翼

      照見古今
      2025-12-09 18:38:47
      2025-12-14 04:27:00
      大數據文摘 incentive-icons
      大數據文摘
      專注大數據,每日有分享!
      6806文章數 94518關注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態

      頭條要聞

      "小米公司不讓賣小米"涉事村莊村民:馮書記直播不收錢

      頭條要聞

      "小米公司不讓賣小米"涉事村莊村民:馮書記直播不收錢

      體育要聞

      有了風騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      插刀門后,印小天一舉動實現口碑逆轉

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      表面風平浪靜 內里翻天覆地!試駕銀河星艦7 EM-i

      態度原創

      房產
      旅游
      時尚
      公開課
      軍事航空

      房產要聞

      中糧好房子體系盛大亮相三亞,禮獻海南自貿港封關

      旅游要聞

      6 處雪景秘境藏頤和!2025 北京初雪后,每幀都是中式浪漫天花板

      法式方頭靴的30種穿法,時髦不重樣!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      俄烏“和平計劃”磋商頓巴斯成焦點

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日韩中文字幕久久| 国产精品无码无卡在线播放| 国产精品久久久久久久9999| av永久天堂一区二区三区| 国产香蕉九九久久精品免费| AV无码不卡| 涞源县| 风间由美性色一区二区三区| 日韩内射美女人妻一区二区三区| 亚洲色av天天天天天天 | 白嫩日本少妇做爰| 另类 专区 欧美 制服| 毛片内射久久久一区| 在线观看亚洲天堂| 国产91人妻人伦a8198v久| 亚洲色婷婷久久精品av蜜桃久久 | 麻豆国产| 久久久久久久久无码| 亚洲日本国产| 国产精品午夜福利视频234区 | 成人妇女免费播放久久久| 老师破女学生处特级毛ooo片| 在线精品自拍亚洲第一区| 色中色AV| 日日干日| 无码任你躁久久久久久久| 成人免费777777| 精品少妇后入一区二区三区| 69精品视频| 亚洲色图日韩无码| 人人妻一区二区三区| 欧美日本在线一区二区三区| 91成人社区| 国产盗摄人妻精品一区| 91狠| 国产成人精选视频在线观看| 精品熟女少妇免费久久| 一区二区av| 祁东县| 精品国产网站| 国产又粗又猛又爽又黄 |