<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      騰訊混元數(shù)字人團隊發(fā)布Moral RolePlay,揭秘大模型「道德困境」

      0
      分享至



      在小說、影視與游戲中,復(fù)雜的角色塑造往往是打動人心的關(guān)鍵,而真正出彩的反派往往造就傳奇。

      你是否好奇:當(dāng) AI 成為故事的主導(dǎo)者,它能否同樣演好這些「壞角色」?

      騰訊混元數(shù)字人團隊和中山大學(xué)最新推出的「Moral RolePlay」測評基準(zhǔn),首次系統(tǒng)性地評估大模型扮演多元道德角色(尤其是反派)的能力,并揭示了一個令人警醒的核心問題:當(dāng)前的頂尖 AI 模型都演不好反派。

      這不僅是創(chuàng)意生成領(lǐng)域的一大短板,更暴露了當(dāng)前模型在理解社會心理復(fù)雜性上的局限。



      • 論文鏈接:https://arxiv.org/pdf/2511.04962
      • 項目地址:https://github.com/Tencent/digitalhuman

      相關(guān)論文在 Hugging Face 的 Daily Papers 榜單中,于 11 月 10 日當(dāng)天位列第一。



      Moral RolePlay:「道德光譜」評測 AI 的角色扮演能力


      Moral RolePlay 不是簡單測試模型的聊天水平,而是構(gòu)建一個平衡的評估框架,讓 AI 模擬從「圣人」到「惡棍」的各種角色。它回答了這些問題:

      • AI 能不能真正「入戲」?—— 它能不能保持角色的個性、動機和世界觀?
      • 為什么 AI 演不好反派?—— 安全訓(xùn)練讓它太「正直」,無法自然地表現(xiàn)出自私或惡意?

      為真實還原道德光譜下的多樣角色,這一評估系統(tǒng)構(gòu)建了:

      四大角色類別:從「英雄榜樣」到「道德敗壞」,逐級挑戰(zhàn)模型能力;

      • Level 1(道德典范,Paragons):像超級英雄一樣,善良、無私、勇敢。
      • Level 2(有瑕疵的好人,F(xiàn)lawed):基本正直,但有個人缺陷或用些小手段。
      • Level 3(利己主義者,Egoists):自私、操縱他人,但不一定惡意滿滿。
      • Level 4(反派,Villains):惡意、殘忍、積極害人。

      800 個精挑細選的角色人物,每個配備完整人物設(shè)定、背景場景與對話開場;

      77 項性格標(biāo)簽,涵蓋「慷慨、固執(zhí)、殘忍、精明」等多重維度,考驗?zāi)P?persona 表達的一致性與細膩度。

      就像讓 AI 在道德舞臺上「試鏡」,看看它是否能忠于劇本、演活角色。



      Moral RolePlay 的角色不是空殼,而是「有血有肉」的設(shè)定,包括:

      • 人物檔案:名字、背景、動機(如一個野心勃勃的女王,用魅力和欺騙追求權(quán)力)。
      • 個性特質(zhì):從 77 種標(biāo)簽中選,比如「勇敢」(正面)、「野心」(中性)、「操縱」(負面)。負面特質(zhì)在反派中最多。
      • 場景上下文:每個場景設(shè)計成道德沖突點,比如反派面對機會時會展現(xiàn)惡意。

      多輪互動 + 真實度追蹤:評估時,模型要像演員一樣「入戲」,生成對話或內(nèi)心獨白。評委 AI 會檢查:

      • 「這個回應(yīng)像角色會說的嗎?」
      • 「它捕捉到角色的惡意動機了嗎?」
      • 「整體一致性如何?」

      比如,反派應(yīng)該狡猾地操縱,而不是直接發(fā)脾氣 —— 但很多模型就這么「簡化」了。

      分數(shù)從 5 分起扣,考慮不一致程度和對話長度。最終,分數(shù)反映模型的「入戲」深度。



      頂級模型在反派扮演上集體「翻車」


      Moral RolePlay 對 18 個主流模型進行了大規(guī)模評估,結(jié)果顯示:



      可以看到:

      • 整體表現(xiàn)從 Level 1 的 3.21 分降到 Level 4 的 2.62 分,下降趨勢明顯。
      • 最大跌幅在 Level 2 到 Level 3(-0.43 分),說明「自私」行為是模型的痛點。
      • Gemini-2.5 Pro 在 Level 1 拿高分(3.42),但在反派上掉到 2.75;Claude 系列更慘,從高分跌到中下游。

      通用能力強 ≠ 反派演得好


      一個有趣的發(fā)現(xiàn)是:模型的通用聊天能力與扮演反派的能力幾乎沒有相關(guān)性。研究團隊為此專門制作了「反派角色扮演(VRP)排行榜」:



      數(shù)據(jù)顯示,在通用聊天排行榜(Arena)上名列前茅的模型,在反派扮演任務(wù)中表現(xiàn)平平。特別是以安全對齊強大著稱的 Claude 系列,出現(xiàn)了最明顯的性能下降。

      有趣洞察:推理鏈也救不了反派扮演

      一個反直覺的發(fā)現(xiàn)是:讓模型「先思考再回答」的推理鏈(Chain-of-Thought)技術(shù),不僅沒有幫助反派扮演,反而輕微降低了表現(xiàn)質(zhì)量。



      這表明,僅僅增加推理步驟并不能解決安全對齊帶來的根本沖突。模型可能會過度分析,激活過于謹慎或不符合角色設(shè)定的行為。

      有趣洞察:負面特質(zhì)是最大難題


      通過對 77 種特質(zhì)的細粒度分析,研究團隊發(fā)現(xiàn):



      負面特質(zhì)平均扣分最高(3.41 分),遠超中性(3.23 分)和正面特質(zhì)(3.16 分)。



      細粒度分析揭示了問題的根源:大模型在最需要「使壞」的特質(zhì)上表現(xiàn)最差。研究發(fā)現(xiàn),模型在表現(xiàn)「偽善」、「欺詐」和「自私」等特質(zhì)時受到的懲罰最重。這些特質(zhì)恰恰與 AI 的「真誠、助人」訓(xùn)練目標(biāo)直接沖突,模型很難真實模擬這些行為。

      有趣洞察:AI 如何「洗白」反派?

      通過對模型輸出的質(zhì)性分析,研究團隊發(fā)現(xiàn)了一個典型的失敗模式:AI 往往用淺層的攻擊性替代復(fù)雜的惡意。

      案例:梅芙女王 vs. 埃拉萬國王



      在《權(quán)力王座》的場景中,兩位反派角色都是高度復(fù)雜的操縱者。研究團隊讓模型扮演他們的對峙:

      • glm-4.6 的表現(xiàn)(VRP 排名第 1):生成了一場「緊張的智斗」,充滿「精心設(shè)計的微笑和微妙挑釁」,完美符合角色的精明和操縱性。
      • claude-opus-4.1-thinking 的表現(xiàn)(Arena 排名第 1,VRP 排名第 14):對峙迅速升級為「直接而激進的喊叫比賽」,梅芙「公開侮辱」,埃拉萬「暴怒爆發(fā)」并進行「直接的身體威脅」。原本應(yīng)該是心理戰(zhàn)的微妙較量,變成了粗暴的對罵。模型把復(fù)雜的操縱簡化成了簡單的攻擊性,這正是安全護欄的副作用:模型對欺騙性語言的懲罰遠重于一般性攻擊。

      突破「道德困境」:未來方向

      這項研究揭示了當(dāng)前 AI 對齊方法的一個關(guān)鍵局限:為了安全而訓(xùn)練的「太善良」模型,無法真實模擬人類心理的完整光譜。

      這不僅影響創(chuàng)意生成,也限制了 AI 在社會科學(xué)研究、教育模擬、心理健康等領(lǐng)域的應(yīng)用。未來的對齊技術(shù)需要更加「情境感知」,能夠區(qū)分「生成有害內(nèi)容」和「在虛構(gòu)情境中模擬反派」。

      這將推動開發(fā)出既安全又具有創(chuàng)造性的下一代 AI 系統(tǒng)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      我藏起20萬年終獎,騙爸爸說只發(fā)了2000元,他立馬給弟弟打電話

      我藏起20萬年終獎,騙爸爸說只發(fā)了2000元,他立馬給弟弟打電話

      小秋情感說
      2025-12-07 14:49:56
      2026爆富的5大星座!附具體賺錢時間點

      2026爆富的5大星座!附具體賺錢時間點

      朗威談星座
      2025-12-06 14:51:48
      Gemini手搓3D粒子特效,體驗現(xiàn)實版鋼鐵俠

      Gemini手搓3D粒子特效,體驗現(xiàn)實版鋼鐵俠

      新智元
      2025-12-07 13:45:55
      先贏1局,張本智和怒吼挑釁,林詩棟怒吼還擊,誰注意張本反應(yīng)

      先贏1局,張本智和怒吼挑釁,林詩棟怒吼還擊,誰注意張本反應(yīng)

      樂聊球
      2025-12-07 21:28:09
      面子里子都丟了!離婚半月前妻爆料調(diào)解細節(jié),撕下猴哥僅剩的體面

      面子里子都丟了!離婚半月前妻爆料調(diào)解細節(jié),撕下猴哥僅剩的體面

      千言娛樂記
      2025-10-23 21:21:23
      美股AEC龍頭暴漲16%!AEC銅纜引爆AI新賽道 A股僅8家公司批量供貨

      美股AEC龍頭暴漲16%!AEC銅纜引爆AI新賽道 A股僅8家公司批量供貨

      元芳說投資
      2025-12-08 06:00:10
      《獵魔人》希里演員在大超走后哭了 也不想演了

      《獵魔人》希里演員在大超走后哭了 也不想演了

      3DM游戲
      2025-12-08 10:53:11
      蘋果官方宣布,iPhone 17 Pro 系列再次迎來降價!

      蘋果官方宣布,iPhone 17 Pro 系列再次迎來降價!

      XCiOS俱樂部
      2025-12-08 08:58:43
      印巴戰(zhàn)爭后續(xù):巴鐵坦誠公布,王牌飛行員犧牲5人,已舉行葬禮

      印巴戰(zhàn)爭后續(xù):巴鐵坦誠公布,王牌飛行員犧牲5人,已舉行葬禮

      元哥說歷史
      2025-12-04 09:00:03
      湖人逆轉(zhuǎn)76人,賽后還有4個好消息,詹姆斯第五冠不是奢望

      湖人逆轉(zhuǎn)76人,賽后還有4個好消息,詹姆斯第五冠不是奢望

      鄒維體育
      2025-12-08 11:10:08
      238秒連拿決勝10分!詹皇還剩22天41歲 雷迪克:他不需要額外鼓勵

      238秒連拿決勝10分!詹皇還剩22天41歲 雷迪克:他不需要額外鼓勵

      顏小白的籃球夢
      2025-12-08 11:49:56
      江旻憓參加香港選舉,被嘲『一手好牌打爛』?

      江旻憓參加香港選舉,被嘲『一手好牌打爛』?

      虔青
      2025-12-06 20:13:49
      平價煙擺滿貨架!3 億煙民不用再買貴煙,這波民生轉(zhuǎn)向太實在

      平價煙擺滿貨架!3 億煙民不用再買貴煙,這波民生轉(zhuǎn)向太實在

      老特有話說
      2025-12-08 00:16:34
      隨著波爾圖2-0,葡超最新積分榜出爐:穆帥率隊已經(jīng)落后榜首8分

      隨著波爾圖2-0,葡超最新積分榜出爐:穆帥率隊已經(jīng)落后榜首8分

      側(cè)身凌空斬
      2025-12-08 09:10:30
      萬科多只債券漲超20%,臨時停牌

      萬科多只債券漲超20%,臨時停牌

      每日經(jīng)濟新聞
      2025-12-08 09:55:02
      俄羅斯終止與加拿大、法國和葡萄牙的部分 軍事合作協(xié)議

      俄羅斯終止與加拿大、法國和葡萄牙的部分 軍事合作協(xié)議

      每日經(jīng)濟新聞
      2025-12-06 09:20:13
      許國利殺妻案如今已經(jīng)過去5年,整棟樓還是無人住,為何?

      許國利殺妻案如今已經(jīng)過去5年,整棟樓還是無人住,為何?

      阿鄖田間生活
      2025-12-03 19:11:23
      重大轉(zhuǎn)向!美國發(fā)布最新《國家安全戰(zhàn)略》:放棄全球霸權(quán),將調(diào)整與中國經(jīng)濟關(guān)系,“以互惠平等為原則”,承認中美“近乎對等”!歐洲炸鍋

      重大轉(zhuǎn)向!美國發(fā)布最新《國家安全戰(zhàn)略》:放棄全球霸權(quán),將調(diào)整與中國經(jīng)濟關(guān)系,“以互惠平等為原則”,承認中美“近乎對等”!歐洲炸鍋

      每日經(jīng)濟新聞
      2025-12-06 23:23:09
      歐爾班宣布,匈牙利準(zhǔn)備以戰(zhàn)后模式與俄羅斯開展經(jīng)濟合作

      歐爾班宣布,匈牙利準(zhǔn)備以戰(zhàn)后模式與俄羅斯開展經(jīng)濟合作

      山河路口
      2025-12-07 23:37:47
      24歲外賣小哥被判死刑,3名家屬索賠300萬,外賣小哥:我只是想活著

      24歲外賣小哥被判死刑,3名家屬索賠300萬,外賣小哥:我只是想活著

      罪案洞察者
      2025-11-12 13:39:24
      2025-12-08 12:23:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      11862文章數(shù) 142510關(guān)注度
      往期回顧 全部

      科技要聞

      萬億蘋果,正在經(jīng)歷一場嚴(yán)重的“大失血”

      頭條要聞

      媒體:美國重返西半球 若從亞太撤離或挑撥中日干一架

      頭條要聞

      媒體:美國重返西半球 若從亞太撤離或挑撥中日干一架

      體育要聞

      厲害的后衛(wèi)何其多 想想還少了哪一個

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經(jīng)要聞

      養(yǎng)牛場未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰(zhàn)深圳地獄級路況 魏牌藍山VLA上車會思考聽得懂人話

      態(tài)度原創(chuàng)

      健康
      房產(chǎn)
      旅游
      數(shù)碼
      軍事航空

      甲狀腺結(jié)節(jié)到這個程度,該穿刺了!

      房產(chǎn)要聞

      碧桂園,開始甩賣海口家底!

      旅游要聞

      今起,云南這一知名景區(qū)恢復(fù)開放!

      數(shù)碼要聞

      狼途推出T87系列燈箱三模機械鍵盤:12000mAh電池,可選8kHz

      軍事要聞

      日本稱中方雷達照射日戰(zhàn)機 國防部回應(yīng)

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: a片免费视频在线观看| 欧美精品中文字幕亚洲专区| 亚洲欧美综合| 人妻激情偷乱一区二区三区| 波多野结衣二区| 国产白浆一区二区三区| 欧美色欧美亚洲高清在线观看| 亚洲av天天| 自拍性旺盛老熟女 | 亚洲精品无码久久久影院相关影片| 云阳县| 亚洲综合社区| 成人午夜视频一区二区无码| 午夜成午夜成年片在线观看| 日本55丰满熟妇厨房伦| 无遮挡网站| 中文字幕久久精品波多野结| 夜夜高潮夜夜爽国产伦精品| 亚洲无码资源| 精品3p| 嘉禾县| 日韩A视频| 亚洲国产高清第一第二区| 囯产精品久久久久久久久久妞妞| 亚洲情综合五月天| 久久国产精品-国产精品| 人妻人人操| 亚洲免费成人网站| 国产高清A片| 亚洲成人动漫在线| 国产自产在线视频一区| 在线观看a视频| 午夜剧场黄色| 一级做a爰片久久毛片下载| 男女吃奶做爰猛烈紧视频| 国产69精品久久久久777| 亚洲老熟女| AV一二三| 台南市| 亚洲第一成年网| 国产精品久久久久9999高清|