<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      情感識別不再是分類題:EmotionThinker讓SpeechLLM 學會解釋情緒

      0
      分享至



      語音情感識別(Speech Emotion Recognition, SER)在過去基本遵循同一種范式:輸入語音,輸出情緒標簽。這種設定在工程上有效,但在認知層面卻過于簡化。

      在人類交流中,情緒判斷從來不是一個 “標簽選擇” 的過程,而是一種基于證據整合的推理行為。我們會綜合語調變化、音高起伏、語速快慢、重音位置、語義內容,以及說話人的身份特征,去解釋 “為什么” 這是憤怒、“為什么” 這是失落。

      因此,一個更根本的問題浮現出來:

      SpeechLLM 是否具備像人類一樣解釋 “為什么” 做出情緒判斷的能力?

      為此,研究團隊提出了EmotionThinker—— 首個面向可解釋情感推理(Explainable Emotion Reasoning)的強化學習框架,嘗試將 SER 從 “分類任務” 提升為 “多模態證據驅動的推理任務”。



      • 論文標題:EmotionThinker: Prosody-Aware Reinforcement Learning for Explainable Speech Emotion Reasoning

      一、從 “情緒分類” 到 “情感推理”

      EmotionThinker 首先對語音情感識別任務本身進行了重定義,將其擴展為情感推理任務(Emotion Reasoning)。在新的設定下,模型不僅需要預測情緒標簽,還需要生成一段解釋,明確指出:

      • 哪些聲學線索支持這一判斷
      • 哪些語義線索起到關鍵作用
      • 這些線索如何共同構成最終結論

      這種范式轉變意味著,模型輸出從 “標簽” 升級為 “標簽 + 基于證據的推理”。

      它的意義并非簡單延長輸出,而是對優化目標的重寫。模型不再只需 “預測正確”,而必須學習如何整合韻律、語義與說話人屬性等多模態信號,并在解釋中體現證據對齊過程。情緒識別由此從判別問題轉變為結構化推理問題。




      二、EmotionThinker:

      面向可解釋情感推理的框架

      EmotionThinker 的目標并不局限于提升最終準確率,而是同時提升三方面能力:

      (1)更高的情緒識別準確率

      (2)更強的情緒線索整合與推理能力

      (3)更細粒度的音頻描述能力,覆蓋說話人特征、韻律線索與語義信息

      為了支撐這一目標,研究團隊首先構建了EmotionCoT-35K。這是一個包含 35,000+ 條樣本的 Chain-of-Thought 風格數據集。與傳統 SER 數據不同,它不僅提供情緒標簽,還提供細粒度韻律描述與結構化推理解釋。

      這些樣本明確標注了音高、能量、語速、重音、語調輪廓等線索如何支持情緒判斷,使模型能夠學習到 “證據 — 推理 — 結論” 之間的對應關系。

      與此同時,研究團隊觀察到:若模型的韻律感知能力不足,其情感推理能力將受到系統性限制。因此,研究團隊進一步構建了一個 EmotionThinker-Base。EmotionThinker-Base 通過監督微調增強模型對音高變化、能量波動、語速模式與重音等結構的感知能力,從而為后續的推理優化提供穩定基礎。



      三、GRPO-PTR:

      讓強化學習真正優化 “解釋能力”

      在將語音情感識別重定義為情感推理之后,一個新的優化難題隨之出現:如何在開放式生成場景中,對 “推理質量” 進行穩定強化學習?直接將推理獎勵與情緒預測獎勵簡單疊加,會帶來明顯的噪聲問題。一方面,模型可能生成語言上看似合理但與最終情緒判斷不一致的解釋;另一方面,在訓練初期,模型尚未形成穩定的聲學 — 語義對齊能力,過強的推理獎勵容易放大早期隨機偏差,導致策略梯度震蕩。為此,研究團隊提出了 GRPO-PTR(Progressive Trust-aware Reasoning)。

      首先,研究團隊采用了漸進式推理獎勵調度。在訓練初期,優化重點放在情緒預測的穩定性上;隨著模型策略逐步收斂,逐步提高推理獎勵權重,使模型從 “預測正確” 過渡到 “解釋合理”。這種 reward scheduling 降低了早期高方差信號對訓練穩定性的影響。

      其次,研究團隊引入基于一致性的可信度加權機制。當模型生成的推理與最終情緒預測保持一致時,推理獎勵按完整權重計入;當二者存在沖突時,推理獎勵自動衰減。該機制有效緩解了開放式生成任務中常見的 reward misalignment 問題,使解釋優化始終服務于情緒判斷本身。

      從優化角度看,GRPO-PTR 解決的是一個更一般的問題:如何在 “預測 + 解釋” 的多目標生成任務中,使結構化推理與最終決策保持對齊,并在強化學習框架下穩定收斂。



      四、實驗結果與研究啟示

      在多個標準語音情感識別基準上,EmotionThinker 同時實現了:

      • 更高的情緒識別準確率
      • 更優的解釋質量
      • 更穩定的韻律線索整合能力

      更重要的是,我們觀察到一個關鍵現象:當模型被顯式訓練去對齊聲學線索與情緒判斷時,其在復雜情緒場景下的魯棒性顯著增強。這說明,情感理解的瓶頸并不僅僅在語義層面,而在于聲學與語義信號的協同建模能力。換句話說:如果模型不能準確理解 “怎么說”,它就無法穩定理解 “是什么情緒”。






      結語


      EmotionThinker 并不僅僅是在情感識別任務上提升準確率,而是在任務定義層面完成了一次轉變。

      情緒識別不應只是標簽預測,而應是基于多模態證據的結構化推理過程。從 “分類” 到 “解釋”,從 “標簽” 到 “證據 — 推理 — 結論” 的一致性對齊,情感理解正在進入一個強調可解釋性與結構協同的階段。

      當模型學會解釋情緒時,它不僅在給出判斷,也在展示其如何整合聲學與語義線索。

      這或許是多模態大模型邁向真正情感理解能力的重要一步。

      作者簡介

      本文第一作者為王丁冬,香港中文大學博士生,研究方向為語音大模型的口語理解,對話與推理 (Reasoning),導師為 Helen Meng 教授。本文在微軟劉樹杰博士與Jinyu Li博士的共同指導下完成。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      國家緊急預警!供應鏈投毒集中爆發,所有人盡快自查防護

      國家緊急預警!供應鏈投毒集中爆發,所有人盡快自查防護

      娛樂圈見解說
      2026-04-19 02:48:57
      黃圣依小兒子近照曝光:這顏值,是來“整頓”星二代的吧!

      黃圣依小兒子近照曝光:這顏值,是來“整頓”星二代的吧!

      情感大頭說說
      2026-04-19 22:17:29
      西方國家為什么都不喜歡中國?英國專家:中國有一個“老問題”

      西方國家為什么都不喜歡中國?英國專家:中國有一個“老問題”

      甜到你心坎
      2026-04-12 22:42:27
      趙心童沒讓眾星徹底嘆服!希金斯:他可能達到小特高度但無法更高

      趙心童沒讓眾星徹底嘆服!希金斯:他可能達到小特高度但無法更高

      楊華評論
      2026-04-18 18:39:32
      2.5億化成灰!俄最強戰艦未戰先沉,390架廉價無人機捅穿防空神話

      2.5億化成灰!俄最強戰艦未戰先沉,390架廉價無人機捅穿防空神話

      杰絲聊古今
      2026-03-28 01:03:36
      徹底撕破臉?《乘風2026》蕭薔當場罷錄,一句身體不適,藏著對節目組的不滿

      徹底撕破臉?《乘風2026》蕭薔當場罷錄,一句身體不適,藏著對節目組的不滿

      老吳教育課堂
      2026-04-19 14:19:36
      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      越南百億高鐵訂單給德國,來華體驗12小時高鐵,背后算計太明顯

      來科點譜
      2026-04-20 07:10:19
      肯帕努:中國聯賽水平遠高于羅馬尼亞;中國發展水平遙遙領先

      肯帕努:中國聯賽水平遠高于羅馬尼亞;中國發展水平遙遙領先

      懂球帝
      2026-04-19 11:49:41
      不陪快船內耗了!倫納德下家曝光,首選騎士,哈登圓夢總冠軍有戲

      不陪快船內耗了!倫納德下家曝光,首選騎士,哈登圓夢總冠軍有戲

      體育大朋說
      2026-04-19 14:00:03
      越南軍隊富到什么程度?軍政商業帝國內幕曝光,權錢交易顛覆三觀

      越南軍隊富到什么程度?軍政商業帝國內幕曝光,權錢交易顛覆三觀

      樂享人生風雨
      2026-04-19 14:19:27
      24架殲10直沖云霄!巴鐵從名單中硬核搶人:以色列戰機就在伏擊圈

      24架殲10直沖云霄!巴鐵從名單中硬核搶人:以色列戰機就在伏擊圈

      深析古今
      2026-04-19 09:17:01
      伊朗向2艘印度油輪開火后,憤怒的印度網友,卻扯上了中國

      伊朗向2艘印度油輪開火后,憤怒的印度網友,卻扯上了中國

      消失的電波
      2026-04-19 16:48:01
      考古:大明湖挖出文物證實,濟南是中國唯一5000年連續建城的城市

      考古:大明湖挖出文物證實,濟南是中國唯一5000年連續建城的城市

      文史達觀
      2026-03-27 16:15:00
      鄧文國,退休7年后被查

      鄧文國,退休7年后被查

      第一財經資訊
      2026-04-19 14:51:37
      扎心!一季度觀影人次銳減6700萬,票房腰斬,網友:電影真的難看

      扎心!一季度觀影人次銳減6700萬,票房腰斬,網友:電影真的難看

      火山詩話
      2026-04-17 14:17:56
      2-1,4-1!英超悲喜夜!維拉紅軍絕殺,曼城戰勝槍手,造4大懸念

      2-1,4-1!英超悲喜夜!維拉紅軍絕殺,曼城戰勝槍手,造4大懸念

      劉哥談體育
      2026-04-20 01:58:17
      牡丹花下死!送走馬蓉又迎馮清,43歲王寶強,終究栽進“女人坑”

      牡丹花下死!送走馬蓉又迎馮清,43歲王寶強,終究栽進“女人坑”

      小蘭聊歷史
      2026-04-13 02:09:34
      別再誤解了!上海企業老人退休金并沒那么高

      別再誤解了!上海企業老人退休金并沒那么高

      搗蛋窩
      2026-04-20 06:33:38
      黃渤和鄧超為什么無戲可拍了?

      黃渤和鄧超為什么無戲可拍了?

      閑人電影
      2026-04-16 18:55:11
      “10分鐘的商務座,你拍了9分鐘的照”,窮養女炫富,反被群嘲

      “10分鐘的商務座,你拍了9分鐘的照”,窮養女炫富,反被群嘲

      妍妍教育日記
      2026-04-15 08:25:03
      2026-04-20 09:24:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12795文章數 142632關注度
      往期回顧 全部

      科技要聞

      藍色起源一級火箭完美回收 客戶衛星未入軌

      頭條要聞

      牛彈琴:美國向伊朗貨輪開火并將其控制 該伊朗發飆了

      頭條要聞

      牛彈琴:美國向伊朗貨輪開火并將其控制 該伊朗發飆了

      體育要聞

      湖人1比0火箭:老詹比烏度卡像教練

      娛樂要聞

      何潤東漲粉百萬!內娛隔空掀桌第一人

      財經要聞

      月之暗面IPO迷局

      汽車要聞

      29分鐘大定破萬 極氪8X為什么這么多人買?

      態度原創

      游戲
      手機
      親子
      本地
      公開課

      寶可夢真的能吃!寶可夢30周年 御三家變美食

      手機要聞

      紅米K100系列再次曝光:BOSE揚聲器+超強馬達,沖高不靠風扇!

      親子要聞

      孩子這些異常行為,可能是隱蔽的求救信號!

      本地新聞

      12噸巧克力有難,全網化身超級偵探添亂

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版