<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      大模型「有心了」:首個情感大模型Echo-N1,32B勝過200B

      0
      分享至



      機器之心報道

      機器之心編輯部

      長期以來,大模型圈流傳著一個詛咒:LLM 懂微積分、會寫 Python,但在情感這件事上,它們全是「直男」。

      即使是 GPT-4,在面對人類細膩的情感崩潰時,往往也只能吐出 “多喝熱水”、“別難過,一切都會好起來的” 這種正確的廢話。原因很簡單:「情商」沒有標準答案,傳統的強化學習(RL)根本無從下手。

      但今天,這個詛咒被打破了。

      近日,來自 NatureSelect(自然選擇)的研究團隊 Team Echo發布了首個情感大模型 Echo-N1,提出了一套全新的「情感模型訓練方法」,成功將 RL 用在了不可驗證的主觀情感領域。

      結果相當震撼:

      • 僅 32B 參數的 Echo-N1,在多輪情感陪伴任務中勝率(Success Rate)達到 46.7%。作為對比,擁有千億參數量的商業模型 Doubao 1.5 Character,勝率僅為 13.3%。
      • 相比基座模型(Qwen3-32B)0% 的成功率,經過 RL 后性能直接起飛,對模型的共情模式帶來了質變。
      • 團隊首度提出了「共情的心理物理模型」(EPM),把玄學的「共情」變成了可計算的「物理做功」。



      • 論文標題:Echo-N1: Affective RL Frontier
      • 論文鏈接:https://arxiv.org/pdf/2512.00344v1

      為什么你的 AI 對象總是「聊天終結者」?

      在數學和代碼領域,RLHF(基于人類反饋的強化學習)之所以好用,是因為答案非黑即白。但在情感陪伴中,真誠和冒犯、玩笑和油膩,往往只有一線之隔。

      現有的模型(尤其是開源模型)普遍存在三大問題:

      1.無法量化: 用戶一句 「I'm fine」 背后可能藏著崩潰、無奈甚至拒絕溝通,傳統的標量獎勵根本無法有效捕捉這種細微的情緒信號。

      2.Reward Hacking: 模型為了拿高分自然學會了堆砌華麗辭藻,經常說些不痛不癢的美麗的廢話,對緩解用戶情緒不僅毫無幫助,甚至可能適得其反。

      3.評測失真: 通過基于 SOTA 閉源模型(GPT-4,Claude-4.5-sonnet,Gemini-2.5-pro)的打分研究不難發現,這些模型自己都分不清什么樣的表達屬于「像人」、什么樣的屬于「像 AI」。

      為了解決這些問題,Team Echo決定推翻現有的 RL 范式,給 AI 裝上一顆真正的「心」

      核心技術:給 RL 裝上「讀心術」



      獎勵模型:告別「打分」,開始「寫評語」

      團隊意識到,僅依賴標量獎勵(Scalar Reward)的信息維度過于單一。

      情感是流動的、細膩的,簡單的數值反饋難以捕捉用戶在交互中的細膩情感變化,無法有效引導策略模型(Policy Model)對用戶情緒做出合適的共情反饋。

      受 O1、R1 等架構在復雜推理任務上成功的啟發,團隊的思考是:情感感知雖然主觀,但本質上依然是基于上下文的復雜推理過程,只是思維模式與理科任務有所不同。

      因此,Echo-N1 創新性地提出了生成式獎勵模型(Generative Reward Model)。團隊將思維鏈(CoT)的杠桿效應遷移至獎勵端 —— 獎勵模型在輸出結果前,必須先生成一段邏輯嚴密的情感推理路徑。在該路徑下,模型需要先對用戶畫像進行深度側寫,再基于此推導出 “什么樣的回答能引發共鳴”。通過將隱性的情感判斷過程顯化,模型的判別精度顯著提升,從而實現對策略模型更精細、更準確的反饋引導。

      在這一框架下,團隊通過 RL 訓練了兩種生成式獎勵模型:

      • Humanlike Reward(擬人度獎勵): 旨在消除 “助手味”。它具備上下文感知(Context-aware)能力,能敏銳識別并懲罰那些邏輯不通、或為了湊字數而生成的 “幻覺” 內容,確保回復邏輯自洽且具備「活人感」。
      • Empathy Reward(共情獎勵): 旨在實現 User-specific 的深度共情。先根據歷史上文來推斷用戶的潛在畫像(User Context Mining),再判斷回復是否符合人類認知、情感、動機三種最本質的共情需求。由于人類偏好的多樣性,團隊提出了一種「從公理推定理」的新穎范式:將普世價值觀視為 “公理”,將千人千面的個性化需求視為 “定理”,由此出發設計了一套共情偏好數據合成框架。為了校驗自動化管線生成數據的可靠性,團隊引入了「人機回環」驗證機制,通過讓原始標注員對模型推演的用戶畫像與回復策略進行一致性校驗,確保了合成數據在 “客觀準確” 與 “主觀共情” 上的高度統一。

      為保證生成式獎勵模型的情感推理路徑的準確性,團隊在訓練中額外引入了過程性獎勵(Process Reward)引導推理路徑的修正。此外,針對 RL 中常見的 Reward Hacking 問題,團隊采用了離散化獎勵(Discrete Rewards)參考答案錨定(Reference Anchoring)的策略。不追求分數的絕對值膨脹,而是通過與 Reference 對比進行相對優劣排序。實驗表明,這些策略相比 Scalar Reward 極大提升了訓練策略模型的穩定性。



      評測革命:當「AI 共情」變成可計算的物理模型

      大模型訓練的下半場,靜態刷榜已經沒有意義,未來的決勝關鍵在于「動態交互」。尤其在情感陪伴這條終極賽道上,現有的 “真空式刷分評測” 根本無法衡量 AI 在長程、復雜的心理博弈中的真實表現。

      為了打破空白和僵局,NatureSelect(自然選擇)的研究團隊首先解決了一個根本性的科學難題:

      如何客觀量化「共情」與「療愈」?

      EPM 情感物理模型 —— 給 “共情” 一把科學標尺

      為了量化對話中復雜的心理博弈,Team Echo 以物理學定律為啟發,結合認知科學和心理物理法,打造了一套全新的機器共情科學標尺 —— 將抽象的心理療愈,轉化為可計算的物理過程。

      • 心理勢能 (Potential Energy): 用戶的痛苦與情緒阻抗不再是模糊的形容詞,而被建模為有待克服的心理「阻力」或高位的「負勢能」。
      • 做功 (Work): AI 的每一次回復,本質上都是在對用戶的心理場「施加作用力」,試圖推動其狀態向良性躍遷。有效共情就是有效做功。
      • 矢量空間 (Vector Space): 這種復雜的作用力被精準分解到可計算的 MDEP 三維心理空間 —— 認知重構(C)、情感共鳴(A)、主動賦能(P)。

      有了 EPM,共情效果不再是主觀猜測,而是可視化追蹤的能量軌跡和可計算的物理功

      擬人化認知沙盒 —— 一場關于心智計算的大戲

      人類真實的共情對話,是人類大腦多重認知模塊協同運作的結果 ——實時的思考推理、鮮活的情緒反應、聯想性的記憶檢索,缺一不可。為了讓 AI 真正像人一樣思考和交流,Team Echo 進一步打造了一個 “擬人化認知沙盒”。這是一個由模擬人類 “中央執行腦區” 所統籌的多智能體協作系統,旨在共同演繹出有血有肉的真實互動。

      這個多智能體系統最引人注目的地方,在于其動態、簡潔、基于環境反饋的 Function Call 機制。整個系統是一個敏銳的幕后大腦,時刻捕捉著對話中的心理變化和深層情感流動 —— 它會根據現場情景靈活推理決策、調配記憶資源、激活特定故事;還能根據互動反饋,即時調整策略重點,掌控對話節奏和結束時機,確保每一輪交流都充滿新鮮感和挑戰性。憑借這種智能且不可預測的調度能力,沙盒測試得以真正實現多輪鮮活的復雜心智模擬。

      殘酷的大考:基座模型全面崩塌

      有了這套殘酷而真實的擬人化認知沙盒,我們終于可以對 AI 進行一場前所未有的 “社會共情能力的大考”。

      結果令人震驚,卻也在意料之中。

      在覆蓋 30 個高難度心理場景的壓力測試下,未經 post-train 的基座模型 (Qwen3-32B) 全面崩塌,通過率為驚人的 0%。更具揭示性的是 EPM 3D 軌跡圖:基座模型陷入無序的的隨機游走和病態收斂,它的軌跡幾乎全部指向了負能量區域 —— 不僅無法提供情感支持,反而讓用戶滋生了更負面的情緒和心理阻抗,在錯誤的道路上越走越遠。

      即便是千億參數級別的商業模型Doubao 1.5 Character,在這場嚴苛的測試中也顯得力不從心,成功率僅為13.3%

      這些數據充分證明:真實的共情能力,絕非單純堆砌參數就能涌現,它需要專門的、科學的訓練范式



      Echo-N1 的崛起:畫像對齊,溫柔堅定「做功」

      在基座模型全面潰敗的背景下,經過情感強化學習 (Affective RL)訓練的Echo-N1 模型,實現了顛覆性的跨越。在同樣的測試中,Echo-N1 的軌跡發生了根本性的逆轉,它同時學會了多種畫像對齊的策略,不僅能敏銳地捕捉用戶的情緒落差,還能一步步把用戶從負面泥潭里拉出來,推向良性的心理狀態。



      在這場殘酷的沙盒大考中,Team Echo 反而拒絕以單一成敗論英雄,而是深入到 “方向對齊率” 與 “有效能量投影” 等多維量化指標,透視模型共情策略的真實質量與做功效率。

      為了實現物理基準與人文體驗的雙重互證,他們進一步引入 NEE(Narrative & Experience Evaluator) 機制,組織 GPT-4o、Claude-3.5 等頂尖 SOTA 模型專家團進行盲測審視。最終,將嚴謹的物理量化指標與深度的人文體驗評分融為一體,形成證據閉環:Echo-N1 斬獲了 73.54 分的綜合高分,遠超商業模型 Doubao 的 42.95 分和基座模型的 29.66 分,有力證明了其在科學精度與人文溫度上的雙重跨越。



      邁向「有溫度」的 AGI

      Echo-N1 的誕生證明:AI 的「情商」并非無法量化,它本質上是可以被數學建模、被 RL 優化的硬核能力

      這項研究不僅讓 32B 小模型擁有了越級挑戰千億參數模型的共情能力,更重要的是,它為 RL 在主觀、不可驗證領域的應用打開了一種新的可能。

      也許很快,你的 AI 伴侶不再只會說些無用的話、冷冰冰地列 To-Do List,而是那個與你超級對齊、能陪你一起面對這個世界不確定性的「靈魂伴侶」。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      博主:塞爾吉尼奧踢完亞冠將返回巴西,達萬已經回巴西治療

      博主:塞爾吉尼奧踢完亞冠將返回巴西,達萬已經回巴西治療

      懂球帝
      2025-12-11 11:21:10
      藍戰非綁架案最恐怖之處,不是被收集指紋毛發和精液,而是這一點

      藍戰非綁架案最恐怖之處,不是被收集指紋毛發和精液,而是這一點

      媒體人溪婉
      2025-12-10 12:25:12
      曼城2-1逆轉皇馬!升至歐冠第四 哈蘭德點射創歷史 羅德里戈破門

      曼城2-1逆轉皇馬!升至歐冠第四 哈蘭德點射創歷史 羅德里戈破門

      侃球熊弟
      2025-12-11 05:00:15
      三天降價1000萬,催收巨頭永雄集團虧本賤賣總部大樓求生

      三天降價1000萬,催收巨頭永雄集團虧本賤賣總部大樓求生

      界面新聞
      2025-12-11 12:53:01
      范曾發布聲明

      范曾發布聲明

      新京報政事兒
      2025-12-11 12:19:47
      打假博主送檢遼寧膚醫堂產品發現有西藥添加,討說法被店主持刀威脅,多方回應

      打假博主送檢遼寧膚醫堂產品發現有西藥添加,討說法被店主持刀威脅,多方回應

      瀟湘晨報
      2025-12-10 18:08:21
      詹姆斯:對火箭想防住亞當斯需要全隊包括保安都上才能卡住位

      詹姆斯:對火箭想防住亞當斯需要全隊包括保安都上才能卡住位

      懂球帝
      2025-12-11 14:01:18
      中國傳媒大學博導耿波教授去世,年僅49歲,留下11歲龍鳳胎,學校工會:會安排慰問家屬

      中國傳媒大學博導耿波教授去世,年僅49歲,留下11歲龍鳳胎,學校工會:會安排慰問家屬

      極目新聞
      2025-12-11 10:22:05
      價格大跳水!1克拉大鉆石,只要3500元!1.4萬元買的鉆戒,如今只能賣200元,消費者:早知道就買黃金了

      價格大跳水!1克拉大鉆石,只要3500元!1.4萬元買的鉆戒,如今只能賣200元,消費者:早知道就買黃金了

      每日經濟新聞
      2025-12-10 18:17:08
      被偷家的理想,決定“刮骨療毒”

      被偷家的理想,決定“刮骨療毒”

      博客COVER
      2025-12-10 14:13:02
      保羅離隊后首次正式發聲,一句話掀起全網熱議:他真的不后悔嗎?

      保羅離隊后首次正式發聲,一句話掀起全網熱議:他真的不后悔嗎?

      君笙的拂兮
      2025-12-11 17:05:23
      中國終于明白戰勝國的優勢!美國意識到:自己也被中國裝進去了!

      中國終于明白戰勝國的優勢!美國意識到:自己也被中國裝進去了!

      布拉旅游說
      2025-12-09 11:27:15
      全國小學生流行的18句口頭禪,第一句就讓我氣炸

      全國小學生流行的18句口頭禪,第一句就讓我氣炸

      上海女性
      2025-12-08 18:41:03
      喜訊!烏軍總司令通報:烏克蘭已收復紅軍城近一半城區

      喜訊!烏軍總司令通報:烏克蘭已收復紅軍城近一半城區

      史政先鋒
      2025-12-10 21:25:00
      亂套!8強出6:世界冠軍3-4出局,日乒邊緣主力逆轉,削球手淘汰

      亂套!8強出6:世界冠軍3-4出局,日乒邊緣主力逆轉,削球手淘汰

      金風說
      2025-12-11 16:16:43
      中國手機市場最新排名:華為被反超!

      中國手機市場最新排名:華為被反超!

      EETOP半導體社區
      2025-12-10 13:26:16
      65歲遲志強現狀:出獄37年后,定居黑龍江,兒子職業曝光令人淚目

      65歲遲志強現狀:出獄37年后,定居黑龍江,兒子職業曝光令人淚目

      查爾菲的筆記
      2025-12-11 12:34:01
      今天在烏克蘭戰場損失的俄兵有點多

      今天在烏克蘭戰場損失的俄兵有點多

      名人茍或
      2025-12-11 16:42:22
      又一個大V被封!任何政治狂熱,都是國家和人民的災難!

      又一個大V被封!任何政治狂熱,都是國家和人民的災難!

      深度報
      2025-12-10 22:37:02
      彭總在哈軍工用餐時,一學員同坐,責問陳賡:他有什么資格坐這?

      彭總在哈軍工用餐時,一學員同坐,責問陳賡:他有什么資格坐這?

      小豫講故事
      2025-12-11 06:00:10
      2025-12-11 17:27:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11895文章數 142509關注度
      往期回顧 全部

      科技要聞

      豆包剛被微信淘寶們"群毆" ,又有人來搶位

      頭條要聞

      關鍵時刻 特朗普、馬克龍、斯塔默、默茨通話

      頭條要聞

      關鍵時刻 特朗普、馬克龍、斯塔默、默茨通話

      體育要聞

      你最看不上的人,關鍵時刻卻最想救你...

      娛樂要聞

      阮經天小20歲的千金女友曝光

      財經要聞

      政府被“騙”,9500萬去哪了?

      汽車要聞

      長途穿越更輕松 二代哈弗H9穿越版限時售23.29萬

      態度原創

      游戲
      本地
      數碼
      公開課
      軍事航空

      倩女端游,你有億點接地府了

      本地新聞

      打工人夢想中的生活,寵物已經提前過上了

      數碼要聞

      最輕大折疊!vivo X Fold5升級OriginOS 6 韓伯嘯:輕辦公神器 6到飛起

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      泰國海軍做好戰爭準備 特朗普要電話調停泰柬沖突

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 美女网站免费福利视频| 精品久久久久久无码不卡| 亚洲av无码一区二区三区网站| 91在线小视频| 岐山县| 免费国产又色又爽又黄的网站| 久久精品蜜芽亚洲国产av| 国产精品久久精品第一页| 日韩免费无码人妻波多野| 国产愉拍91九色国产愉拍| 成人影音先锋| 亚洲第一网站| 性色欲情网站| 亚洲中文字幕久久久一区| 亚洲中文字幕伊人久久无码 | 国产盗摄xxxx视频xxxx | 午夜无码人妻AV大片| 永春县| av男人的天堂在线观看国产| 免费看无码网站成人A片| 国产免费成人视频| 人人操人| 国产亚洲精品久久久久久青梅| 精品人妻无码一区二区三区抖音| 久久精品丝袜高跟鞋| 国产av大全| 99无码精品| 日韩美女久久| 亚洲精品无码久久久影院相关影片 | 黑人大群体交免费视频| 亚洲国产精品久久艾草| 五月综合激情婷婷六月| 青草伊人网| 日韩欧美一中文字暮专区| 欧洲无码一区二区三区在线观看| 亚洲乱码中文字幕小综合| 丁香五月天激情网| 在线亚洲人妻| 国产精品久久久久久妇女| 激情在线网| 男同色色|