<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文 申請入駐

      谷歌新發(fā)現(xiàn):DeepSeek推理分裂出多重人格,左右腦互搏越來越聰明

      0
      分享至

      聞樂 發(fā)自 凹非寺
      量子位 | 公眾號(hào) QbitAI

      AI變聰明的真相居然是正在“腦內(nèi)群聊”?!

      谷歌最新研究表明,DeepSeek-R1這類頂尖推理模型在解題時(shí),內(nèi)部會(huì)自發(fā)“分裂”出不同性格的虛擬人格,比如外向的、嚴(yán)謹(jǐn)?shù)?、多疑的…?/p>

      大模型的解題推理過程,就是這些人格一場精彩的社交、辯論會(huì);左右腦互搏be like:

      “這個(gè)思路對嗎?試試這樣驗(yàn)證……”
      “不對,之前的假設(shè)忽略了xx條件”



      有意思的是,AI還越吵越聰明

      研究發(fā)現(xiàn),當(dāng)遇到GPQA graduate-level科學(xué)問題、復(fù)雜數(shù)學(xué)推導(dǎo)這類高難度任務(wù)時(shí),這種內(nèi)部觀點(diǎn)沖突會(huì)變得更加激烈。

      相比之下,面對布爾表達(dá)式、基礎(chǔ)邏輯推理等簡單任務(wù),模型的腦內(nèi)對話會(huì)明顯減少。



      模型推理過程就是“左右腦互搏”

      團(tuán)隊(duì)通過分析DeepSeek-R1和QwQ-32B等模型的思維軌跡發(fā)現(xiàn),它們的推理過程充滿了對話感。

      內(nèi)部分裂出來的虛擬角色不僅性格迥異,還能覆蓋更多解題角度。

      創(chuàng)意型角色擅長提出新穎思路,批判型角色專注挑錯(cuò)補(bǔ)漏,執(zhí)行型角色負(fù)責(zé)落地驗(yàn)證……



      通過這些人格的一場交流,不同觀點(diǎn)的碰撞能讓模型更全面地審視解決方案。

      就連網(wǎng)友都說,自己在思考的時(shí)候,也會(huì)“左右腦互搏”。



      不過,這種多角色互動(dòng)并不是開發(fā)人員刻意設(shè)計(jì)的,而是模型在追求推理準(zhǔn)確率的過程中自發(fā)形成的。

      那么實(shí)驗(yàn)是如何證明這一點(diǎn)的呢?



      團(tuán)隊(duì)借助稀疏自編碼器SAE,對AI的推理黑盒進(jìn)行了深度解碼,成功“監(jiān)聽”到了AI的腦內(nèi)群聊。

      首先,研究者讓AI執(zhí)行復(fù)雜的數(shù)學(xué)或邏輯推理任務(wù)。在模型產(chǎn)出思維鏈的同時(shí),團(tuán)隊(duì)同步提取其隱藏層神經(jīng)元的激活數(shù)值。

      但此時(shí)的數(shù)據(jù)是由數(shù)億個(gè)參數(shù)構(gòu)成的復(fù)雜非線性信號(hào),無法直接對應(yīng)任何語義。

      將這些激活數(shù)據(jù)輸入SAE,通過SAE的稀疏約束機(jī)制,就可以把雜亂的激活拆解為“自問自答”、“切換視角”等獨(dú)立的對話語義特征;

      通過分析這些特征的激活頻率以及它們在時(shí)間序列上的協(xié)同關(guān)系,團(tuán)隊(duì)成功識(shí)別出了不同的內(nèi)部邏輯實(shí)體。

      再給上述特征打上“規(guī)劃者”、“驗(yàn)證者”等虛擬角色的標(biāo)簽,就成功解碼了AI內(nèi)部的多角色對話行為。

      “哦!”能讓推理更準(zhǔn)確

      通過對比DeepSeek-R1與DeepSeek-V3、Qwen-2.5-32B-IT這類普通指令模型的推理軌跡,發(fā)現(xiàn)推理模型的對話式行為出現(xiàn)的頻率顯著更高



      這里還有個(gè)很有意思的發(fā)現(xiàn)——

      “哦!”能讓推理更準(zhǔn)確。

      當(dāng)團(tuán)隊(duì)通過激活添加法強(qiáng)化模型的對話特征,放大“哦!”這類表達(dá)驚訝、轉(zhuǎn)折的話語標(biāo)記時(shí),模型在Countdown算術(shù)推理任務(wù)中的準(zhǔn)確率直接從27.1%翻倍至54.8%。



      更關(guān)鍵的實(shí)驗(yàn)證據(jù)來自強(qiáng)化學(xué)習(xí)訓(xùn)練。

      研究人員不提供任何對話結(jié)構(gòu)的訓(xùn)練信號(hào),只獎(jiǎng)勵(lì)模型答對題目的行為,結(jié)果發(fā)現(xiàn)模型會(huì)自發(fā)學(xué)會(huì)用對話式思考;

      而先通過多智能體對話數(shù)據(jù)對模型進(jìn)行微調(diào),再進(jìn)行推理訓(xùn)練,進(jìn)步速度會(huì)遠(yuǎn)快于直接訓(xùn)練推理或用獨(dú)白式推理數(shù)據(jù)微調(diào)的模型。

      在Qwen-2.5-3B和Llama-3.2-3B兩個(gè)模型體系中,早期訓(xùn)練階段對話微調(diào)模型的準(zhǔn)確率比獨(dú)白微調(diào)模型高出10%以上,Llama-3.2-3B到訓(xùn)練后期差距甚至擴(kuò)大到22%。



      這一發(fā)現(xiàn)恰好呼應(yīng)了人類演化生物學(xué)中的著名理論社會(huì)腦假說

      假說認(rèn)為人類大腦的進(jìn)化主要是為了應(yīng)對復(fù)雜的社交關(guān)系和群體互動(dòng)需求。

      如今看來,AI也是一樣,為了變聰明,得先會(huì)和不同“人格”社交!

      論文地址:https://arxiv.org/abs/2601.10825
      參考鏈接:https://x.com/sebkrier/status/2013331596863041731

      — 完 —

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      廣州10年沒下雪了!廣州天氣:要下雨了

      廣州10年沒下雪了!廣州天氣:要下雨了

      魯中晨報(bào)
      2026-01-23 07:11:29
      恩里克:為什么目前巴黎不是法甲第一?因?yàn)橛星蜿?duì)連贏了10場

      恩里克:為什么目前巴黎不是法甲第一?因?yàn)橛星蜿?duì)連贏了10場

      懂球帝
      2026-01-22 23:21:31
      安世半導(dǎo)體事件再次上演?這次輪到濰柴動(dòng)力,中企遭遇斬殺線!

      安世半導(dǎo)體事件再次上演?這次輪到濰柴動(dòng)力,中企遭遇斬殺線!

      我心縱橫天地間
      2026-01-22 13:15:04
      維拉紐瓦:布朗尼有兩張全明星球員票,一張他自己投的&一張是他爹

      維拉紐瓦:布朗尼有兩張全明星球員票,一張他自己投的&一張是他爹

      懂球帝
      2026-01-22 14:13:05
      楊瀚森不要再迷戀小約基奇了 腳踏實(shí)地才是王道 一技術(shù)決定去留

      楊瀚森不要再迷戀小約基奇了 腳踏實(shí)地才是王道 一技術(shù)決定去留

      籃球小煙花
      2026-01-23 08:00:03
      搞笑!董方卓社媒評論區(qū)淪陷,遭球迷問候:起床了,你爹進(jìn)決賽了

      搞笑!董方卓社媒評論區(qū)淪陷,遭球迷問候:起床了,你爹進(jìn)決賽了

      國足風(fēng)云
      2026-01-22 07:47:44
      批復(fù)!天津一銀行被吸收合并!

      批復(fù)!天津一銀行被吸收合并!

      天津人
      2026-01-22 18:41:52
      接受捐款僅2天,官媒對李亞鵬用了特殊稱呼,這次,沒給他留體面

      接受捐款僅2天,官媒對李亞鵬用了特殊稱呼,這次,沒給他留體面

      阿纂看事
      2026-01-20 13:12:13
      72小時(shí)內(nèi),聯(lián)大爆發(fā)兩波爭端,中國禁止日本入常,解放軍開始上場

      72小時(shí)內(nèi),聯(lián)大爆發(fā)兩波爭端,中國禁止日本入常,解放軍開始上場

      科普100克克
      2026-01-22 17:53:21
      上海國盛(集團(tuán))有限公司原副總裁陳為被提起公訴

      上海國盛(集團(tuán))有限公司原副總裁陳為被提起公訴

      界面新聞
      2026-01-22 16:05:10
      斯諾克戰(zhàn)報(bào)!吳宜澤7勝1負(fù)奪冠,趙心童2連亞后退賽,147先生陪跑

      斯諾克戰(zhàn)報(bào)!吳宜澤7勝1負(fù)奪冠,趙心童2連亞后退賽,147先生陪跑

      劉姚堯的文字城堡
      2026-01-23 06:41:42
      十年前:“中國真是搞笑,搞什么中歐班列,現(xiàn)在成為笑柄了吧!”

      十年前:“中國真是搞笑,搞什么中歐班列,現(xiàn)在成為笑柄了吧!”

      扶蘇聊歷史
      2026-01-22 12:13:57
      拜合拉木表哥:我表弟父母去世后他家里特困難,爺爺養(yǎng)著他長大

      拜合拉木表哥:我表弟父母去世后他家里特困難,爺爺養(yǎng)著他長大

      懂球帝
      2026-01-22 16:29:28
      北京大媽地鐵罵外地人后續(xù):兒子被牽連,身背破包,后悔不敢出門

      北京大媽地鐵罵外地人后續(xù):兒子被牽連,身背破包,后悔不敢出門

      離離言幾許
      2026-01-23 00:03:15
      武漢理工大學(xué)畢業(yè)做保安:月薪3800,男子講述自身經(jīng)歷被學(xué)校約談

      武漢理工大學(xué)畢業(yè)做保安:月薪3800,男子講述自身經(jīng)歷被學(xué)校約談

      漢史趣聞
      2026-01-22 19:29:07
      華為新機(jī)突然上架:1月23日,正式開售!

      華為新機(jī)突然上架:1月23日,正式開售!

      科技堡壘
      2026-01-21 11:14:59
      高市孤注一擲,誓言備戰(zhàn)臺(tái)海!中日聯(lián)合國交鋒,中方重提東京審判

      高市孤注一擲,誓言備戰(zhàn)臺(tái)海!中日聯(lián)合國交鋒,中方重提東京審判

      知鑒明史
      2026-01-22 06:25:03
      徒弟曾罵聶衛(wèi)平看不懂棋,葬禮都不來參加,背后恩怨超過50年

      徒弟曾罵聶衛(wèi)平看不懂棋,葬禮都不來參加,背后恩怨超過50年

      老土歷史
      2026-01-22 17:21:52
      陳光標(biāo)怒撕遮羞布:梁小龍哪里是病死,分明是被折騰死的!

      陳光標(biāo)怒撕遮羞布:梁小龍哪里是病死,分明是被折騰死的!

      鄉(xiāng)野小珥
      2026-01-23 00:22:03
      全劇終!10天6板后一字跌停,封單超千萬手,78萬股東被“活埋”

      全劇終!10天6板后一字跌停,封單超千萬手,78萬股東被“活埋”

      財(cái)經(jīng)智多星
      2026-01-21 21:24:48
      2026-01-23 08:24:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動(dòng)態(tài)
      12050文章數(shù) 176362關(guān)注度
      往期回顧 全部

      科技要聞

      財(cái)報(bào)還行,股價(jià)崩了,英特爾“掉鏈子”

      頭條要聞

      美國啟動(dòng)“和平委員會(huì)”18國已簽署 西歐國家無一參加

      頭條要聞

      美國啟動(dòng)“和平委員會(huì)”18國已簽署 西歐國家無一參加

      體育要聞

      跑個(gè)步而已,他們在燃什么?

      娛樂要聞

      車銀優(yōu)賺800億 涉嫌逃稅200億!

      財(cái)經(jīng)要聞

      西貝拿到“救命錢”,然后呢

      汽車要聞

      配備多塊娛樂屏 極氪8X內(nèi)飾曝光

      態(tài)度原創(chuàng)

      數(shù)碼
      教育
      旅游
      公開課
      軍事航空

      數(shù)碼要聞

      2026款華碩a豆14 Air筆記本發(fā)布,6999元起

      教育要聞

      吉利學(xué)院山東招生分?jǐn)?shù)曝光!工商管理471分穩(wěn)嗎?

      旅游要聞

      創(chuàng)歷史新高!2025年上海入境游接待總量超936萬人次,解讀來了

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美軍首艘“高超導(dǎo)彈戰(zhàn)艦”出海測試

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 成人免费ā片在线观看| 成熟丰满熟妇av无码区| 福利姬Jk丝袜-91Porn| 日产久久久久| 亚洲女同精品中文字幕| 国产精品国产三级国产午| 国产精品久久久久7777按摩| 中文字幕有码在线| 极品少妇xxxx| 风韵丰满熟妇啪啪区老熟熟女| 久久99精品国产99久久6尤物| 亚洲精品久久久口爆吞精| 慈利县| 亚洲中文字幕无码中文字| 人妖福利导航| 天堂av在线免费观看| 午夜综合网| 国产综合久久99久久| 久久夜夜免费视频| 亚洲精品久久久久久久观小说| 成人免费看黄网站yyy456| 亚洲无线国产观看| 野花社区在线观看视频| 钟山县| 少妇特黄a一区二区三区| 粉嫩av懂色av蜜臀av熟妇| 亚洲精品国产自在久久| 2020日韩无码| 国产五区| 久久久久8888| 精品孕妇孕交无码专区| 国产啪视频免费观看视频| 免费人成黄页网站在线观看国内| 无码专区 人妻系列 在线| 精品无码国产自产野外拍在线| 丰满少妇人妻无码专区| 熟女白浆精品一区二区| 亚洲狠狠婷婷综合久久久久图片| 即墨市| 久久婷婷成人综合色| 长白|