<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      大模型長腦子了?研究發現LLM中層會自發模擬人腦進化

      不內耗的人腦子里是這么想的

      0
      分享至

      編輯|Panda


      生物智能與人工智能的演化路徑截然不同,但它們是否遵循某些共同的計算原理?

      最近,來自帝國理工學院、華為諾亞方舟實驗室等機構的研究人員發表了一篇新論文。該研究指出,大型語言模型(LLM)在學習過程中會自發演化出一種協同核心(Synergistic Core)結構,有些類似于生物的大腦。



      • 論文標題:A Brain-like Synergistic Core in LLMs Drives Behaviour and Learning
      • 論文地址:https://arxiv.org/abs/2601.06851



      研究團隊利用部分信息分解(Partial Information Decomposition, PID)框架,對 Gemma、Llama、Qwen 和 DeepSeek 等模型進行了深度剖析。

      他們發現,這些模型的中層表現出極強的協同處理能力,而底層和頂層則更偏向于冗余處理。

      協同與冗余:LLM 的內部架構

      研究團隊將大型語言模型視為分布式信息處理系統,其核心實驗設計旨在量化模型內部組件之間交互的本質。為了實現這一目標,研究者選取了 Gemma 3、Llama 3、Qwen 3 8B 以及 DeepSeek V2 Lite Chat 等多種具有代表性的模型系列進行對比分析。

      實驗方法與量化指標

      在實驗過程中,研究者向模型輸入了涵蓋語法糾錯、邏輯推理、常識問答等 6 個類別的認知任務提示詞。

      針對每一個提示詞,模型會生成一段 100 個 Token 的回答,實驗設備則同步記錄下每一層中所有注意力頭或專家模塊的激活值。

      具體而言,研究人員計算了這些輸出向量的 L2 范數,以此作為該單元在特定時間步的激活強度數據。

      基于這些時間序列數據,研究團隊應用了整合信息分解(Integrated Information Decomposition, ID)框架。

      這一框架能夠將注意力頭對之間的交互分解為「持續性協同」和「持續性冗余」等不同原子項。

      通過對所有注意力頭對的協同值和冗余值進行排名并求差,研究者得到了一個關鍵指標:協同-冗余秩(Synergy-Redundancy Rank)。該指標能夠清晰地標示出模型組件在處理信息時,究竟是傾向于進行獨立的信號聚合,還是在進行跨單元的深度集成。

      跨模型的空間分布規律

      實驗數據揭示了一個在不同架構模型中高度一致的空間組織規律。在歸一化后的模型層深圖中,協同分布呈現出顯著的「倒 U 型」曲線 :



      • 冗余外周(Redundant Periphery):模型的早期層(靠近輸入端)和末期層(靠近輸出端)表現出極低的協同秩,信息處理以冗余模式為主。在早期層,這反映了模型在進行基本的解詞元化(Detokenization)和局部特征提取;而在末期層,則對應著 Token 預測和輸出格式化的過程。
      • 協同核心(Synergistic Core):模型的中層則展現出極高的協同秩,形成了核心處理區。例如,在對 Gemma 3 4B 的熱圖分析中,中間層的注意力頭之間表現出密集且強烈的協同交互,這正是模型進行高級語義集成和抽象推理的區域。

      架構差異與一致性

      值得注意的是,這種「協同核心」的涌現并不依賴于特定的技術實現。

      在 DeepSeek V2 Lite 模型中,研究者即使是以「專家模塊」而非「注意力頭」作為分析單位,依然觀察到了相同的空間分布特征。

      這種跨架構的收斂性表明,協同處理可能是實現高級智能的一種計算必然,而非單純的工程巧合。

      這種組織模式與人腦的生理結構形成了精確的映射:人腦的感官和運動區域同樣表現出高冗余性,而負責復雜認知功能的聯合皮層則處于高協同的「全局工作空間」中心。

      智能的涌現:學習驅動而非架構使然

      一個關鍵的問題在于:這種結構是 Transformer 架構自帶的,還是通過學習習得的?

      研究人員通過分析 Pythia 1B 模型的訓練過程發現,在隨機初始化的網絡中,這種「倒 U 型」的協同分布并不存在。隨著訓練步數的增加,這種組織架構才逐漸穩定形成。



      這意味著,協同核心是大模型獲得能力的標志性產物。

      在拓撲性質上,協同核心具有極高的「全局效率」,有利于信息的快速集成;而冗余外周則表現出更強的「模塊化」,適用于專門化處理。這種特征再次與人類大腦的網絡架構形成了精確的平行關系。

      協同核心的功能驗證

      為了驗證協同核心是否真的驅動了模型行為,研究團隊進行了兩類干預實驗:消融實驗和微調實驗。

      消融實驗:研究發現,消融那些高協同性的節點,會導致模型出現災難性的性能下降和行為背離,其影響遠超隨機消融或消融冗余節點。這證明協同核心是模型智能的核心驅動力。



      微調實驗:在強化學習微調(RL FT)場景下,僅針對協同核心進行訓練,獲得的性能提升顯著優于針對冗余核心或隨機子集的訓練。有趣的是,在監督微調(SFT)中這種差異并不明顯。研究者認為,這反映了 RL 促進通用化而 SFT 更多傾向于記憶的特性。



      結語

      這項研究為大模型的可解釋性開辟了新路徑。它表明,我們可以從「自上而下」的信息論視角來理解模型,而不僅僅是「自下而上」地尋找特定的電路。

      對于 AI 領域,識別協同核心有助于設計更高效的壓縮算法,或者通過更有針對性的參數更新來加速訓練。對于神經科學,這提供了一種計算上的驗證,預示著協同回路在強化學習和知識遷移中可能扮演著至關重要的角色。

      大模型雖然基于硅基芯片和反向傳播算法,但在追求智能的過程中,它們似乎不約而同地走向了與生物大腦相似的組織模式。這種智能演化的趨同性,或許正是我們揭開通用智能奧秘的關鍵線索。

      更多詳情請參閱原論文。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      原來林心如沒了美顏長這樣,比普通人耐看,到底是明星。

      原來林心如沒了美顏長這樣,比普通人耐看,到底是明星。

      動物奇奇怪怪
      2026-01-22 11:23:18
      1億鋒霸急速隕落:7場0球,西蒙尼太失望:連續3次提前換下他

      1億鋒霸急速隕落:7場0球,西蒙尼太失望:連續3次提前換下他

      足球狗說
      2026-01-22 07:22:24
      同樣在路上跑,電車為啥不用交養路費?2026年養路費新規落地!

      同樣在路上跑,電車為啥不用交養路費?2026年養路費新規落地!

      老特有話說
      2026-01-20 15:57:30
      很多你以為不該存在的,只是你沒看懂

      很多你以為不該存在的,只是你沒看懂

      記憶承載
      2026-01-22 11:18:52
      WTT常規賽:向鵬出師不利!首局連丟7分被逆轉,卡爾伯格11-5大勝

      WTT常規賽:向鵬出師不利!首局連丟7分被逆轉,卡爾伯格11-5大勝

      劉姚堯的文字城堡
      2026-01-22 16:32:42
      離譜數據!東契奇單節408分>AD本賽季總得分,湖人血賺

      離譜數據!東契奇單節408分>AD本賽季總得分,湖人血賺

      夜白侃球
      2026-01-22 16:10:49
      冉瑩穎窮到晚上不敢開燈!兒子穿破洞鞋、節約餐費,滿墻名包諷刺

      冉瑩穎窮到晚上不敢開燈!兒子穿破洞鞋、節約餐費,滿墻名包諷刺

      探索新高度
      2026-01-21 12:12:44
      無緣挑戰德約科維奇!商竣程連丟三盤出局,止步澳網男單第2輪

      無緣挑戰德約科維奇!商竣程連丟三盤出局,止步澳網男單第2輪

      全景體育V
      2026-01-22 13:49:51
      比 “斬殺線” 更恐怖,美國每年失蹤36萬兒童,且僅是被正式記錄在案數據

      比 “斬殺線” 更恐怖,美國每年失蹤36萬兒童,且僅是被正式記錄在案數據

      不掉線電波
      2026-01-21 19:59:28
      兩年了,為何許家印遲遲不判刑?真相比你想象的更復雜!

      兩年了,為何許家印遲遲不判刑?真相比你想象的更復雜!

      李云飛Afey
      2026-01-20 11:43:34
      威少轟23+3+3+3仍無緣今日最佳!對不起,你碰到創紀錄的SGA了

      威少轟23+3+3+3仍無緣今日最佳!對不起,你碰到創紀錄的SGA了

      世界體育圈
      2026-01-22 13:41:23
      新四軍剛沖出日軍包圍圈,旅長卻下令:打回去,日軍人數不對勁!

      新四軍剛沖出日軍包圍圈,旅長卻下令:打回去,日軍人數不對勁!

      史之銘
      2026-01-22 06:29:44
      2026年財神偏愛!這3大生肖事業攀升,衣食無憂,家庭美好

      2026年財神偏愛!這3大生肖事業攀升,衣食無憂,家庭美好

      人閒情事
      2026-01-22 15:58:06
      嫣然活動現場曝光,王菲和李亞鵬媽媽同框,離婚7年稱對方自家人

      嫣然活動現場曝光,王菲和李亞鵬媽媽同框,離婚7年稱對方自家人

      甜檸聊史
      2026-01-22 16:18:20
      事發南通,網友實名舉報,大雪紛飛中,易家橋中學學生被體罰

      事發南通,網友實名舉報,大雪紛飛中,易家橋中學學生被體罰

      尋墨閣
      2026-01-22 14:08:38
      吳京、李連杰新片遭受抵制,網友的吐槽方向一致,不約而同

      吳京、李連杰新片遭受抵制,網友的吐槽方向一致,不約而同

      林輕吟
      2026-01-19 19:59:16
      你見過最暖的撿奶茶現場嗎?一車奶茶傾瀉,路人集體變身“撿購俠”;網友:陜西人“嫽咋咧”!

      你見過最暖的撿奶茶現場嗎?一車奶茶傾瀉,路人集體變身“撿購俠”;網友:陜西人“嫽咋咧”!

      大風新聞
      2026-01-22 10:57:04
      特朗普大鬧達沃斯,全世界哭笑不得

      特朗普大鬧達沃斯,全世界哭笑不得

      牛彈琴
      2026-01-22 07:56:12
      小縣城的消費究竟能有多高?網友:越小的地方東西越貴,這是真的

      小縣城的消費究竟能有多高?網友:越小的地方東西越貴,這是真的

      解讀熱點事件
      2026-01-19 00:05:09
      廣東今日早報!威姆斯公布重要決定,薩林杰或被裁,徐杰兌現承諾

      廣東今日早報!威姆斯公布重要決定,薩林杰或被裁,徐杰兌現承諾

      多特體育說
      2026-01-22 06:40:03
      2026-01-22 17:24:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12168文章數 142547關注度
      往期回顧 全部

      科技要聞

      幾千億只是開胃菜,AI基建還得再砸幾萬億

      頭條要聞

      浙江有人領走88888888馬年紀念鈔 銀行員工:隨機分配

      頭條要聞

      浙江有人領走88888888馬年紀念鈔 銀行員工:隨機分配

      體育要聞

      跑個步而已,他們在燃什么?

      娛樂要聞

      鐘麗緹土耳其高空落淚 與張倫碩擁吻

      財經要聞

      申通快遞創始人被前夫索要股份

      汽車要聞

      配備多塊娛樂屏 極氪8X內飾曝光

      態度原創

      旅游
      教育
      房產
      家居
      公開課

      旅游要聞

      赴一場冰雪之約!看見新疆的冬日浪漫

      教育要聞

      求最大值,中考必考

      房產要聞

      超千畝!三亞基建大幕開啟!崖州灣科技城向北猛擴!

      家居要聞

      法式風情 南洋中古居

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 邯郸市| 99精品国产一区二区三区| 人妻[21p]大胆| 中文字幕av在线| 天门市| 国内自拍无码区在线播放| 亚洲中文欧美日韩在线人| www一区二区www免费| 中文字幕三区| 无套内射视频爽| 久久这里都是精品一区| 亚洲一区二区偷拍精品| 国产精品中文久久久久久久| 通州市| 中文字幕人乱码中文| 多人乱p视频在线免费观看| 国产午夜激无码av毛片| 亚洲午夜精品久久久久久抢| 亚洲日韩每日更新| 久久熟| 亚洲天堂网色图伦理经典| 亚洲成av人片一区二区| 厨房掀起裙子从后面进去视频 | 99精品在线观看| 国产乱子伦视频在线播放| 亚洲中文字幕高清| 日本黄网站三级三级三级| 亚洲欧美偷拍另类a∨| 久久人妻精品白浆国产| 久久视频在线视频| 极品美女aⅴ在线观看| 丁香六月婷婷综合激情欧美| 蜜臀99| 国产高清在线精品一区免费| 内射后入在线观看一区| 鲁鲁狠狠狠7777一区二区| 中文字幕日韩国产精品| 九九综合色| 中文字幕乱码亚洲美女精品| 国产午夜亚洲精品国产成人| 亚洲成a人片在线观看日本|