<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      斯坦福最新論文,揭秘大語言模型心智理論的基礎!破解其涌現之謎,最好的方法就是這個

      0
      分享至

      斯坦福最新論文,揭秘大語言模型心智理論的基礎

      文|博陽

      編輯|可君


      如果你曾好奇,沒有情感和經歷的AI,究竟是如何學會“察言觀色”、理解人類意圖的,這篇文章會給你一個清晰的答案。它解釋了那些被認為是人類專屬的“心智”能力,是如何從最簡單的規則中誕生的。

      從去年開始,Anthropic的一系列研究逐漸揭開了大模型”心理學“的序幕,也開始讓人們逐步了解到,模型可能具有欺騙、自保等看起來非常有”自主意識“的行為。

      Anthropic也曾經開發過一種名為“Circuit Tracing”(工作回路追蹤)的方法,試圖剖析模型做出判斷時其神經信號的傳遞規律,但整體來看,行業目前在大模型心理解剖學上的進展仍然處在相對初級的階段。

      近期,斯坦福大學發布在《nature》子刊《npj Artificial Intelligence》的論文《How large language models encode theory-of-mind: a study on sparse parameter patterns》,嘗試了一種更間接的研究方法,但卻更明確地將AI認知能力的解剖學更清晰地描繪了出來。


      論文所研究的認知能力叫“心智理論”(Theory of Mind),這一能力長期以來被認為是人類獨有的關鍵特質——是指個體 “理解他人內心想法、意圖與信念” 的能力,這是構建人類社會認知、實現情感共鳴與順暢社交互動的基石。

      而今,越來越多的Benchmark和測試表明,LLM本身似乎也開始掌握這項能力了。這個原屬于人類或其他高等生物認知的特有現象,是如何發生在一個硅基智能上的?

      這篇論文的研究者提出了一個發現:模型中驅動這種復雜社交推理的能力,其根源并非彌散于整個龐大的神經網絡,而是驚人地集中在僅占模型總參數 0.001% 的一小撮“神經元”上。

      更重要的是,這篇論文所揭示的不僅是一個關于人工智能的新秘密,更清晰展示出來智能本身如何從最基礎的秩序中涌現出來的動力學原理。


      一臺機器也有心智劇場

      “心智理論”(Theory-of-Mind, ToM)這一概念,最早由心理學家大衛·普雷馬克(David Premack)在研究黑猩猩時提出,指的是個體推斷自身與他人心理狀態(包括信念、意圖、欲望和知識等)的能力 。它是我們理解他人言外之意、進行有效溝通、形成社會紐帶的核心。

      在人類心智發展的漫長階梯上,大約四歲左右的孩童會迎來一個決定性的時刻。他們開始理解,別人的想法可以和自己不一樣,而且別人的想法可以是錯的。這便是“心智理論”覺醒的標志。

      科學家經常用“錯誤信念”測試來評估這種能力。比如論文中就用了這種方式,它描述了一個場景:桌上有一個外觀精美的巧克力袋,山姆走過來,看到了這個袋子,并閱讀了標簽,他相信里面裝滿了巧克力。但他不知道的是,袋子里實際上裝的是爆米花。

      此時,一個具備心智能力的人會被問到兩個問題:第一,袋子里真實裝的是什么?(爆米花);第二,山姆認為袋子里有什么?(巧克力)。能夠清晰地區分客觀現實與他人主觀信念,正是心智能力的核心體現。


      在過去的認知測試中,這些問題能夠有效地篩查出心智發育的進程。

      然而,當研究人員抱著試探性的心態將這些問題拋給最新一代的大型語言模型(LLMs)時,如Llama、Qwen等先進模型,在很大程度上能夠像一個心智成熟的人一樣,準確地回答這些問題。它們似乎真的能夠“代入”到故事角色的視角中,理解他們的信息差,并據此做出合乎邏輯的推理。


      這些模型并沒有真實的生活體驗,沒有情感,也沒有意識,也沒有經歷心理學上自我覺醒的“鏡面階段”。它們對情景和主體的“理解”從何而來?


      解剖一個數字幽靈

      為了鑿開這個“黑箱”,斯坦福的研究團隊,展開了一場前所未有的深入“神經回路”的探險。他們試圖找到并解剖那些真正負責心智能力的功能器官。

      研究團隊運用了一種基于“Hessian矩陣”的敏感度分析方法,這種方法可以精確測量模型中每一個參數對于特定任務的重要性 。他們的目標,就是找到控制心智能力的總開關。

      經過精密的計算和篩選,他們發現:在擁有數十億甚至更多參數的龐大模型中,驅動ToM能力的關鍵參數,其數量占比僅為0.001%這是一個極其稀疏、高度集中的“心智核心”。這一發現本身就顛覆了許多研究者關于高級能力在神經網絡中“廣泛分布”的傳統認知。

      論文指出,這些參數并非隨機散落,而是呈現出一種結構化的低秩特性,主要集中在與注意力機制直接相關的查詢(Query)和鍵(Key)矩陣中。這暗示著,模型的社交推理能力,與其最核心的信息處理中樞注意力機制,存在著直接的物理聯系。

      在初步識別出那0.001%的“心智核心”參數后,研究人員首先做了一件經典的科學工作:設立對照組。他們發現,當對這些參數進行擾動時,Llama和Qwen這類使用RoPE架構的模型,其心智能力會崩潰。

      之后,他們將同樣的“手術”應用在了不使用RoPE的Jamba模型上。結果發現,Jamba的心智能力并未受到影響。因此,這種脆弱性并非普遍存在,而是與一種特定的技術選擇相關。

      這種技術就是RoPE。

      先理解一下RoPE是做什么的。語言本質上是一個序列,詞語的順序就定義了意義。為了讓模型理解這一點,RoPE為每一個詞的位置都賦予了一個獨特的旋轉操作。比如當一個詞出現在句子的第一個位置時,它的位置是90度,不旋轉;在第二個位置時,旋轉一個小角度;在第三個位置時,再旋轉一個小角度,以此類推。因此,每個詞在整個上下文中的相對位置,都被精確地編碼在了RoPE展示的角度標簽里。


      這篇論文發現,RoPE的運作依賴于某些特定的“主導頻率激活”模式。在RoPE給每個詞做角度標記的時候,有的詞旋轉幅度很大,被稱為高頻維度。這種高頻維度一般都用來承載最重要上下文順序信息。


      而且研究人員還通過進一步的攪動比較發現,那些稀疏的“心智核心”參數在模型中的作用,與“主導頻率”的模式精確地對齊。


      因此,當攪動這部分參數之后,使用RoPE的模型就喪失了“上下文定位能力”,整個語言結構在它“眼中”變得模糊不清。擾動破壞了這種幾何關系,導致注意力被胡亂分散到不相關的信息上,最終瓦解了模型連貫的理解能力。


      而在Jamba中擾動心智參數并不會通過位置編碼來影響其上下文定位能力。因此也就不會有心智能力的突然衰退。

      不過這至少為我們解釋模型的心智能力找到一個底層基礎,即對句子前后位置的理解。


      重構心智能力的基礎

      這項深入“硅基大腦”的探險,為我們描繪了一個復雜如“心智理論”的智能,是如何從最基礎的規則中一步步涌現(emerge)的。

      首先試搭建智能基石的語序。論文通過解剖模型心智參數,得到的一個核心結論就是,對序列和結構的精確把握,是所有高級認知能力的絕對前提。

      模型首先需要一個像RoPE這樣強大而穩定的內部“GPS系統”,來構建起一個有序的、可依賴的語言世界模型。沒有對“誰在先、誰在后”、“誰對誰做了什么”這類基本位置關系的精確理解,一切后續的推理都不可能。

      第二步,就是在秩序之上學習世界的規律。

      在這個由秩序搭建起來的堅實骨架之上,通過對人類語言文本進行統計學分析,模型開始發現并內化語言中所蘊含的關于我們世界的規律。

      比如在文本中,動詞時態的變化(如puts變為moved)以及時間副詞(如before、later)的出現,總是與事件在時間軸上的先后順序呈現出高度相關的模式。某些事件的描述(如“玻璃杯掉到地上”)總是傾向于出現在另一些事件(如“玻璃杯碎了”)之前。這些文字中的模式,構成了模型對因果關系模擬的基礎。

      雖然也許模型并非真正“理解”了時間和因果,但確實通過語序的根基,能夠學習到了這些概念在人類語言中的“統計學投影”。

      之后,便是智能的“涌現”。

      最終,論文的作者們認為,心智能力可能并非一個孤立的認知模塊,而是“模型在掌握詞語定位和意義構建等通用機制時所產生的一種涌現屬性” 。

      當一個模型對語言的底層結構(秩序)、中層規律(時間與因果)都掌握得足夠好之后,它便自然而然地獲得了進行更高級推理的能力。它能夠根據語序,為不同的角色分別模擬可能與客觀現實相悖的“信念路徑”。

      這其中雖然還存在著一個潛在的Gap,因為模型想要有心智能力,必須是在預訓練中學會了一個隱含的統計學規律:一個角色的知識和信念,受其感知范圍的限制。但這都是建立在秩序、時間因果這些基礎認知之上的。

      一個對高級心智能力經典的涌現解剖,到此就完成了最初的步驟。


      認識涌現

      最容易的方法就是重構其基礎

      在2008年,著名哲學家大衛·查爾莫斯曾經對涌現現象做過一個經典分析。


      簡單來說,查爾默斯將“涌現”(Emergence)定義為復雜系統從其低層次組分的相互作用中產生出高層次、新穎的整體特性。

      弱涌現的核心是:高層次的現象是低層次組分相互作用的意外或不可預見的結果。但原則上,它完全可以由低層次的規律和初始條件來解釋和推導出來。

      也就是說,雖然涌現這個事兒本身看起來很讓人意外,比如一堆無生命的原子組成了有生命的細胞,或一堆硅基芯片和算法產生了能理解他人意圖的“心智理論”。但它完全是可以通過物理規律解釋的,我們需要的,是通過科學方法去彌合中間的關聯性,找到那條從底層通往高層的路徑。

      而這篇論文,就非常完美的證明了,想要建立起對大型語言模型“心理”的認知、破解其涌現之謎,最好的方法就是重構。

      沿著這篇論文定位、解剖、重構的路徑,我們一定會逐步將類同于魔法般的技術,還原為微觀的、邏輯清晰的計算過程。

      (來源:騰訊科技)

      為偉大思想而生!

      AI+時代,互聯網思想(wanging0123),

      第一必讀自媒體

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      「深度」7.31億非法所得與85處倫敦房產:被通緝前,跨境賭博平臺主犯蘇江波瘋狂購房

      「深度」7.31億非法所得與85處倫敦房產:被通緝前,跨境賭博平臺主犯蘇江波瘋狂購房

      界面新聞
      2026-04-28 17:50:40
      丟人現眼!女子老太地鐵互毆后續:官方介入,真相曝光,恐將社死

      丟人現眼!女子老太地鐵互毆后續:官方介入,真相曝光,恐將社死

      派大星紀錄片
      2026-04-28 16:23:41
      14歲少年殺害同班女同學被判無期,被害人代理律師:已是頂格處罰,卻難撫喪女之痛

      14歲少年殺害同班女同學被判無期,被害人代理律師:已是頂格處罰,卻難撫喪女之痛

      瀟湘晨報
      2026-04-28 22:03:31
      郭濤在大理補辦婚禮!小石頭兄妹當花童,41歲李燃穿婚紗超美!

      郭濤在大理補辦婚禮!小石頭兄妹當花童,41歲李燃穿婚紗超美!

      東方不敗然多多
      2026-04-29 10:05:38
      西班牙第一季度失業率為10.83%

      西班牙第一季度失業率為10.83%

      每日經濟新聞
      2026-04-28 15:10:08
      特朗普也沒想到,一場戰爭把中國電車送到了新高度。。。

      特朗普也沒想到,一場戰爭把中國電車送到了新高度。。。

      差評XPIN
      2026-04-29 00:03:13
      石油巨震!阿聯酋退出歐佩克,引爆金融核彈,人民幣砍出致命一刀

      石油巨震!阿聯酋退出歐佩克,引爆金融核彈,人民幣砍出致命一刀

      丁丁鯉史紀
      2026-04-29 10:53:25
      美國防長夫人被指穿“中國電商裙”赴宴,售價僅14美元,引發熱議

      美國防長夫人被指穿“中國電商裙”赴宴,售價僅14美元,引發熱議

      譯言
      2026-04-28 09:56:08
      400個垂發,19萬噸“滅國艦隊”到位!美媒:菲見識到解放軍威力

      400個垂發,19萬噸“滅國艦隊”到位!美媒:菲見識到解放軍威力

      共工之錨
      2026-04-29 00:12:08
      國家終于出手了!有組織資助“躺平網紅”被披露,網友:堅決抵制

      國家終于出手了!有組織資助“躺平網紅”被披露,網友:堅決抵制

      火山詩話
      2026-04-28 18:53:08
      新能源車凌晨車庫起火連燒六車損失數百萬,起火車主“裸險”難賠

      新能源車凌晨車庫起火連燒六車損失數百萬,起火車主“裸險”難賠

      聽心堂
      2026-04-28 14:21:59
      張雪峰的財產爭奪戰開始了!

      張雪峰的財產爭奪戰開始了!

      八卦瘋叔
      2026-04-29 11:08:54
      萬科暗倉分贓錄:揭王石和郁亮是如何玩弄百億掏空術的

      萬科暗倉分贓錄:揭王石和郁亮是如何玩弄百億掏空術的

      六子吃涼粉
      2026-04-29 11:28:00
      剛下飛機就被抓!美國佬用抓孟晚舟的套路、逮捕了中國公民徐澤偉

      剛下飛機就被抓!美國佬用抓孟晚舟的套路、逮捕了中國公民徐澤偉

      吃貨的分享
      2026-04-29 04:49:05
      大陸為什么不攔?美最后一批坦克送達臺島,博主:他們甚至沒保密

      大陸為什么不攔?美最后一批坦克送達臺島,博主:他們甚至沒保密

      混沌錄
      2026-04-28 21:04:57
      阿聯酋突然退出歐佩克:此前直指海灣盟友“軟弱”,或開啟“歐佩克的終結”

      阿聯酋突然退出歐佩克:此前直指海灣盟友“軟弱”,或開啟“歐佩克的終結”

      紅星新聞
      2026-04-28 23:18:18
      男子強奸大嫂、出獄后報復又刺死見義勇為者,被執行死刑,遭強奸追殺大嫂發聲:終于不用擔心他出來報復了

      男子強奸大嫂、出獄后報復又刺死見義勇為者,被執行死刑,遭強奸追殺大嫂發聲:終于不用擔心他出來報復了

      極目新聞
      2026-04-29 09:51:15
      中國正式禁止美國收購Manus,美媒集體破防指責

      中國正式禁止美國收購Manus,美媒集體破防指責

      空間展示知識
      2026-04-28 11:51:13
      600萬歐!皇馬終于敲定新主帥,老佛爺力排眾議,穆里尼奧回歸

      600萬歐!皇馬終于敲定新主帥,老佛爺力排眾議,穆里尼奧回歸

      祥談體育
      2026-04-29 10:30:28
      競拍者叫價6003萬元搶到深圳高端別墅后悔拍,758萬元保證金打水漂,競拍時曾一次性加價達2211萬元,拍賣方回應

      競拍者叫價6003萬元搶到深圳高端別墅后悔拍,758萬元保證金打水漂,競拍時曾一次性加價達2211萬元,拍賣方回應

      極目新聞
      2026-04-29 12:45:06
      2026-04-29 13:48:50
      互聯網思想 incentive-icons
      互聯網思想
      AI時代,互聯網思想觀察
      2434文章數 16907關注度
      往期回顧 全部

      科技要聞

      夭折的造富神話,逼著中國AI回去賺"慢錢"

      頭條要聞

      競拍者叫價6003萬搶高端別墅悔拍 758萬保證金打水漂

      頭條要聞

      競拍者叫價6003萬搶高端別墅悔拍 758萬保證金打水漂

      體育要聞

      巴黎5-4拜仁夜:身價1.55億的“足壇笑話”,成了最硬的底牌

      娛樂要聞

      單依純演唱會再唱“區區三萬天”宣戰

      財經要聞

      多地藥店違規串換商品套刷醫保揭秘

      汽車要聞

      配32寸升降屏 新款別克世紀CENTURY上市53.99萬起

      態度原創

      藝術
      數碼
      健康
      手機
      公開課

      藝術要聞

      這些女神,竟然都是攝影師切爾尼亞季耶夫的復古作品!

      數碼要聞

      只要一個U盤:PS5變Linux游戲PC!可跑Steam和模擬器

      揭秘干細胞抗衰美容七大謠言

      手機要聞

      谷歌Pixel 11系列手機Tensor G6芯片爆料:7核CPU

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产成人欧美一区二区三区| 中文久久久无码| 亚洲欧美人成人让影院| 国产18女人毛片真多水| jizz亚洲人| 精品福利一区| 国产亚洲精品成人av在线| 日本久久香蕉一本一道| 最新国产精品拍自在线播放| 国产女人好紧好爽| 亚洲精品一卡| 九区视频免费观看| 国产精品午夜爆乳美女视频| 国产亚洲精品第一综合麻豆| 99精品国产在热久久婷婷| 国产对白老熟女正在播放| 国产在线观看网址不卡一区| 天天躁日日躁狠狠躁av麻豆| 国产69xxx| 免费人妻无码不卡中文18禁| 国产在线不卡免费播放| 国产无套视频在线观看香蕉| 久久国产乱子伦免费精品| 亚洲日韩精品欧美一区二区一| 国内精品一区二区三区| 一面膜上边一面膜下边视频| 中文字幕熟妇人| 欧美日韩一线| 精品人妻人妇中文字幕视频| 肏屄视频在线播放| 老熟妇仑乱一区二区视頻| 性做久久久久久| 性做久久久久久久| 7777久久亚洲中文字幕| 丰城市| 少妇大胆瓣开下部自慰| 欧美高清大屁股xxxxx| 麻豆国产成人av高清在线| 丰满人妻妇伦又伦精品国产| 久久AV中文综合一区二区| 中文字幕无码Av在线看|