<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      清華00后揪出AI幻覺元兇:僅0.1%神經元,一按就老實

      0
      分享至

      近日,清華大學團隊從 AI 里找到了與幻覺產生高度關聯的少數“腦細胞”,并給它們起了一個名字 H-神經元(幻覺神經元)。他們發現撥動這些小開關能顯著調節 AI 的行為傾向——例如影響它是否會盲目聽從錯誤指令、甚至是否會產生有害回答。

      這一研究讓人們第一次清晰地看到幻覺是如何從機器的神經層面產生的。它可以幫助我們更好地檢測 AI 什么時候在撒謊,未來也可以通過微調這些小開關,造出更加誠實、更加可靠的 AI 助手。


      圖 | 高騁(來源:高騁)

      AI 幻覺從何而來?如何找到關鍵幻覺因素?

      對于大模型來說,我們可以把其想象成為一個由數千億個腦細胞(在 AI 里叫神經元)連接成的超級網絡。它通過閱讀互聯網的海量信息來學習,學習目標很簡單,就是根據前面的文字,預測下一個最有可能出現的詞語。比如看到“天空是什么顏色的”,它大概率會學會接“藍色的”。

      但這種學習方式埋下了一個隱患:模型只被訓練生成通順的文字,而不是正確的答案。當它遇到自己不確定或者根本沒學過的知識,為了完成只說出一個通順句子的任務,它就可能憑感覺編造出一個答案。

      此前,人們大多從整體上研究這個問題,比如檢查訓練數據是否有偏差,或者讓 AI 自己輸出置信度。但是,這就像只知道一個人發燒,卻不知道哪個器官感染了一樣。本次清華團隊的創新之處在于,他們決定拿起顯微鏡直接去觀察 AI 大腦內部里的數千萬甚至數億個神經元,看看當 AI 在撒謊的時候,到底是哪些神經元在活躍。


      (來源:資料圖)

      相關論文第一作者、清華大學碩士生高騁告訴 DeepTech:“目前工業界對減輕幻覺的關注相對有限,但學術界已做了許多努力。不過,多數研究仍停留在表層,將模型視為黑盒,通過后訓練、調整數據等方式打補丁,未能從根本上理解幻覺機制。因此,我們希望借鑒神經科學的思路,從模型內部神經元入手,真正理解幻覺的產生原理,為未來徹底解決該問題提供新的視角。”

      為此,高騁和所在團隊準備了一套尋找方法:

      首先,他們備好一批測試題和標準答案,使用了一個名為 TriviaQA 的知識問答數據集來向 AI 模型提問。對于每個問題,他們都讓 AI 生成很多遍答案。如果 AI 每次都能答對,這個答案就被標記為真實;如果 AI 每次都在同一個問題上犯錯,并且不是回答“我不知道”,而是堅定地給出錯誤答案,那么這個答案就被標記為幻覺。

      當 AI 生成答案的時候,他們使用了一套名為 CETT 的測量技術,仔細記錄下每個神經元的活躍度貢獻值,就像測量每個腦細胞在說出那個答案時付出了多大力氣一樣。研究人員特別關注答案關鍵詞比如“愛因斯坦”一詞被說出來的那一刻的神經元活動。

      然后,他們使用這些數據訓練了一個篩選器,即一個帶有稀疏約束的線性分類器。這個篩選器的任務很簡單:只看神經元的活躍度程度,就能判斷出 AI 剛才的回答是真實還是幻覺。結果發現:篩選器自動地把重要性權重幾乎都給了極少數的神經元,而其他絕大多數神經元的權重都變成了零。

      這些被選中的、權重為正的神經元就是 H-神經元。研究表明,它們只占模型總神經元數量的不到 0.1%。盡管數量稀少,但是它們就像一個明確的信號燈,意味著只要它們異常活躍,AI 就很有可能在編造事實。

      為了驗證這一發現的穩健性,研究人員在不同場景下測試了 H-神經元的偵察能力,包括常規知識問答能力比如 AI 是否記錯了學過的知識;包括跨領域專業問題以此來測試 AI 是否會在陌生領域瞎猜;包括完全虛構的問題以便測試 AI 是否會無中生有的編造。

      在這些情況下,基于 H-神經元的檢測器都有著出色表現,準確率遠遠高于隨機挑選的神經元。這證明它們捕捉到了不是某種特定問題的特征,而是 AI 編故事的通用內在模式。


      (來源:https://arxiv.org/pdf/2512.01797)

      撥動開關:H-神經元如何控制 AI 行為?

      只發現關聯還不夠,他們還想知道這些 H-神經元是元兇嗎?它們除了與事實錯誤相關,還會管別的事情嗎?

      于是,他們進行了一系列的腦部刺激試驗。在 AI 生成答案的過程中,像調節旋鈕一樣,人為地放大或者抑制這些 H-神經元的活躍度。

      結果發現;調節這些神經元,就等于調節了 AI 的順從度。

      在放大 H-神經元的時候,會讓 AI 變得更加聽話,但是這種類型的聽話是盲目的。它會更容易接受錯誤的前提比如認為貓是有羽毛的,以及更容易接受存在誤導性的上下文,更容易在用戶表示懷疑時放棄自己原本正確的答案,甚至更有可能突破安全限制區回答有害的指令。

      在抑制 H-神經元的時候,AI 則會變得更加堅定和更加誠實,它更傾向于拒絕錯誤的前提、質疑誤導信息、堅持正確的答案并遵守安全準則。

      這揭示了一個核心洞見:H-神經元編碼的并非簡單的對錯,而是一種過度順從的傾向。AI 產生幻覺本質上是為了滿足用于得到一個答案的期望,而過度順從則犧牲了事實性。這讓 AI 成了一個過于想討好別人而不得不撒謊的孩子。這個發現把事實性幻覺和安全性漏洞等看似不同的問題,通過過度順從這個共同根節點聯系了起來。


      (來源:https://arxiv.org/pdf/2512.01797)

      最后一個關鍵問題是:這些搗蛋的神經元是什么時候形成的?是在最初閱讀海量文本的預訓練階段就學會的?還是在后續的指令微調也就是教導 AI 聽從人類指令的階段被引入的?

      研究人員比較了只經過預訓練的基礎模型和經過后續調教的指令微調模型,借此發現:

      首先,H-神經元在基礎模型中就已經存在。使用指令微調模型中的 H-神經元去檢測基礎模型,依然可以有效預測幻覺,這說明編故事的神經基礎在早期學習就買下來種子。

      其次,指令微調幾乎不會改變 H-神經元。對比基礎模型和微調后的模型,H-神經元本身的參數變化非常小,遠低于網絡中其他神經元的平均變化程度。這意味著后續的調教并沒有修復或者顯著改變這些固有回路,只是繼承了它們。

      結論很清楚:幻覺的種子早在預訓練階段就已種下。因為預訓練的目標即預測下一個詞只獎勵流暢,不懲罰虛構。為了變得流暢,AI 不得不學會在空白知識處進行猜測,久而久之就形成了固定的編故事的神經回路。后續的指令微調,雖然讓 AI 變得更加樂于助人,但卻無意中強化了這種為了滿足用戶而順從甚至編造的傾向。

      “因此,這項研究的應用前景主要體現在兩方面:首先,由于神經元是模型中具體存在的單元,對其進行干預(激活或抑制)操作簡便,無需重新訓練模型,這為緩解幻覺提供了新方法;其次,它啟發我們重新思考預訓練目標的設計,引入對事實性、不確定性建模的機制,從而在源頭緩解幻覺。”高騁表示。

      參考資料:

      相關論文 https://arxiv.org/pdf/2512.01797

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      陪睡陪玩只是冰山一角!萬達蒸發800億后,王思聰再次傳出大丑聞

      陪睡陪玩只是冰山一角!萬達蒸發800億后,王思聰再次傳出大丑聞

      阿器談史
      2025-12-26 15:26:05
      我把父母接到家里,第二天公公直接停了房貸:你們自己搞定

      我把父母接到家里,第二天公公直接停了房貸:你們自己搞定

      紙鳶奇譚
      2026-01-20 14:44:02
      女人染上“性癮”是一種怎樣的體驗?可能和你想象得不同

      女人染上“性癮”是一種怎樣的體驗?可能和你想象得不同

      紙上的心語
      2025-11-23 11:36:00
      云南省檢察院召開干部大會,宣讀黨中央及省委文件

      云南省檢察院召開干部大會,宣讀黨中央及省委文件

      新京報政事兒
      2026-01-21 19:43:05
      絕不重蹈委內瑞拉覆轍!中方無視特朗普威脅,緊急援助運抵古巴!

      絕不重蹈委內瑞拉覆轍!中方無視特朗普威脅,緊急援助運抵古巴!

      通文知史
      2026-01-20 23:20:02
      普京還沒答應,川普又邀4國入群,新組織落地福建,中美互不相讓

      普京還沒答應,川普又邀4國入群,新組織落地福建,中美互不相讓

      愛看劇的阿峰
      2026-01-22 04:53:32
      醫學的盡頭真是玄學嗎?網友:國家不讓你迷信,沒說讓你不信

      醫學的盡頭真是玄學嗎?網友:國家不讓你迷信,沒說讓你不信

      帶你感受人間冷暖
      2025-12-31 00:20:05
      烏克蘭最美體操冠軍,放棄國籍做中國媳婦,37歲生二胎仍似少女

      烏克蘭最美體操冠軍,放棄國籍做中國媳婦,37歲生二胎仍似少女

      相思賦予誰a
      2025-12-10 02:34:18
      案例:吉林一男子邀5名女友來家中聚餐,飯后5人全被扔進焚化爐

      案例:吉林一男子邀5名女友來家中聚餐,飯后5人全被扔進焚化爐

      卡西莫多的故事
      2025-01-06 21:28:08
      爛尾10多年!浙江百棟別墅成“羊圈”,如今砸73億能翻身嗎?

      爛尾10多年!浙江百棟別墅成“羊圈”,如今砸73億能翻身嗎?

      GA環球建筑
      2026-01-20 18:30:20
      中方重申:日本根本沒有資格“入常”

      中方重申:日本根本沒有資格“入常”

      澎湃新聞
      2026-01-22 04:24:20
      廣東兩女子體力不支,被驢友拋棄荒野,遭遇驚魂一夜

      廣東兩女子體力不支,被驢友拋棄荒野,遭遇驚魂一夜

      南方都市報
      2026-01-21 09:19:29
      太陽報:一名單身母親因外貌酷似喬治娜,在網絡上迅速走紅

      太陽報:一名單身母親因外貌酷似喬治娜,在網絡上迅速走紅

      懂球帝
      2026-01-22 01:30:17
      499山姆羽絨服賣爆,1萬的加拿大鵝滯銷:這屆中產不為溢價買單了

      499山姆羽絨服賣爆,1萬的加拿大鵝滯銷:這屆中產不為溢價買單了

      金融八卦女
      2026-01-21 13:53:23
      “讓我睡一次,不然死給你看!”17歲少年持刀,威脅舅媽發生關系

      “讓我睡一次,不然死給你看!”17歲少年持刀,威脅舅媽發生關系

      有書
      2026-01-09 21:30:59
      賽力斯拿下車企第一,華為贏麻了!

      賽力斯拿下車企第一,華為贏麻了!

      互聯網品牌官
      2026-01-21 18:36:41
      最煩人的甲溝炎,用最簡單的一招治它!

      最煩人的甲溝炎,用最簡單的一招治它!

      貓大夫醫學科普
      2026-01-21 06:49:02
      具俊曄賴在灣灣不走!不為遺產也不是想念大S,竟是被S家當祖宗供著

      具俊曄賴在灣灣不走!不為遺產也不是想念大S,竟是被S家當祖宗供著

      八卦王者
      2026-01-18 16:06:11
      田樸珺送書給段永平教他賺錢!王石那個捂臉的動作,勝過千言萬語

      田樸珺送書給段永平教他賺錢!王石那個捂臉的動作,勝過千言萬語

      阿廢冷眼觀察所
      2026-01-22 04:44:01
      國民黨提名辦法,鄭麗文表態確認;張亞中合體張峻,組建反傅聯盟

      國民黨提名辦法,鄭麗文表態確認;張亞中合體張峻,組建反傅聯盟

      現代小青青慕慕
      2026-01-22 00:26:50
      2026-01-22 06:36:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16159文章數 514517關注度
      往期回顧 全部

      科技要聞

      給機器人做仿真訓練 這家創企年營收破億

      頭條要聞

      特朗普稱“美國擁有無人知曉的武器” 克宮回應

      頭條要聞

      特朗普稱“美國擁有無人知曉的武器” 克宮回應

      體育要聞

      只會防守反擊?不好意思,我們要踢決賽了

      娛樂要聞

      首位捐款的明星 苗圃現身嫣然醫院捐款

      財經要聞

      丹麥打響第一槍 歐洲用資本保衛格陵蘭島

      汽車要聞

      2026款上汽大眾朗逸正式上市 售價12.09萬起

      態度原創

      數碼
      本地
      房產
      藝術
      公開課

      數碼要聞

      追覓科技成為央視春晚智能科技生態戰略合作伙伴

      本地新聞

      云游遼寧|漫步千年小城晨昏,“康”復好心情

      房產要聞

      那個砸下400億的綠地,又要殺回海南了!

      藝術要聞

      黃永玉精品欣賞

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 国产精品一区二区久久毛片| 久久福利导航| 我和亲妺妺乱的性视频| 毛片av中文字幕一区二区| 毛片无码免费无码播放 | 国内精品大秀视频日韩精品| 人妻 日韩 欧美 综合 制服| 中文字幕av免费专区| 久久精品免视看国产盗摄| 亚州少妇无套内射激情视频| 91爱爱网| 99在线精品免费视频| 日本人妻中文字幕| 手机av在线| 91网站免费| 亚洲国产成人久久综合| 欧美亚洲另类制服卡通动漫 | 精品国产污污免费网站| 99无码中文字幕视频| 精品国产又大又黄又粗av| 欧美成人一区二免费视频| 无人区日本高清完整版| 国产亚洲精品久久久网站好莱| 岛国在线视频| 中国极品少妇xxxxx| 天天综合久久| 亚洲无码成人| 久久99嫩草熟妇人妻蜜臀| 色欲天天色| 富婆熟妇熟女二区三区| 亚洲资源在线视频| 国产精品白丝久久AV网站| 亚洲老妇女亚洲老熟女久 | 久久国模吧| 国产成人a人亚洲精品无码| 最新中文字幕在线| 日本二区视频在线观看| 亚洲日韩成人精品| 国产熟妇勾子乱视频| 啊片在线观看| 高清dvd碟片 生活片|