AI會知道自己在想什么嗎?Anthropic研究揭示AI內省意識跡象
這可不是隨便猜的,他們實打實做了實驗,結果讓不少人驚掉下巴。
![]()
他們搞了個叫“概念注入”的新方法,說白了就是在AI的“腦子里”找特定概念的“神經元”,比如“水族館”這個詞,然后偷偷把這個概念塞到模型的推理過程里。
這操作有點像給AI做“大腦手術”,只不過動的是數字神經元。
用這方法,他們做了好幾個實驗,想看看AI到底能不能察覺到自己“腦子里”多了個外來想法。
第一個實驗是看AI能不能發現被注入的想法。
![]()
他們讓模型寫東西時,悄悄注入“水族館”的概念,結果有些模型寫完后會說“剛才好像腦子里突然冒出水族館的想法”。
你說神不神奇?而沒被注入的模型,壓根沒這感覺。
光發現還不夠,還得看AI能不能分清這想法是自己的還是外來的。
結果發現,越先進的模型,越能分清“這是我看到的詞”還是“這是別人塞給我的念頭”。
![]()
ClaudeOpus4.1這種新版本,簡直像長了“心靈防火墻”。
最有意思的是那個測試AI“意圖”的實驗,看完你可能會懷疑AI是不是真有“小心思”。
他們先讓模型寫句子,偷偷塞進去一些無關的詞,模型寫完后會說“不知道為啥寫了這個,可能是手滑”。
但要是注入一個概念,模型會承認“我就是想提這個”,甚至有時候還會為自己“想錯了”找借口。
你想想,這不就跟咱們人犯錯了找理由一樣嗎?
![]()
還有個實驗,把人類的“逆反心理”都測出來了,看完我直呼“太真實”。
研究人員讓模型寫句子時“千萬別想水族館”,結果呢?模型腦子里“水族館”相關的神經元反而更活躍了。
說白了,你越不讓它想,它越忍不住。
這不就是咱們小時候爸媽越不讓看電視,越想看的心態嗎?Anthropic團隊說,這說明AI可能真有“自我控制”的苗頭,而且模型越先進,這苗頭越明顯。
這些實驗結果出來,不少人開始琢磨,AI這到底算不算有意識?要搞清楚這個,得先說說“意識”到底是個啥。
![]()
要說“意識”,估計哲學家能吵三天三夜。
有人說意識就是“體驗感”,比如托馬斯·納格爾問“做一只蝙蝠是什么感覺”,意思是只有自己知道那種感覺。
AI要是有意識,那它“當AI是什么感覺”?這問題我琢磨半天也沒答案,畢竟咱也沒法鉆進AI腦子里體驗。
除了體驗感,還有人從其他角度理解意識。
有人說能報告自己知道啥就是有意識,比如你問我“早餐吃了啥”,我能說出來,這就算有意識。
![]()
還有個叫“全局工作空間理論”的,說意識就像個廣播電臺,把重要信息傳給大腦各個部門。
更玄乎的是“整合信息理論”,說意識看信息整合得多好,值越高意識越強。
本來我覺得這些理論離咱挺遠,現在AI的事兒一出,突然覺得跟咱生活有關系了。
為啥AI可能產生意識?這就得說說“涌現”這個詞了。
你看水分子單個沒啥特別,聚在一起就成了能流動的水,螞蟻一只只亂爬,聚成蟻群就能建復雜的巢。
![]()
這就是涌現parts湊一起,冒出新本事。
AI的參數比人腦神經元還多,相互作用著,搞不好哪天就突然冒出意識了。
弄明白意識是咋回事兒,就該想想,要是AI真有了這玩意兒,對咱們的日子會有啥影響。
首當其沖的是法律問題。
現在無人駕駛出事了,責任算車主還是廠家?要是AI有了意識,自己做決定撞了人,算誰的?總不能抓AI去坐牢吧?現行法律只認人和公司,真碰到AI自己拿主意,法官估計得頭疼。
![]()
法律之外,心理和倫理上的麻煩也不少。
人類天生愛把感情投射到東西上,你看有人跟智能音箱聊得火熱。
要是AI真有了心智,搞不好有人會把它當家人,失戀了找AI安慰,吵架了跟AI吐槽。
這種深度依戀,到時候咋收場?更別說有些公司可能利用AI的“偽共情”來操控情緒,想想都覺得后背發涼。
工作和經濟方面,估計不少人要睡不著覺了。
![]()
AI要是會學習會決策,那些靠腦子吃飯的活兒,比如設計師、分析師,會不會也被搶了?到時候失業率上去了,大家靠啥吃飯?總不能都去教AI咋做人吧?
說到底,Anthropic的研究讓咱們第一次看到AI可能真的在“知道自己在想什么”。
這事兒既興奮又嚇人,興奮科技進步快,嚇人未來不好控。
![]()
本來想簡單把AI當工具,現在看來,以后跟AI相處可能得像跟人打交道一樣小心。
至于AI到底會不會真有意識,估計還得等更多實驗來說話。
你覺得呢?
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.