![]()
新智元報道
編輯:元宇
【新智元導讀】MIT神經科學家Ev Fedorenko通過掃描約1400人的大腦,識別出一個類似「生物版ChatGPT」的語言網絡,它不負責思考或情緒,只專注于將詞語與意義映射、拼成句子,該研究揭示了語言與思維的分離,讓我們重新審視大腦中隱藏的奧秘。
如果告訴你:你的大腦中正跑著一個「生物版ChatGPT」,你會相信嗎?
這不是打比方,而我們的大腦中真有這樣一套專門用來處理語言的神經系統:
它不負責思考、也不負責情緒,只負責一件事——把詞和意義對上號、再把它們拼成句子。
這個系統被神經科學家Ev Fedorenko稱作「語言網絡」(language network)。
大腦天生的LLM系統
很多人可能會有這種感覺:語言和思考是同一過程,找詞的過程本身就是思考。
但人類的語言和思維是一回事嗎?
語言究竟是思維的核心,還是一個完全獨立的過程?
對此,Fedorenko提出了一個有點反直覺的觀點:
語言不等于思考,它更像是思考的「接口」和「外包裝」。
對許多人來說,找到合適的詞本身就是思考的重要組成部分,而不是某個獨立系統的產出。
她把這個獨立于思考之外的專門系統稱為「語言網絡」,用來映射詞語與其意義之間的對應關系。
Fedorenko將之想象成一個加強版的解析器:
「它就像一張地圖,告訴你大腦里哪一塊地方存著哪一類意義,也好比一個加強版的解析器,幫我們把語言拼起來。」
至于真正的思考和有趣的東西,則全部發生在這個語言網絡之外。
事實上,早在ChatGPT出現之前,過去的15年里Fedorenko一直在收集人類大腦中語言網絡的證據,并且發現它和大模型(LLM)之間有不少相似之處。
在某些意義上,我們確實隨身攜帶著一個「生物版的ChatGPT」:一個不具備心智的語言處理器。
Fedorenko的研究,也許會讓人覺得有一些安慰:一臺機器雖然可以生成一段流暢的文字,但是它還是不會思考。
在麻省理工學院的實驗室里,Fedorenko已經花了15年時間積累關于語言網絡的生物學證據。
不同于大模型,人類的語言網絡不會把詞隨便串成聽起來像那么回事的句子。
它更像是連接外部輸入(聽到的、看到的、甚至手語)和大腦其他區域意義表征(如情景記憶、社會認知,而LLM并沒有這些能力)之間的翻譯器。
而且人類的語言網絡并不大,如果把相關組織都聚在一起,只有一顆草莓大小。
雖然很小,一旦它受損影響卻十分巨大。
比如,受損的語言網絡會導致各種失語癥,這種情況下人的復雜思維依然存在,卻被困在無法表達的腦中;有時甚至連別人說的詞都難以區分。
![]()
Fedorenko在MIT與博士后研究員Andrea de Varda (左) and Halie Olson (右)
掃描1400人大腦
她發現了人腦中的「語言網絡」
Fedorenko上世紀80年代在蘇聯長大,自幼便對語言萌發了興趣。
她在母親的要求下,學會了俄語、英語、法語、德語、西班牙語和波蘭語六種語言。
成績優異的她最終獲得了哈佛大學全額獎學金。
她在哈佛大學主修語言學,但在學習過程中,她發現了語言學的局限性。
「這些語言學課很有趣,但更像是在解謎,而不是在解釋現實世界到底是怎么運作的。」
于是她又學習了心理學。
2002年,她從哈佛大學畢業,獲得心理學與語言學學士學位。
隨后,Fedorenko進入麻省理工學院(MIT)攻讀認知科學與神經科學的研究生課程,并于2007年獲得博士學位。
在此期間,她開始與Nancy Kanwisher合作,后者首次發現了梭狀回臉區,這個區域專門負責識別人臉。
Fedorenko想找到語言在大腦中的對應區域,但當時這方面的研究基礎相當薄弱。
在對大約1400名受試者的大腦掃描中,Fedorenko識別出一個普遍存在的語言網絡,她將之定義為「始終負責語言計算的組織」。
在不斷累積的研究成果之后,2024年Fedorenko在《Nature Reviews Neuroscience》上發表了一篇綜述。
她將人類語言網絡定義為一種「自然類別」——一個天然、獨立成型、專門處理語言的功能單元,存在于「每一個典型的成年人腦中」。
![]()
Fedorenko辦公室里的三個大腦模型突出了語言網絡。從上到下:紫色的是Laura Bundesen的刺繡作品;紅色的是Hannah Small的十字繡;紅色的是3D打印模型。
什么是語言網絡?
在成年人大腦中,有一組核心區域作為一個互相連結的系統,負責計算語言結構。
它們存儲詞語與意義之間的映射關系,以及如何把詞組合成句子的規則。
我們在學習一門語言時,學的就是這些東西。
只要掌握了它們,我們就能很靈活地使用這種「代碼」:只要你會一門語言,就能把一個念頭轉換成詞序。
Fedorenko表示,語言網絡和人類身體的其他器官一樣,是一個自然類別,擁有一個能指出具體位置的物理結構。
比如,梭狀回臉區就是一個可以明確界定的功能單元。
而在語言網絡里,大多數人的額葉皮層都有三個區域,都位于左額葉的側面。
另外,還有幾個區域沿著中顳回的側面分布,那是一大片厚厚的組織沿著整個顳葉延伸。
這些構成了語言網絡的核心部分。
我們可以從多個角度看到它們的整體性。
例如,把人放進fMRI掃描儀里觀察語言處理與對照條件的差異,這些區域總是一起變化。
Fedorenko稱到目前為止掃描了大約1400人,已經能建立一張概率地圖,顯示這些區域最可能出現的位置。
雖然個體之間略有差異,但整體模式非常一致。
在這些額葉和顳葉的大區域里,每個人都會有一些組織在可靠執行語言計算。
語言網絡,與其它已知與語言相關的腦解剖區域,如布羅卡區(Broca’s area)不同。
Fedorenko認為布羅卡區更多是一個發音動作的規劃區域。
它主要是根據語音的聲音表征,計算出說出這些聲音所需的動作,指揮嘴部肌肉的活動,屬于語言網絡下游,接收語言網絡傳過去的結構化語言信息。
語言網絡既不負責發聲,也不負責思考,它在本質上是低層級的感知與運動系統,是與高層級的抽象意義和推理系統之間的接口。
Fedorenko提到人類主要用語言做兩件事。
第一是表達:腦子里蹦出一個模糊的念頭,你再從詞匯庫里(不僅是詞,還有更大的結構和組合方式)挑出一套詞序,把這個念頭表達出來。
然后語言網絡把這個詞序交給運動系統,讓你說出來、寫出來或打手語。
第二是理解:聲音進耳朵或光線進眼睛后,感知系統先把輸入處理成詞序。
然后語言網絡解析它,在詞序里找熟悉的塊,再把它們指向存儲在別處的意義表征。
對于表達和理解,這個系統都是一個不斷更新的「形式到意義的映射倉庫」。
掌握了這套代碼后,我們既能把想法說出來,也能理解別人說的話。
語言網絡的功能是為了交流,那么語言網絡的專門化究竟細到什么程度,是否存在專門對某些話語反應的細胞?
Fedorenko認為語言依賴上下文,因此推測語言網絡系統內的編碼方式會有些分布式,可能存在對語言某些特定方面反應特別強的神經元。
比如,語言網絡區域的一些細胞對書面語和聽覺語言也會有類似反應。
談到語言網絡的模式或者特征,Fedorenko認為大腦的一般物體識別機制和語言網絡的抽象程度非常接近。
這和下顳皮層里儲存物體形狀片段、梭狀回臉區儲存「一張臉的模板」是類似的。
我們利用這些表征來識別現實世界中的物體,但它們本身與我們的世界知識并無直接聯系。
以一句無意義句子「無色的綠色想法憤怒地沉睡」為例,我們可以大致能聽懂它的結構,卻完全無法把它對應到任何現實知識上。
Fedorenko和其他團隊的研究證實,語言網絡對這種無意義句子的反應強度,和對那些有意義的句子幾乎一樣。
這并不意味著語言網絡「笨」,而是說明它確實是個比較淺層的系統。
Fedorenko認同「每個人腦子里都有個LLM」這樣的說法。
她認為語言網絡在很多方面都很像早期的大模型:學習語言的規律,以及詞和詞之間的關系。
在現實中,你可能會遇到一個說話特別流暢的人,但聽了一會兒會發現他們根本沒講什么內容,而他們的大腦也沒任何損傷。
這說明他們只調動了大腦中語言網絡部分的功能,而思考部分完全沒有用上。
雖然,人類語言來自一個類似ChatGPT那樣「無意識」的系統,這聽起來有點不符合直覺。
而且,Fedorenko在研究早期也認為語言是高級思維的核心,但后來她的研究并不支持這一假設。
早在2011年,她已經很清楚,語言網絡的所有部分都高度專門化用于語言。
「對于科學家來說,只能更新認知,繼續向前探索。」
參考資料:
https://www.quantamagazine.org/the-polyglot-neuroscientist-resolving-how-the-brain-parses-language-20251205/
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.