![]()
一項(xiàng)新研究表明,人腦理解口語的過程采用了逐步處理的方式,這與先進(jìn)的AI語言模型的運(yùn)行機(jī)制極為相似。研究人員通過記錄人們聆聽口述故事時(shí)的大腦活動(dòng)發(fā)現(xiàn),大腦反應(yīng)的后期階段與AI系統(tǒng)的深層層級(jí)相匹配,特別是在布羅卡區(qū)等著名的語言區(qū)域中。這一結(jié)果對(duì)長(zhǎng)期以來基于規(guī)則的語言理解理論提出了質(zhì)疑,并得到了新發(fā)布的公共數(shù)據(jù)集的支持,為研究大腦如何形成意義提供了強(qiáng)大的新途徑。
這項(xiàng)發(fā)表在《自然通訊》上的研究由希伯來大學(xué)的阿里爾·戈德斯坦博士領(lǐng)導(dǎo),合作者包括谷歌研究院的馬里亞諾·夏因博士以及普林斯頓大學(xué)的烏里·哈森教授和埃里克·哈姆。研究團(tuán)隊(duì)共同發(fā)現(xiàn)了人類理解語音與現(xiàn)代AI模型處理文本之間的驚人相似性。
科學(xué)家們使用皮層腦電圖記錄技術(shù),追蹤參與者聆聽30分鐘播客時(shí)語言處理過程中大腦活動(dòng)的時(shí)間和位置。他們發(fā)現(xiàn),大腦遵循一個(gè)結(jié)構(gòu)化序列,與GPT-2和Llama 2等大語言模型的分層設(shè)計(jì)高度匹配。
大腦如何隨時(shí)間構(gòu)建意義
當(dāng)我們聆聽別人說話時(shí),大腦并非一次性理解全部含義。相反,每個(gè)詞都會(huì)經(jīng)過一系列神經(jīng)步驟。戈德斯坦及其同事表明,這些步驟在時(shí)間上的展開方式反映了AI模型處理語言的方式。AI的早期層級(jí)專注于基本的詞匯特征,而深層層級(jí)則結(jié)合上下文、語調(diào)和更廣泛的含義。
人腦活動(dòng)遵循了同樣的模式。早期的神經(jīng)信號(hào)與AI處理的早期階段相匹配,而后期的大腦反應(yīng)則與模型的深層層級(jí)保持一致。這種時(shí)間匹配在布羅卡區(qū)等高級(jí)語言區(qū)域中特別強(qiáng)烈,當(dāng)與AI深層層級(jí)關(guān)聯(lián)時(shí),這些區(qū)域的反應(yīng)峰值出現(xiàn)得更晚。
戈德斯坦博士表示:"最令我們驚訝的是,大腦意義的時(shí)間展開過程與大語言模型內(nèi)部的變換序列如此密切匹配。盡管這些系統(tǒng)的構(gòu)建方式截然不同,但兩者似乎都趨向于類似的逐步構(gòu)建理解的方式。"
這些發(fā)現(xiàn)的重要意義
研究表明,人工智能不僅能夠生成文本,還可能幫助科學(xué)家更好地理解人腦如何創(chuàng)造意義。多年來,人們認(rèn)為語言主要依賴于固定符號(hào)和嚴(yán)格的層次結(jié)構(gòu)。這些結(jié)果挑戰(zhàn)了這一觀點(diǎn),轉(zhuǎn)而指向了一個(gè)更靈活和統(tǒng)計(jì)性的過程,其中意義通過上下文逐漸顯現(xiàn)。
研究人員還測(cè)試了傳統(tǒng)的語言學(xué)元素,如音素和詞素。這些經(jīng)典特征在解釋實(shí)時(shí)大腦活動(dòng)方面不如AI模型產(chǎn)生的上下文表示有效。這支持了大腦更多依賴于流動(dòng)上下文而非嚴(yán)格語言構(gòu)建塊的觀點(diǎn)。
語言神經(jīng)科學(xué)的新資源
為了推動(dòng)該領(lǐng)域的發(fā)展,研究團(tuán)隊(duì)已將完整的神經(jīng)記錄和語言特征數(shù)據(jù)集公開。這一開放數(shù)據(jù)集使世界各地的研究人員能夠比較語言理解理論,并開發(fā)出更接近人類思維工作方式的計(jì)算模型。
Q&A
Q1:這項(xiàng)研究發(fā)現(xiàn)了人腦和AI在語言處理上有什么相似性?
A:研究發(fā)現(xiàn)人腦理解口語采用逐步處理方式,與大語言模型的運(yùn)行機(jī)制極為相似。大腦早期神經(jīng)信號(hào)對(duì)應(yīng)AI的早期層級(jí)處理基本詞匯特征,后期大腦反應(yīng)則與AI深層層級(jí)匹配,結(jié)合上下文和更廣泛含義,特別是在布羅卡區(qū)等語言區(qū)域中這種匹配更加明顯。
Q2:這項(xiàng)發(fā)現(xiàn)對(duì)傳統(tǒng)語言理解理論有什么影響?
A:研究結(jié)果挑戰(zhàn)了長(zhǎng)期以來基于規(guī)則的語言理解理論。傳統(tǒng)觀點(diǎn)認(rèn)為語言主要依賴固定符號(hào)和嚴(yán)格層次結(jié)構(gòu),但研究發(fā)現(xiàn)傳統(tǒng)語言學(xué)元素如音素和詞素在解釋實(shí)時(shí)大腦活動(dòng)方面不如AI模型的上下文表示有效,支持了大腦更多依賴流動(dòng)上下文的觀點(diǎn)。
Q3:研究團(tuán)隊(duì)為科學(xué)界提供了什么新資源?
A:研究團(tuán)隊(duì)已將完整的神經(jīng)記錄和語言特征數(shù)據(jù)集公開發(fā)布,創(chuàng)建了一個(gè)開放數(shù)據(jù)集。這一資源使世界各地的研究人員能夠比較不同的語言理解理論,開發(fā)出更接近人類思維工作方式的計(jì)算模型,為語言神經(jīng)科學(xué)研究提供了強(qiáng)大的新工具。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.