來源 | 返樸
撰文 | 路飛
![]()
2025年7月2日,加州大學(xué)圣地亞哥分校神經(jīng)科學(xué)博士生李濟(jì)安在
Nature發(fā)表研究,他從物理學(xué)理論中找到了理解神經(jīng)科學(xué)的奇妙角度——從動(dòng)力系統(tǒng)出發(fā)的公式發(fā)現(xiàn),基于此構(gòu)建了一種結(jié)構(gòu)極簡(jiǎn)、完全數(shù)據(jù)驅(qū)動(dòng)的模型,能夠在無需任何人為假設(shè)的前提下,捕捉復(fù)雜且非最優(yōu)的行為模式,在行為預(yù)測(cè)精度上全面優(yōu)于傳統(tǒng)模型。這為生物體策略行為提供了一種可計(jì)算、可視化且易于理解的抽象結(jié)構(gòu)。
自亞里士多德提出“人是理性的動(dòng)物”這一經(jīng)典論斷,理性便被視作人類行為決策的核心原則。從經(jīng)濟(jì)學(xué)中的“理性人”假設(shè),到?jīng)Q策理論中對(duì)最優(yōu)選擇的追求,諸多思想與研究都暗含著對(duì)人類決策理性的肯定。著名認(rèn)知心理學(xué)家、普林斯頓大學(xué)教授丹尼爾·卡尼曼在其暢銷書《思考,快與慢》中向世人拋出一個(gè)重要問題,“人類究竟有多理性?”有意思的是,雖然諾貝爾獎(jiǎng)中沒有心理學(xué)獎(jiǎng),但是丹尼爾·卡尼曼作為認(rèn)知心理學(xué)家,憑借著對(duì)于人的行為決策方面的研究貢獻(xiàn),于2002年獲得了諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。在日常生活中,人們看似繁雜的決策背后,往往藏著對(duì)成本、收益與風(fēng)險(xiǎn)的權(quán)衡,這種基于理性的判斷貫穿于從日常購物到職業(yè)規(guī)劃的方方面面。
隨著人工智能技術(shù)的飛速發(fā)展,大模型正成為人類決策的重要輔助力量。從金融投資中的風(fēng)險(xiǎn)預(yù)測(cè),到醫(yī)療診斷中的方案推薦,從城市交通的智能調(diào)度,到個(gè)人學(xué)習(xí)計(jì)劃的定制,大模型憑借對(duì)海量數(shù)據(jù)的分析能力和復(fù)雜邏輯的運(yùn)算能力,不斷為人類提出更精準(zhǔn)、高效的最優(yōu)決策路徑,讓理性決策在更多領(lǐng)域得以延伸。比如,AlphaFold因?yàn)閷?duì)蛋白質(zhì)復(fù)雜結(jié)構(gòu)的預(yù)測(cè),獲得了2024年諾貝爾化學(xué)獎(jiǎng)。
然而,人類決策機(jī)制的深層邏輯始終籠罩著一層神秘面紗。為何在相同信息下不同人會(huì)做出迥異選擇?決策過程中理性與直覺如何交織作用?這些問題推動(dòng)著腦科學(xué)、神經(jīng)科學(xué)與心理學(xué)等多學(xué)科展開持續(xù)探索。人工智能的飛速發(fā)展,正在重新激發(fā)人們對(duì)一個(gè)關(guān)鍵問題的關(guān)注:AI能否反過來幫助我們理解大腦?7月2日,加州大學(xué)圣地亞哥分校神經(jīng)科學(xué)博士生李濟(jì)安在Nature發(fā)表研究,嘗試給出答案。
![]()
是“最優(yōu)”的,但不是對(duì)的
如何理解文中提到的微型神經(jīng)網(wǎng)絡(luò)模型,能夠刻畫生物體的策略學(xué)習(xí)過程,進(jìn)而揭示決策行為中隱含的復(fù)雜認(rèn)知機(jī)制?李濟(jì)安先從傳統(tǒng)認(rèn)知模型構(gòu)建娓娓道來。
在心理學(xué)和神經(jīng)科學(xué)領(lǐng)域,研究者常通過計(jì)算模型解析生物體的認(rèn)知過程,如感知、記憶、決策與學(xué)習(xí)機(jī)制。以決策為例,模型可幫助理解個(gè)體如何基于過往經(jīng)驗(yàn),在多個(gè)選項(xiàng)中做出選擇。
傳統(tǒng)認(rèn)知建模方法中,貝葉斯最優(yōu)模型由研究者依據(jù)任務(wù)結(jié)構(gòu)手動(dòng)構(gòu)建,其核心假設(shè)是生物體整合所有可用信息,以概率最優(yōu)方式判斷。例如醫(yī)生診斷時(shí)綜合癥狀、檢驗(yàn)結(jié)果、流行病趨勢(shì)與經(jīng)驗(yàn)積累證據(jù),正是這種不確定信息整合的體現(xiàn),該模型默認(rèn)個(gè)體對(duì)信息和不確定性有最優(yōu)估計(jì)。
另一類典型方法是強(qiáng)化學(xué)習(xí)模型,它假設(shè)人或動(dòng)物通過與環(huán)境互動(dòng),從“獎(jiǎng)勵(lì)”或“懲罰”中學(xué)習(xí)行為策略。比如在老虎機(jī)任務(wù)中,參與者經(jīng)反復(fù)嘗試逐漸偏好中獎(jiǎng)率更高的機(jī)器,這一通過獎(jiǎng)勵(lì)優(yōu)化策略的過程,可由強(qiáng)化學(xué)習(xí)算法模擬其行為價(jià)值更新機(jī)制。
這些模型具有一個(gè)共同特點(diǎn):它們結(jié)構(gòu)簡(jiǎn)潔,參數(shù)量少,比如“學(xué)習(xí)率”(即控制新信息更新速度)和“決策噪音”(即干擾決策的影響因素,反映行為的隨機(jī)性),因此容易解釋和擬合。但恰恰因其簡(jiǎn)潔性以及隱含的最優(yōu)性假設(shè),它們往往難以捕捉真實(shí)生物行為中普遍存在的復(fù)雜性與次優(yōu)性。
例如實(shí)驗(yàn)中觀察到,當(dāng)獎(jiǎng)勵(lì)結(jié)構(gòu)發(fā)生改變后,動(dòng)物常常仍固守之前的選擇偏好——即便新選擇更優(yōu)。這種“固執(zhí)”的行為現(xiàn)象很難被最優(yōu)模型解釋。研究者往往需要在模型中人為增加額外的“慣性”參數(shù),或設(shè)計(jì)特定規(guī)則來擬合實(shí)際行為。然而,隨著需解釋的行為細(xì)節(jié)不斷增多,模型結(jié)構(gòu)會(huì)變得愈發(fā)繁瑣,充滿“補(bǔ)丁式”假設(shè),這不僅容易引入主觀偏見,也使其難以推廣應(yīng)用到其他情景任務(wù)中。
這是傳統(tǒng)認(rèn)知模型一直為學(xué)界所詬病的弊端。
李濟(jì)安從2021年開始著手利用神經(jīng)網(wǎng)絡(luò)研究人的行為決策,他想了解神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)人的行為決策背后的策略是什么。這是對(duì)傳統(tǒng)認(rèn)知模型的直接亮劍,是否存在一種無需預(yù)設(shè)的建模方式,能夠讓模型直接從行為數(shù)據(jù)中“自主發(fā)現(xiàn)”策略?
![]()
李濟(jì)安 | 圖源:本人提供
得益于李濟(jì)安本科期間扎實(shí)的數(shù)理基礎(chǔ),他 從物理學(xué)公式中找到了理解神經(jīng)科學(xué)的奇妙角度——從動(dòng)力系統(tǒng)出發(fā)的公式發(fā)現(xiàn)。
“我是中國(guó)科學(xué)技術(shù)大學(xué)12級(jí)本科生,雖然我本科是生物學(xué)專業(yè),但是科大的學(xué)生在本科期間數(shù)學(xué)和物理都是必修的,數(shù)理基礎(chǔ)比較好,業(yè)內(nèi)人常說我們的數(shù)學(xué)課比其他數(shù)學(xué)專業(yè)的課程還難,我覺得這一定程度上影響了我的思維。”李濟(jì)安表示,“很多時(shí)候?qū)W了這些知識(shí),當(dāng)時(shí)可能沒覺得有用,但是可能在某一瞬間靈光乍現(xiàn),所有學(xué)科是相通的。”
自動(dòng)公式發(fā)現(xiàn)的核心基于符號(hào)回歸技術(shù)。與常見的函數(shù)擬合不同,擬合往往只是用已知函數(shù)形式去逼近數(shù)據(jù),而符號(hào)回歸是在給定的函數(shù)庫(包含對(duì)數(shù)函數(shù)、三角函數(shù)、多項(xiàng)式函數(shù)等)中,通過組合和算術(shù)運(yùn)算生成一個(gè)函數(shù),力求精確擬合輸入輸出數(shù)據(jù)。例如在研究物體的運(yùn)動(dòng)軌跡時(shí),符號(hào)回歸能從物體在不同時(shí)刻的位置、速度等數(shù)據(jù)里,找到描述其運(yùn)動(dòng)規(guī)律的準(zhǔn)確公式,像勻加速直線運(yùn)動(dòng)的位移公式s=v0t+1/2at2就有可能被自動(dòng)發(fā)現(xiàn)。李濟(jì)安通過查閱資料發(fā)現(xiàn),這一原理已經(jīng)廣泛應(yīng)用到物理、工程科學(xué)等領(lǐng)域中。
受此啟發(fā),李濟(jì)安提出了一種新的方法:使用微型循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)作為通用策略學(xué)習(xí)器,對(duì)個(gè)體的行為動(dòng)態(tài)進(jìn)行建模(圖1)。
![]()
圖1 RNN模型概覽 | 圖源:論文
從物理學(xué)中的動(dòng)力系統(tǒng)出發(fā)
循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)是一類專為建模時(shí)間序列數(shù)據(jù)設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其核心優(yōu)勢(shì)在于能通過內(nèi)部的循環(huán)連接機(jī)制,自動(dòng)捕捉數(shù)據(jù)隨時(shí)間推移形成的動(dòng)態(tài)依賴關(guān)系,比如行為序列中前后動(dòng)作的關(guān)聯(lián)規(guī)律。
李濟(jì)安所采用的模型極具精簡(jiǎn)性,僅包含1-4個(gè)神經(jīng)單元。這種輕量化設(shè)計(jì)讓模型在保留對(duì)復(fù)雜行為模式足夠表達(dá)能力的同時(shí),維持了較強(qiáng)的可解釋性,使得深入分析其內(nèi)部神經(jīng)元的活動(dòng)機(jī)制與決策邏輯成為可能。
李濟(jì)安的核心研究問題是:這種結(jié)構(gòu)極簡(jiǎn)、完全數(shù)據(jù)驅(qū)動(dòng)的模型,是否能夠在無需任何人為假設(shè)的前提下,捕捉復(fù)雜且非最優(yōu)的行為模式——比如人們常常懶得換、愛用老辦法(“偏好保持”)或在“嘗鮮”和“吃老本”之間反復(fù)權(quán)衡(“探索-利用”權(quán)衡)等,它是否能夠在多樣化任務(wù)中超越傳統(tǒng)強(qiáng)化學(xué)習(xí)或混合策略模型的表現(xiàn)?
實(shí)驗(yàn)結(jié)果顯示,這些微型循環(huán)神經(jīng)網(wǎng)絡(luò)模型在六類經(jīng)典獎(jiǎng)勵(lì)學(xué)習(xí)任務(wù)中(涵蓋人類、猴子、小鼠、大鼠的行為數(shù)據(jù))表現(xiàn)出色,在行為預(yù)測(cè)精度上全面優(yōu)于傳統(tǒng)模型(如圖2所示),并可與更大規(guī)模的循環(huán)神經(jīng)網(wǎng)絡(luò)相媲美(如圖3所示)。這表明,即便使用高度壓縮的網(wǎng)絡(luò),它依舊能學(xué)會(huì)并舉一反三地模仿各種復(fù)雜決策,展現(xiàn)出用模型理解動(dòng)物和人類的行為的巨大潛力。
![]()
圖2 RNN在動(dòng)物任務(wù)中的表現(xiàn) | 圖源:論文
![]()
圖3 蒸餾模型的表現(xiàn) | 圖源:論文
這些僅有1–4個(gè)神經(jīng)元構(gòu)成的RNN模型在行為預(yù)測(cè)上不僅準(zhǔn)確,而且具備很強(qiáng)的可解釋性。“在模型中,動(dòng)物行為的決策隨時(shí)間變化,我突然一瞬間就想到了物理學(xué)中研究小球的運(yùn)動(dòng),需要記錄運(yùn)動(dòng)的方向、時(shí)間、距離等等。于是我就用物理學(xué)中的動(dòng)力系統(tǒng)的分析方法,用一張圖來呈現(xiàn)決策過程,以當(dāng)前動(dòng)作偏好(Logit)為坐標(biāo)、用箭頭或顏色指示下一步的變化方向與幅度。這是整個(gè)研究中最大的突破點(diǎn)。”李濟(jì)安解釋道,“這些圖片展示了不同模型在運(yùn)行時(shí)的關(guān)鍵特點(diǎn),比如哪些狀態(tài)是穩(wěn)定的,哪些狀態(tài)會(huì)吸引模型靠近,以及模型如何在狀態(tài)間切換,清晰地呈現(xiàn)了動(dòng)物的思維如何從一個(gè)想法或狀態(tài)轉(zhuǎn)變到另一個(gè)。”
李濟(jì)安從動(dòng)力系統(tǒng)出發(fā)的研究方法,帶來了很多意料之外的發(fā)現(xiàn)。例如,某些行為策略會(huì)根據(jù)不同的狀態(tài)調(diào)整學(xué)習(xí)速度,類似人在不同情境下改變學(xué)習(xí)方式。此外,它還揭示了一些傳統(tǒng)方法難以發(fā)現(xiàn)的新心理機(jī)制,如獎(jiǎng)勵(lì)后可能表現(xiàn)出“無所謂”傾向,決策時(shí)不再在意差別。
起初,2023年5月李濟(jì)安第一次投稿時(shí),只用了三個(gè)動(dòng)物的數(shù)據(jù)集。審稿人認(rèn)為說服力不夠,“應(yīng)用性不夠廣泛”。于是,他在二輪返稿的時(shí)候,補(bǔ)充了人類的數(shù)據(jù)集。結(jié)果同樣符合預(yù)期,審稿意見這才明朗起來。
![]()
圖4 基于動(dòng)力系統(tǒng)分析的模型解釋和比較
極具啟發(fā)性的是,李濟(jì)安發(fā)現(xiàn)即使是面對(duì)復(fù)雜任務(wù),描述單個(gè)個(gè)體的行為所需的最小網(wǎng)絡(luò)維度也很低。這提示了每個(gè)受試對(duì)象在特定任務(wù)中的“最小行為維度”是有限的。這種從動(dòng)力學(xué)系統(tǒng)出發(fā)的研究方法不僅有助于刻畫個(gè)體差異,也為認(rèn)知建模提供了一個(gè)新的、可量化的指標(biāo)來描述行為的復(fù)雜性。
最振奮人心的是,神經(jīng)網(wǎng)絡(luò)在人們心中將會(huì)發(fā)生轉(zhuǎn)變,不再只是一個(gè)行為擬合的黑箱工具,而正在成為一種認(rèn)知顯微鏡。神經(jīng)網(wǎng)絡(luò)工具長(zhǎng)期被喻為“黑箱”,其核心在于:數(shù)據(jù)輸入后經(jīng)多層神經(jīng)元的加權(quán)計(jì)算、特征傳遞最終輸出結(jié)果,但內(nèi)部數(shù)據(jù)處理邏輯、特征提取過程與決策依據(jù)均難以用清晰直觀的方式解釋——人們能看到輸入與輸出,卻無法透視內(nèi)部運(yùn)作的“齒輪與鏈條”,這種不透明性也帶來了可解釋性不足的挑戰(zhàn)。
而李濟(jì)安他們的研究表明,神經(jīng)網(wǎng)絡(luò)不僅具備數(shù)據(jù)驅(qū)動(dòng)的建模能力,還能通過壓縮與適當(dāng)?shù)哪P头治觯沂境鰸撛诘男袨樯蓹C(jī)制。這項(xiàng)研究成果不僅擴(kuò)展了認(rèn)知建模的工具集,也為高可解釋性行為建模提供了新的方向。
這種研究范式與當(dāng)前“AI for Science”的趨勢(shì)不謀而合,即:神經(jīng)網(wǎng)絡(luò)作為模型發(fā)現(xiàn)的中介工具,能夠從高維實(shí)驗(yàn)數(shù)據(jù)中提取結(jié)構(gòu)化知識(shí)。為了實(shí)現(xiàn)知識(shí)的可解釋表達(dá),需要找到適當(dāng)?shù)慕Y(jié)構(gòu)化表示形式。理想的表示形式應(yīng)滿足兩點(diǎn):一是具備良好的預(yù)測(cè)能力,二是對(duì)人類研究者而言語義清晰、邏輯透明。例如,Alpha Fold在蛋白質(zhì)建模中通過圖結(jié)構(gòu)表示氨基酸間的幾何約束。
在該項(xiàng)研究中,這種結(jié)構(gòu)化形式體現(xiàn)為低維離散動(dòng)力系統(tǒng),即只用少數(shù)幾個(gè)關(guān)鍵指標(biāo),描述和預(yù)測(cè)事件隨時(shí)間如何一步步變化。這為生物體策略行為提供了一種可計(jì)算、可視化且易于理解的抽象結(jié)構(gòu)。
本碩博三個(gè)不同專業(yè),只做一件事情
“要說從什么時(shí)候?qū)Υ竽X、神經(jīng)、生物這些感興趣,應(yīng)該要追溯到我小時(shí)候”,李濟(jì)安陷入思考。
李濟(jì)安1994年出生于安徽蕪湖,從小學(xué)就學(xué)習(xí)編程語言,參與電腦競(jìng)賽班。初中起,他開始對(duì)生物感興趣。由此,他憑借生物競(jìng)賽和計(jì)算機(jī)競(jìng)賽保送中國(guó)科學(xué)技術(shù)大學(xué),2016年獲神經(jīng)生物與生物物理理學(xué)學(xué)士、計(jì)算機(jī)科學(xué)與技術(shù)(雙)工學(xué)學(xué)士學(xué)位。2019年獲中國(guó)科學(xué)技術(shù)大學(xué)應(yīng)用統(tǒng)計(jì)碩士學(xué)位。目前在加州大學(xué)圣地亞哥分校讀博,從事神經(jīng)科學(xué)研究。
本碩博三個(gè)專業(yè),乍一看毫不相關(guān),但實(shí)則不然。本科期間,除了周末攻讀計(jì)算機(jī)課程,李濟(jì)安還加入了張效初老師的生命科學(xué)院認(rèn)知神經(jīng)心理學(xué)實(shí)驗(yàn)室,這是他科研之路的開端。在研究中,他發(fā)現(xiàn)應(yīng)用統(tǒng)計(jì)學(xué)是從事學(xué)術(shù)研究工作的工具和基礎(chǔ),于是碩士轉(zhuǎn)向應(yīng)用統(tǒng)計(jì)學(xué)。在此期間,他一邊跟隨統(tǒng)計(jì)學(xué)導(dǎo)師,一邊跟隨生物學(xué)導(dǎo)師,向著預(yù)測(cè)人類行為的方向持續(xù)深耕。
“其實(shí)現(xiàn)在很多研究人員都是交叉學(xué)科背景的,像做神經(jīng)科學(xué)領(lǐng)域的,你會(huì)發(fā)現(xiàn)有人工智能的、統(tǒng)計(jì)學(xué)的、心理學(xué)的。我覺得學(xué)習(xí)研究是一個(gè)過程,做好前期充足的知識(shí)儲(chǔ)備,才可能會(huì)在潛移默化中迸發(fā)靈感。比如我一直沒有丟下AI的學(xué)習(xí),沒有忽略研究工具的學(xué)習(xí)。”
在大語言模型能力持續(xù)發(fā)展的當(dāng)下,AI與神經(jīng)科學(xué)的關(guān)聯(lián)日益緊密,由此催生了新興的NeuroAI領(lǐng)域。這一領(lǐng)域主要關(guān)注兩個(gè)方向的探索:一是“用AI研究大腦”(AI for Neuro),希望借助AI技術(shù)自動(dòng)處理神經(jīng)數(shù)據(jù)、提取相關(guān)特征,通過人工神經(jīng)網(wǎng)絡(luò)模擬神經(jīng)元活動(dòng)規(guī)律與認(rèn)知過程,驗(yàn)證或提出新的神經(jīng)科學(xué)理論;二是“用大腦啟發(fā)AI”(Neuro for AI),希望借助神經(jīng)科學(xué)技術(shù)理解AI系統(tǒng)的內(nèi)部工作原理,基于生物大腦高效的信息處理方式,讓AI變得更聰明、更節(jié)能、更具類人性。
這項(xiàng)研究揭示了人工神經(jīng)網(wǎng)絡(luò)可以幫助我們理解人類的認(rèn)知機(jī)制,正如前文提及NeuroAI有兩個(gè)核心議題,李濟(jì)安的研究并沒有止步。
在本項(xiàng)研究塵埃落定之后,他接著去驗(yàn)證了第二個(gè)議題,反過來嘗試用神經(jīng)科學(xué)中的理論,來解釋大型語言模型(LLMs)所展現(xiàn)出的某些智能特性。結(jié)果表明,語言模型確實(shí)展現(xiàn)出一定程度的基于上下文學(xué)習(xí)的元認(rèn)知能力:它們不僅能夠監(jiān)控自己內(nèi)部的神經(jīng)狀態(tài),還能在一定程度上對(duì)其進(jìn)行調(diào)控。
末了,李濟(jì)安沉浸在研究中,臉上略顯興奮,“這種互為鏡像、相互促進(jìn)的智能理解體系,正是NeuroAI所描繪的愿景。”
參考資料
[1] https://www.nature.com/articles/s41586-025-09142-4
[2] 智能之鏡:NeuroAI 如何反映大腦與人工智能的未來
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.