基本信息
Title:Facial gestures are enacted through a cortical hierarchy of dynamic and stable codes
發(fā)表時間:2026.1.8
Journal:Science
影響因子:45.8
![]()
引言
我們每天都在“讀臉”:對方輕微的嘴角上揚、短促的咂嘴、突然的威脅表情,往往比語言更快傳遞態(tài)度與意圖。但一個關鍵問題長期被忽略:大腦究竟如何生成這些面部手勢(facial gestures),而不僅僅是如何感知它們?過去的經(jīng)典神經(jīng)心理學框架提出“內(nèi)側-外側雙通路”分工:內(nèi)側皮層更偏向情緒性表情(socioemotional expressions),外側額葉更偏向隨意運動(volitional movements)。然而,面部動作由大量精細肌肉動態(tài)組合,既像“刻板動作”,又能隨社交語境靈活變化:它到底更像由皮層精細控制,還是更像皮層只給出“啟動信號”、下游亞皮層按模板執(zhí)行?
為回答這些問題,作者選擇在更接近真實社交的條件下研究靈長類面部手勢:讓猴子在自然istic互動與刺激情境中自發(fā)表達手勢,同時用高分辨率視頻與無標記追蹤(markerless tracking)精確量化面部運動學,再把這些行為事件與多腦區(qū)單神經(jīng)元放電對齊。這樣做的目的,是把
“手勢是否可被離散分類?”
“皮層是否真的參與?”
“不同皮層區(qū)到底在編碼什么、何時編碼?”
這三類問題串成一個閉環(huán),用同一套自然行為數(shù)據(jù)去檢驗舊模型、建立新框架。
實驗設計與方法邏輯
作者先用自然istic社交范式誘發(fā)三類典型手勢(threat、lipsmack、chew),以DeepLabCut等無標記追蹤量化面部關鍵點并用PCA/t-SNE驗證手勢在運動學上可分;隨后基于fMRI功能定位(fMRI functional localization)在四個“面部運動網(wǎng)絡”腦區(qū)(M1、S1、PMv、M3)植入多通道陣列同步記錄單元活動,結合單細胞統(tǒng)計(ANOVA/MI)與群體解碼(SVM、軌跡分析),再引入PSID從群體動力學中提取與連續(xù)運動學相關的成分,并用跨時間泛化(CTG)刻畫各區(qū)編碼穩(wěn)定性,從而把“編碼內(nèi)容”與“時間策略”同時對齊到同一科學問題上。
核心發(fā)現(xiàn)
1)手勢先得“像個類別”:自然istic條件下三類面部手勢運動學清晰分群
論文首先強調(diào):如果手勢要承擔溝通功能,接收者必須能把它們當作離散類別識別。作者在Fig.1中用視頻同步的面部關鍵點軌跡,結合PCA與t-SNE顯示threat、lipsmack、chew在低維空間形成分離簇,并且從動作開始前的靜止姿態(tài)到動作期的時間演化都呈現(xiàn)可區(qū)分的模板化模式,證明該范式能穩(wěn)定誘發(fā)“可分類的手勢”,為后續(xù)神經(jīng)編碼分析打下行為學地基。
![]()
Fig. 1. Facial gestures are distinguishable during a naturalistic social paradigm.
2)推翻“情緒在內(nèi)側、隨意在外側”的單細胞證據(jù):各區(qū)都是混合編碼
在Fig.2里,作者把四個面部相關腦區(qū)(primary motor cortex, M1;primary somatosensory cortex, S1;ventral premotor cortex, PMv;cingulate motor cortex, M3)同時拉到一張桌上比較:無論是平均放電、選擇性強度還是信息量分布,整體差異都不支持“某區(qū)專門代表某類手勢”。更直接的是,652個神經(jīng)元中,各區(qū)都有大量神經(jīng)元被手勢類型調(diào)制(如S1 71%、M1 72%、PMv/M3各約62%),而且并不存在某一區(qū)對“社會情緒手勢”或“隨意咀嚼”細胞的系統(tǒng)性富集——經(jīng)典雙通路的核心預測在這組自然行為單細胞數(shù)據(jù)上站不住腳。
![]()
Fig. 2. Single-cell activity and selectivity in cortical face motor regions.
3)動作還沒開始,大腦已“先選好臺詞”:手勢在起始前1秒即可被群體活動解碼
Fig.3把“預備期(premovement)到底是什么”講得很硬核:作者用線性SVM等群體解碼發(fā)現(xiàn),手勢類別在多腦區(qū)**最早可提前約1秒**從神經(jīng)群體模式中讀出,且不同手勢對應的神經(jīng)軌跡在狀態(tài)空間里早期就分離、之后沿各自軌道演化;例如lipsmack呈現(xiàn)更旋轉的幾何結構,而threat與chew更接近線性偏離。關鍵點在于:這些可分的神經(jīng)狀態(tài)出現(xiàn)在沒有顯著運動學輸出之前,提示手勢不是純反射輸出,而是包含可被皮層網(wǎng)絡提前組織的準備與選擇過程。
![]()
Fig. 3. Population encoding of facial gestures.
4)時間尺度決定“分工”:M1/S1偏動態(tài)實時控制,M3偏穩(wěn)定語境表征
Fig.4用PSID(preferential subspace identification)把“與連續(xù)運動學真正相關的群體動力學”抽出來:各區(qū)都能在單試次水平預測面部運動成分,但M1與S1的運動學解碼最強,支持其在細粒度、時刻對時刻的控制作用;而Fig.5的CTG(cross-temporal generalization)進一步揭示“同樣能解碼手勢,但編碼策略完全不同”:M3呈現(xiàn)跨?1000到+800 ms的大塊穩(wěn)定泛化(穩(wěn)定碼),S1最貼近對角線(最動態(tài)),PMv與M1介于兩者之間,且M1在起始點附近出現(xiàn)明顯“碼切換”。量化指標也一致:S1的DI更高且TGW更短(更動態(tài)),M3則DI更低但TGW更長(更穩(wěn)定),共同構成一條由“實時運動學”走向“穩(wěn)定狀態(tài)/語境”的皮層時間層級。
![]()
Fig. 4. Kinematic decoding and distinctive neural correlations during gestures.
![]()
Fig. 5. Stable and dynamic coding of facial gestures across cortex.
歸納總結和點評
這項工作用自然istic社交范式把“面部手勢生成”從概念爭論推到了可量化、可解碼、可對比的層面:
手勢在運動學上是可離散分類的;
多皮層區(qū)都深度參與且并非按“情緒/隨意”簡單分區(qū);
手勢在動作前已被群體活動提前組織;
更重要的是,不同皮層區(qū)通過不同時間尺度的動態(tài)/穩(wěn)定編碼形成層級化協(xié)同——低階區(qū)(M1/S1)更貼近實時運動控制,高階/內(nèi)側區(qū)(M3/PMv)更可能承載可持續(xù)的狀態(tài)變量。整體框架不僅刷新了面部運動控制理論,也為自然交流相關的腦機接口(brain-computer interface, BCI)提供了更貼近真實場景的“可讀出目標”。
AI一句話銳評
把“表情”從肌肉動作還原成一套跨皮層、跨時間尺度的編碼協(xié)作機制——這篇論文真正給面部交流找到了“神經(jīng)學的組織原則”。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.