![]()
![]()
一、腦機接口困境:從「專才」到「通才」的范式轉(zhuǎn)變需求
腦機接口(Brain-Computer Interface, BCI)被視為連接人類智能與人工智能的終極界面。要真正實現(xiàn)這一愿景,核心在于高精度的腦信號解碼,即讓通用 AI 模型能夠真正「讀懂」復雜多變的腦活動。
近年來,腦電信號(EEG)解碼技術(shù)促進了從醫(yī)療診斷(如癲癇檢測、精神障礙診斷)到認知增強(如疲勞監(jiān)測、情緒識別),再到肢體輔助和言語解碼等一系列應用。
然而,長期以來,這一領(lǐng)域主要依賴于任務(wù)特定的深度學習模型,如 CNN、RNN 和 GNN 等。這些模型在特定數(shù)據(jù)集和任務(wù)上表現(xiàn)優(yōu)異,卻存在致命短板:缺乏通用性與跨任務(wù)遷移能力。模型往往需要在每個新任務(wù)上從零開始,難以適應復雜、多樣、動態(tài)的人腦信號。這導致模型既無法實現(xiàn)規(guī)模化,也很難從海量且異構(gòu)的腦電數(shù)據(jù)中學到真正通用、可遷移的神經(jīng)表征,使得當下的 BCI 系統(tǒng)仍停留在彼此孤立的「專才」應用階段,難以支撐通用腦機接口對多種認知和運動任務(wù)的靈活、穩(wěn)定解碼需求。
二、基礎(chǔ)模型賦能:跨尺度、結(jié)構(gòu)感知的腦基礎(chǔ)模型 CSBrain
受自然語言處理和計算機視覺領(lǐng)域基礎(chǔ)模型(如 GPT、InternLM、SAM、DINO 等)成功的啟發(fā),AGI 的浪潮正在席卷科學計算。
研究人員開始思考:能否構(gòu)建一個強大的腦基礎(chǔ)模型(Brain Foundation Model),像理解語言或圖像一樣,去理解各種任務(wù)下的腦信號,從而為通用 BCI 系統(tǒng)提供底層的認知操作系統(tǒng)?
然而,移植現(xiàn)有范式面臨挑戰(zhàn):腦信號具備獨特的跨尺度時空結(jié)構(gòu),即神經(jīng)活動的時間和空間尺度在不同任務(wù)間差異巨大,從瞬時爆發(fā)到慢波震蕩,從局部激活到全腦協(xié)作。傳統(tǒng)的尺度無關(guān)的密集建模范式并不能有效捕捉內(nèi)在神經(jīng)結(jié)構(gòu)。
![]()
為解決上述挑戰(zhàn),來自上海人工智能實驗室、中山大學和香港中文大學的聯(lián)合研究團隊提出了 CSBrain (Cross-scale Spatiotemporal Brain foundation Model),其核心思想是構(gòu)建一個跨尺度結(jié)構(gòu)感知的架構(gòu),將神經(jīng)生理學先驗融入模型設(shè)計。論文被接收為NeurIPS 2025 Spotlight。
![]()
- 論文標題:CSBrain: A Cross-scale Spatiotemporal Brain Foundation Model for EEG Decoding
- 論文地址:https://arxiv.org/abs/2506.23075
- Github:https://github.com/yuchen2199/CSBrain
CSBrain 引入了兩大核心創(chuàng)新模塊,并采用交替堆疊的方式,漸進式地整合跨尺度的時空依賴:
1. 跨尺度時空標記化(CST)
CST 模塊通過多尺度時空卷積核在腦電信號的局部時間窗口和解剖腦區(qū)內(nèi),分別提取多尺度的時間和空間特征,時空聚合后生成兼具粗、細粒度的腦電 tokens。
此外,CST 還設(shè)計了指數(shù)衰減的維度分配策略,即小尺度核分配高維度以保留細節(jié),大尺度核分配低維度捕獲上下文,從而在神經(jīng)表征能力與計算效率之間取得平衡。
2. 結(jié)構(gòu)化稀疏注意力(SSA)
SSA 模塊針對 CST 輸出的結(jié)構(gòu)化 token,引入窗口間注意力和區(qū)域間注意力,捕獲長程時序依賴的同時建模跨腦區(qū)交互。通過這種稀疏注意力設(shè)計,計算復雜度從 O (N2) 降低至 O (N?k),同時也有效抑制腦電噪聲帶來的虛假關(guān)聯(lián)。
![]()
CSBrain 采用掩碼自預測的自監(jiān)督預訓練范式,并基于 TUEG 數(shù)據(jù)集中超過 9000 小時的腦電信號數(shù)據(jù)完成了大規(guī)模預訓練。
三、實驗亮點與分析
研究團隊在11 個代表性腦解碼任務(wù)、16 個公共數(shù)據(jù)集上進行了全面驗證,涵蓋了運動想象、情緒識別、癲癇檢測、睡眠分期、語音想象等關(guān)鍵 BCI 應用場景。
結(jié)果顯示,CSBrain 在幾乎所有任務(wù)和評估指標上均達到了當前最強性能。在 11 項任務(wù)的平均結(jié)果中,相較于當前 SOTA 模型實現(xiàn)3.35% 的整體性能提升。
CSBrain 在高挑戰(zhàn)性解碼任務(wù)上的表現(xiàn)尤其出色,在運動想象任務(wù)(BCIC-IV-2a)上的準確率指標較 SOTA 模型提升5.2%,在癲癇檢測任務(wù)(Siena)上的 AUC-PR 指標提升7.6%。這些優(yōu)勢得益于跨尺度建模能更好地適配任務(wù)特定的神經(jīng)模式,從而顯著增強模型的泛化與魯棒性。
![]()
這些實驗結(jié)果驗證了 CSBrain 融合跨尺度時空建模范式和預訓練腦基礎(chǔ)模型的有效性,為多達 11 類 BCI 應用提供了有效支撐。這不僅為腦基礎(chǔ)模型提供了新的架構(gòu)設(shè)計思路,也為下一代腦機接口的設(shè)計打開了全新可能。
未來隨著數(shù)據(jù)規(guī)模的擴展與計算能力的提升,腦基礎(chǔ)模型的研究有望在更廣泛的腦—AI 融合場景中發(fā)揮更大作用,加速腦科學與人工智能的深度交匯,推動新一代腦機接口的加速應用。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.