好消息,AI也可以幫科學家畫腦圖了!
近期,一個來自加州大學舊金山分校的神經科學團隊提出了一種新的機器學習算法——CellTransformer,僅花費幾個小時就完成了對5只小鼠大腦圖譜的分類和繪制工作。
![]()
這五只小鼠大腦的基因數據中包含1040萬個細胞,每個細胞包含數百個基因。但通過這一創新性算法,研究團隊不僅清晰地劃分出了小鼠大腦內的已知區域,還繪制出了新的腦區
更夸張的是,這項技術很可能會進一步應用于人類
畫腦圖的最新黑科技:CellTransformer
大腦圖譜繪制是一門古老的學科,過去畫腦圖的方法相當復雜,需要科學家用鉛筆在腦部圖像上畫線,連接不同區域。
2020年發布的艾倫小鼠腦通用坐標框架(Allen Mouse Brain Common Coordinate Framework),就是采用這種方法畫出來的。
這幅腦圖基于1675只小鼠的腦部數據,涵蓋了1000多個不同的腦區,具有很高的價值。
![]()
但這類手工特征很強的圖譜也不可避免地存在一個問題:具有主觀性
賓夕法尼亞州立大學醫學院的神經解剖學家金永洙(Yongsoo Kim)表示,當他向資深專家請教如何畫腦圖時,對方往往只有一句話:“這都是我腦子里的。”
不過,今時不同往日。來自加州大學舊金山分校的Reza Abbasi-Asl和他的團隊提出了一套名為CellTransformer的編碼器-解碼器架構,僅花費幾個小時便能完成這項工作。
CellTransformer的工作原理是這樣的:
隨機遮住一個細胞的身份和基因表達,讓模型根據鄰居細胞來預測它,預測錯了就更新,重復幾百萬次。
具體來說,研究人員會先給每一個細胞劃定一個“鄰域”——以它為中心,在一定微米距離內的所有細胞,都會被納入觀察范圍。這樣模型在同一時間里,既能看到細胞之間的空間結構,又能看到它們在分子層面的差異。
在這個鄰域里,每一個細胞都會被當作一個token,就像語言模型里的一個詞。
CellTransformer使用Transformer的自注意力機制,讓這些細胞彼此“交流”:模型會自動學習,哪些細胞之間的關系更重要,哪些鄰居對當前細胞的影響更大。
![]()
訓練時,研究人員采用一種非常巧妙的自監督方式。模型會隨機選中一個細胞,把它的基因表達信息“遮住”,只保留它的細胞類型標簽,然后讓模型根據周圍鄰居的情況,去預測這個細胞原本應該表達哪些基因。
在內部結構上是這樣的:
通過多層Transformer編碼器架構,模型會讓鄰域內所有細胞的信息充分交互。
隨后,它會把這些細胞的表示通過一個學習得到的池化操作壓縮成一個向量,用來代表整個鄰域的“組織環境”。
接下來,模型再結合被遮住細胞的類型信息,通過一個較淺的解碼器,反推出該細胞的基因表達分布。
最后,研究人員為每一個細胞提取一個“鄰域表示向量”,把所有細胞、所有切片的這些向量拼接在一起,再用k-means等聚類方法進行分析,腦區就會“自己浮現出來”。
已知的功能區會自然對齊,而在一些區域中,模型還會進一步拆分出更精細的亞區,甚至發現過去從未被系統標注過的新腦區
結果有多強?
為了驗證CellTransformer的有效性,研究團隊在ABC-WMB數據集上進行了系統評估,數據集包含5只小鼠的腦組織數據。
其中一只小鼠由艾倫腦科學研究所使用包含500個基因的MERFISH panel 進行處理,并采集了53個冠狀切片;其余四只小鼠的數據來自艾倫小鼠腦通用坐標框架的研究,并使用包含1129個基因的panel進行采集。
首先,效率太高了。CellTransformer在數小時內完成了對5只小鼠、1040萬個細胞的空間組織建模,這是傳統方法在時間和規模上都無法企及的。
其次,準確對齊已知的腦結構分區。CellTransformer能夠在小鼠大腦中定義25到1300個神經區域,并且在完全不使用腦區標簽的情況下,高度對齊已知的解剖結構和功能分區。
由于CellTransformer利用其預測結果對細胞進行分組,不會生成全新的腦圖,所以也不存在幻覺問題
研究團隊重新采用了手繪的艾倫小鼠腦通用坐標框架,將CellTransformer的輸出與其進行比較,發現兩者吻合良好,展現了相似的結構,連皮層中的層級結構也能做到一致。
![]()
上面這張圖中,左邊是CellTransformer繪制的小鼠腦圖,右邊是人類科學家利用艾倫小鼠通用坐標框架繪制的小鼠腦圖。兩者都定位了大腦中1000多個細胞亞區,但AI發現得更多。
海馬體分區的識別中,CellTransformer在k=1300時識別出的空間域與過去相關研究定義的亞區邊界高度一致,包括背側下托的三層組織和前下托的背腹側組織。
![]()
而在上丘區域,CellTransformer也清晰識別了感覺層的帶狀層、淺灰層和視層,以及運動相關中間灰質和白質的亞區,并發現了與Benavidez等人通過投影映射確定的類似內外側結構。
第三,除了對齊已知的腦功能區,CellTransformer還能識別和繪制出新區域。即便是此前通用神經科學方法所遺漏的區域,CellTransformer也不在話下。
紋狀體為例,它位于大腦中部附近,呈條紋狀,形狀略似C形。在小鼠腦圖譜中,紋狀體被稱為尾殼核
研究發現,當調整不同的k值時,尾殼核會出現網格狀、交錯的空間結構,這與此前研究基于投射連接得到的Voronoi分區高度一致。
![]()
由此,CellTransormer還意外地回答了神經科學領域一個被追問已久的問題:紋狀體已知參與運動、獎賞和整體大腦管理。大腦的同一部分是如何執行如此截然不同的任務的呢?
答案是:尾殼核并非一個單一的腦區。從圖譜中就可以看出,它實際上被細分為更小的區域,不過每個區域所對應的功能還有待進一步研究。
而腦干的中腦網狀核則是一個研究相對較少的區域,它負責啟動運動。
CellTransformer在該區域識別出了4個新的腦區,每個腦區都具有特別豐富的細胞類型和特定的激活基因。
此外,一些此前分析中被定位在大腦其他區域的細胞類型,在這部分腦區也被發現了。
![]()
第四,這不是“小鼠特供算法”。CellTransformer能夠擴展到多動物、百萬細胞數據集
為了研究CellTransformer整合不同動物樣本的能力,團隊又基于另一個MERFISH數據集從頭開始訓練了一個新模型。
結果發現,CellTransformer在所有5只動物(1個冠狀切片和4個矢狀切片)中均生成了一致的亞區,所識別的腦區在不同動物之間高度一致,表明該方法能夠成功整合具有異質性測量結果的動物腦區
![]()
真正的大招還沒來:人腦
小鼠并不是實驗的目的,這項算法最終的應用目標將指向——人類大腦
研究人員推測,小鼠和人類大腦的某些區域會高度匹配,而另一些區域則會存在差異。
不過遺憾的是,小鼠大腦約有1億個細胞,而人腦則有約個細胞,目前還無法從人腦中獲得足夠多的數據來做出準確的預測。
但研究團隊對未來的方向也是相當有信心。Abbasi-Asl認為,一旦獲得足夠的數據,CellTransformer將能夠應對這一挑戰。
除了大腦之外,同樣的算法還可以用于其他器官——例如腎臟和病理組織,通過提供詳細細胞圖譜來幫助科學家做進一步研究,如判斷健康腎臟和糖尿病腎臟的差異。
不過,以現在的技術發展速度……AI畫出人類腦圖,這一天應該不遠了吧?
[1]https://www.quantamagazine.org/fed-on-reams-of-cell-data-ai-maps-new-neighborhoods-in-the-brain-20260209/
[2]https://www.nature.com/articles/s41467-025-64259-4#MOESM1
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.