撰文丨王聰
編輯丨王多魚
排版丨水成文
在計算生物學這一融合了生命科學與數據科學的前沿領域,科學家們長期面臨一個巨大挑戰:如何設計出能精準預測細胞在藥物、基因編輯等干預下如何反應的數學模型(即虛擬細胞模型)。這個過程需要同時精通機器學習、統計學和深厚的生物學知識,以同時解決生物學復雜性、多模態數據異質性以及跨學科專業知識,堪稱“跨學科煉金術”。
近日,耶魯大學博士生唐相儒等人聯合賓夕法尼亞大學、亥姆霍茲慕尼黑中心、斯坦福大學、谷歌 DeepMind 及哈佛大學等機構的研究人員,在預印本平臺arXiv上發表了題為:CellForge: Agentic Design of Virtual Cell Models 的研究論文。
該研究推出了CellForge( 細胞鍛造廠 ),這是一個多智能體框架,其作為 AI 科研總指揮,能夠 根據不同的生物醫學研究任務, 自主設計、優化并實現一套完整的虛擬細胞模型,其表現甚至能與人類專家設計的頂尖虛擬細胞模型一較高下。
CellForge突顯了多智能體框架的科學價值:多個專業智能體之間的協作能夠實現真正的方法創新以及單個智能體或人類專家無法實現的可執行解決方案。這標志著計算生物學中自主科學方法開發范式的轉變。
![]()
虛擬細胞:數字世界里的生命模擬
要理解CellForge做了什么,首先要了解“虛擬細胞建模”(Virtual Cell Modeling)這個領域。簡單來說,它的目標是在計算機中模擬一個細胞,并預測當這個細胞遭遇“擾動”時會發生什么。
這些“擾動”可以是一次基因敲除、一種新藥的刺激,或是細胞因子的作用。通過單細胞 RNA 測序(scRNA-seq)等技術,科學家能獲取細胞在擾動前后數萬個基因的表達數據,海量而復雜。
傳統上,針對每一個新數據集、新擾動類型,研究人員都需要結合領域知識,手動設計或挑選合適的機器學習模型架構,過程繁瑣且高度依賴專家經驗。這就像為每一位病人量身定制一套完全不同的診斷算法,效率低下且難以推廣。
從“單打獨斗”到“團隊作戰”:AI 智能體的科研革命
CellForge的核心創新,在于它采用了“多智能體”(Multi-Agent)協作框架。可以理解為這是一個高度專業化的 AI 科研團隊,而不是一個單一的、試圖解決所有問題的“超級 AI”。
這個團隊分工明確,配合默契——
1、任務分析模塊:相當于團隊的“情報官”和“文獻調研員”。它首先自動解析用戶給的單細胞數據集,理解其中包含的細胞類型、擾動信息、數據特征等。接著,它會自動檢索相關的科學文獻,從中汲取設計模型的靈感和原則。
2、設計模塊:這是團隊的“智囊團”和“辯論會”。系統會動態組建一個專家小組,成員可能包括“數據專家”、“單細胞生物學專家”、“深度學習架構師”等。它們以“角色扮演”的方式,圍繞任務展開基于圖結構的討論。
每位專家提出自己的模型設計方案。
一位“評審專家”負責點評每個方案的優缺點并打分。
專家們也會互相評價同行的方案。
通過多輪辯論,方案不斷融合、改進,直到所有專家對某個設計達成高度共識。這個過程能催生出人類專家可能想不到的創新架構,例如論文中提到的、用于處理時間動態數據的“軌跡感知編碼器”。
3、實驗執行模塊:這是團隊的“工程師”和“實驗員”。一旦設計方案確定,該模塊會自動將其轉化為可運行的代碼,并管理整個訓練過程。它具備“自我調試”能力,遇到代碼錯誤時會分析問題、自動修補并重新嘗試。訓練中還能進行輕量的超參數調優,并在完成后自動驗證模型性能。
![]()
![]()
這個框架的魅力在于,它不是從一堆預設的模板中做選擇,而是通過智能體之間基于知識的辯論與協作,真正從零開始“創造”出一個新的、針對特定任務優化的模型。這超越了簡單的超參數調優,實現了方法論層面的創新。
實戰檢驗:媲美頂尖專家,探索未知領域
研究團隊在六個公開的單細胞擾動數據集上對CellForge進行了全面測試,任務涵蓋基因敲除、藥物處理、細胞因子刺激等多種類型,數據模態也包括了 scRNA-seq(用于檢測基因表達情況)、scATAC-seq(用于分析染色質可及性)、CITE-seq(同時檢測 RNA 和蛋白質)等。
在已知方法較多的領域(例如基因敲除的 scRNA-seq 數據),CellForge自動設計的模型表現出了強大的競爭力。在 Adamson 和 Norman 這兩個經典數據集上,其模型在預測擾動后基因表達的關鍵指標(例如 MSE、PCC、R2)上,與 CPA、scGPT、Biolord 等人類設計的頂尖模型不相上下,甚至在部分指標上實現超越。
在缺乏成熟方法的“無人區”,CellForge的價值更加凸顯。例如,在預測染色質可及性變化(scATAC-seq 數據)或蛋白質表達變化(CITE-seq 數據)的任務上,由于沒有現成的專用模型,傳統的基線方法(例如線性回歸、隨機森林)表現平平。而CellForge能夠自主設計出適應這些獨特數據模態的定制化架構,取得了顯著的性能提升。這證明了其方法具備強大的泛化能力和探索性。
![]()
不止于預測:理解生命的“黑匣子”
一個好的模型不僅要預測得準,還要讓人類理解其決策。CellForge的設計也考慮到了生物學的可解釋性。
評估顯示,其模型能有效識別出在擾動中真正發生關鍵變化的基因(差異表達基因),并且預測的細胞狀態在整體結構上與真實生物學圖譜保持一致。通路富集分析也證實,模型捕捉到的信號與已知的生物學通路(例如 NF-κB、p53 信號通路)相符。
未來與挑戰:邁向自主科學發現
CellForge代表了一種科研范式的轉變:從人類指導 AI 執行單一任務,轉向 AI 自主管理從問題分析到方法實現的全流程。它為計算生物學,乃至更廣泛的科學領域,提供了一條自動化方法開發的新路徑。
當然,這條路并非一片坦途。論文也誠實地指出了當前局限:
結果可變性:由于自動設計過程的隨機性,不同次運行產生的模型性能會有波動,需要多次運行以確保獲得穩健的好模型。
計算成本:多智能體的討論、代碼生成與調試、模型訓練會消耗可觀的算力和 API 調用成本。但相比耗費頂尖科學家數月的人工設計時間,這種成本或許是可以接受的效率交換。
研究團隊在論文中分享了一個鼓舞人心的試點案例:兩位完全不了解該框架的濕實驗室研究人員,僅憑入門教程,就在大約一小時內,成功使用CellForge為他們的實際研究問題(免疫治療和心血管疾病建模)自動設計并訓練出了有效的預測模型。
這預示著,此類工具有望極大地降低先進計算建模的門檻,讓更多生物學家能將精力聚焦于科學問題本身,而非復雜的編程與算法設計。
CellForge就像一座剛剛點燃爐火的“鍛造廠”,只是,它鍛造的不是鋼鐵,而是探索生命奧秘的智能工具。它的出現告訴我們,AI 在科研中的角色,正從得力的“助手”,向富有創造力的“合作者”悄然演進。
論文鏈接:
https://arxiv.org/pdf/2508.02276
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.