![]()
在顯微鏡下,研究者正在觀察某個細(xì)胞的狀態(tài)。它可能正在分化、受藥物作用,或者被輻射輕微損傷。如果能預(yù)測它接下來會發(fā)生什么——會凋亡?轉(zhuǎn)分化?恢復(fù)?——我們就能提前干預(yù)疾病、優(yōu)化藥物設(shè)計。
這一想法如今正在美國哥倫比亞大學(xué)(Columbia University)與斯坦福大學(xué)(Stanford University)等的研究團(tuán)隊手下變?yōu)楝F(xiàn)實。他們提出了一種名為 Squidiff 的基于擴(kuò)散模型(diffusion model)的細(xì)胞狀態(tài)預(yù)測框架,能在多種擾動條件下生成「未來的單細(xì)胞轉(zhuǎn)錄組」。
該研究以「Squidiff: predicting cellular development and responses to perturbations using a diffusion model」為題,于 2025 年 11 月 3 日刊登在《Nature Methods》。
![]()
論文鏈接:https://www.nature.com/articles/s41592-025-02877-y
細(xì)胞系統(tǒng)中的 AI 視角
在單細(xì)胞生物學(xué)中,常用 RNA 測序(scRNA-seq)來觀察細(xì)胞的基因表達(dá)譜。但這些數(shù)據(jù)只是靜態(tài)快照——研究者只能看到「此刻的細(xì)胞」,卻看不到它「接下來的變化」。
以往的算法如scGen、GEARS嘗試預(yù)測擾動后的狀態(tài),但都有局限:它們假設(shè)擾動與反應(yīng)的關(guān)系是線性的;很難捕捉到細(xì)胞發(fā)育或藥物反應(yīng)中的非線性動態(tài)軌跡;對復(fù)雜多擾動(如藥物聯(lián)用、雙基因編輯)往往失效。
Squidiff 的思路與之不同——它引入了擴(kuò)散模型的時間逆推機(jī)制:通過學(xué)習(xí)細(xì)胞表達(dá)譜從「噪聲」到「有序狀態(tài)」的生成過程,模型不僅能還原靜態(tài)數(shù)據(jù),更能模擬狀態(tài)轉(zhuǎn)變的過程。
![]()
圖 1:Squidiff 概述及其在合成數(shù)據(jù)上的性能。
Squidiff 可生成代表不同細(xì)胞狀態(tài)的新轉(zhuǎn)錄組,并利用這些信息合并各種擾動條件,包括基因編輯和具有特定結(jié)構(gòu)和劑量的藥物化合物。接下來,它能在潛空間中逐步生成符合條件的未來表達(dá)譜。
Squidiff 集成了數(shù)據(jù)生成用的擴(kuò)散模型和用于編碼潛在表示的語義編碼器,有了它,研究者就可以給模型「加一個條件」,例如「給予藥物X」或「暴露在輻射劑量Y」,AI 就能輸出該細(xì)胞在這些條件下的轉(zhuǎn)錄組預(yù)測。
AI 模擬發(fā)育、藥物與輻射三類擾動
為了解釋 Squidiff 框架,研究者們在多個數(shù)據(jù)集上驗證了 Squidiff 的能力。
以 iPSC 分化的公共單細(xì)胞轉(zhuǎn)錄組學(xué)數(shù)據(jù)集為例,僅根據(jù)第 0 天和第 3 天的數(shù)據(jù)進(jìn)行訓(xùn)練,Squidiff 就通過擴(kuò)散和去噪過程有效地捕獲了從第 0 天到第 3 天從 iPSC 到中胚層和最終內(nèi)胚層細(xì)胞的狀態(tài)變化。
Squidiff 還可以預(yù)測細(xì)胞對基因擾動和藥物治療的反應(yīng)。通過利用向量運(yùn)算,訓(xùn)練完畢的 Squidiff 模型可以跨條件泛化單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),準(zhǔn)確模擬復(fù)雜的細(xì)胞反應(yīng)。在雙基因敲除實驗(ZBTB25 + PTPN12)中,Squidiff 成功預(yù)測出下游信號的非線性疊加模式,性能顯著優(yōu)于 scGen 與 GEARS。
![]()
圖 2:Squidiff 預(yù)測細(xì)胞分化(部分)。
最后,團(tuán)隊將 Squidiff 應(yīng)用于血管類器官(blood vessel organoid)暴露實驗,模型準(zhǔn)確再現(xiàn)輻射后炎癥反應(yīng)、p53 通路激活、細(xì)胞凋亡上調(diào)等轉(zhuǎn)錄信號,并進(jìn)一步預(yù)測G-CSF(粒細(xì)胞刺激因子)處理可顯著緩解這些分子變化。
細(xì)胞的預(yù)測方式
Squidiff 模型打開了一條用生成式模型做生物學(xué)假設(shè)演化實驗的道路。這意味著研究者可以在不動細(xì)胞、不開實驗的情況下,模擬不同藥物、劑量或輻射條件下的基因表達(dá)變化。
在藥物開發(fā)中,它能用于篩選最可能有效的組合;在放射生物學(xué)中,它能預(yù)測劑量–響應(yīng)曲線與修復(fù)窗口。Squidiff 不僅能成為治療應(yīng)用的工具,而且可以繼續(xù)完善揭示細(xì)胞適應(yīng)、應(yīng)激反應(yīng)和命運(yùn)決定的根本機(jī)制的途徑。
未來的工作中,提高 Squidiff 的可擴(kuò)展性和計算效率對于將其應(yīng)用于大規(guī)模數(shù)據(jù)集并確立 Squidiff 作為一個更通用的基礎(chǔ)模型至關(guān)重要。它仍需要整合更多的多組學(xué)數(shù)據(jù),以此完善其預(yù)測機(jī)制。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.