![]()
撰文丨王聰
編輯丨王多魚
排版丨水成文
要全面理解細胞生命活動的規則,我們必須了解細胞隨時間和空間變化(4D)的完整定量特征,以及細胞內部的化學和物理過程如何協同作用來驅動細胞狀態的變化。
目前,任何單一實驗都無法同時確定整個細胞的分子組成和結構,但在細胞狀態的計算建模方面已取得重大進展,同時也有越來越多的努力將不斷增長的大量生物數據集串聯起來,利用機器學習(ML)和人工智能(AI)形成細胞狀態的快照。以這種方式整合定量生物數據,有望預測細胞在其生命周期不同時間點的完整分子環境。然而,利用 ML 或 AI 方法預測細胞狀態的快照(包括分子組成和物理特征),只是對可能結果的抽樣,無法揭示導致細胞狀態隨時間變化的潛在生物、化學和物理過程。
2026 年 3 月 9 日,伊利諾伊大學厄巴納-香檳分校的研究人員在國際頂尖學術期刊Cell上發表了題為:Bringing the genetically minimal cell to life on a computer in 4D 的研究論文。
該研究成功在計算機上建立了一個包含空間和時間的“4D 全細胞模型”(4DWCM),完整模擬了地球上已知的能夠正常分裂的基因最少的生命體——JCVI-syn3A細菌的整個生命周期(從誕生到生長再到分裂)。這不僅是一次炫技,而是人類首次在虛擬世界中,從分子層面逼真地“復活”并“驅動”一個完整的生命體“度過”它的一生。
![]()
![]()
JCVI-syn3A
要理解這項研究的雄心,首先得認識其研究對象——JCVI-syn3A。它并非自然界中天然存在的細菌,而是由人類科學家創造的生命體。
早在 2010 年,J. Craig Venter 研究所的研究團隊從絲狀支原體(
Mycoplasma mycoides)出發,構建了首個完全合成基因組的細胞 ——JCVI-syn1.0。2016 年,他們刪除其中的非必需基因,構建了只有 473 個基因JCVI-syn3.0,這也是地球上已知的基因數量最少的可獨立復制的生命體,相比之下,大腸桿菌擁有大約 4000 個基因。但 JCVI-syn3.0 分裂后會出現多種形態異常。2021 年,研究團隊構建了JCVI-syn3A,這一版本擁有 493 個基因,每 105 分鐘分裂一次,且能夠維持規則的球形形態。
這個極其精簡的基因組最小細胞,成為理解生命所需“最低配置”以及整個細胞周期全細胞建模的絕佳平臺。
此前的研究,或是聚焦于其靜態結構,或是將其細胞內部視為均勻混合的“湯”,忽略了分子在三維空間中的精確定位與碰撞過程。而現實是,細胞內部是一個高度結構化、擁擠而動態的世界,分子的位置決定其命運。
混合模擬,跨界協作
為了模擬這個微小而復雜的世界,研究團隊采用了“混合模擬”的超級算法。這就像用不同焦距的鏡頭同時觀察同一個場景——
反應-擴散主方程,負責處理基因表達等隨機化學反應,它將細胞三維空間離散成邊長 10 納米的微小立方體網格,追蹤每一個蛋白質、RNA 分子在這些“小房間”中的擴散與相遇。
布朗動力學模擬,專門驅動染色體這條巨大的“聚合物項鏈”,它模擬 DNA 鏈的彎曲、拉伸,以及像“結構維持染色體蛋白”這樣的分子機器如何在 DNA 上形成環狀結構,幫助染色體在復制后順利分離。
常微分方程組,則掌管新陳代謝,它計算細胞如何攝取葡萄糖等養分,轉化為能量和建造新零件的原料,例如合成 DNA 所需的核苷酸。
最后,一個幾何生長模型根據新合成的脂質和膜蛋白數量,實時更新細胞膜的形態,模擬細胞從球形生長、拉長到最終分裂成兩個的過程。
這些計算模塊并非各自為政,而是每 12.5 毫秒就同步一次數據,形成一個有機的整體。模擬一個JCVI-syn3A細胞的 105 分鐘的生命周期,需要在兩臺高性能 GPU 上不眠不休地運行 4-6 天,消耗約 250 個 GPU 小時。為了獲得可靠的統計數據,團隊共模擬了 50 個這樣的“虛擬細胞”。
![]()
4DWCM 的三維組件可視化
虛擬照進現實
這個復雜的虛擬世界,并非科學家的憑空想象,其構建和驗證深深植根于海量的實驗數據。模型的初始參數,例如每種蛋白質的數量,來源于真實的蛋白質組學測量。
細胞生長和分裂的形態,則受到新型熒光顯微鏡成像實驗的直接約束。研究顯示,這個最小化細胞主要通過對稱分裂進行繁殖,形態多為球形、長橢球形或啞鈴形。
模型最令人信服的成就之一是其預測與 DNA 測序實驗的高度吻合,模型預測的 DNA 復制時間與實驗測量的結果幾乎一致。通過分析 DNA 測序的“閱讀深度”,研究團隊可以計算出染色體復制起點和終點的拷貝數比例。模型預測的比例為 1.28,而實驗測得的比例為 1.21,兩者高度接近,強有力地證明了模型的準確性。
生命的隨機性與確定性
模擬揭示了生命過程中精妙的隨機性與穩健的確定性并存。在 50 個被模擬的“同胞”細胞中,DNA 復制開始的時刻最早為 2 分鐘,最晚可推遲到 46 分鐘,波動很大。
但所有細胞最終都成功完成了復制和分裂。由于空間隨機性的存在,細胞分裂時,核糖體、蛋白質等在兩個子細胞中的分配并非精確的一半一半,而是接近二項分布,就像隨機撒豆子。此外,沒有兩個模擬的細胞是完全相同的,這正反映了真實生命的獨特性和多樣性。
![]()
細胞分裂后,大分子在反應擴散主方程(RDME)晶格上隨機擴散,從而分配到子細胞中
模型還量化了細胞“工廠”的繁忙程度:平均而言,在任何時刻,大約 70% 的“復印機”(RNA 聚合酶)處于活躍狀態,55% 的“裝配機”(核糖體)正在工作。模型還預測了每種 mRNA 的平均壽命和翻譯效率,這些都與在其他細菌中的測量范圍相符。
![]()
基因表達與大分子組裝的動力學
意義、局限與未來
這個4D 全細胞模型(4D whole-cell model,4DWCM)的構建,是系統生物學和計算生物學領域的一次巨大飛躍。它首次在時空維度上整合了最小細胞的所有核心生命過程,為在分子層面理解生命的基本原理提供了一個“數字沙盒”。
研究人員可以在這個模型上進行“虛擬實驗”,例如敲除某個基因或改變環境參數,觀察其對整個生命系統的級聯效應,這比真實實驗更快、成本更低。當然,模型仍有其局限。例如,為了計算可行性,它尚未模擬“多聚核糖體”現象,這可能會低估某些長蛋白質的合成速度。此外,染色體最終分離到子細胞的過程,目前依賴一個假設的微小外力輔助,其確切的生物學機制有待進一步研究。模型的部分參數借鑒自其他細菌,需要未來在 JCVI-syn3A 中直接測量代謝物濃度、mRNA 半衰期等數據來進一步完善。
盡管如此,這項工作已經為我們打開了一扇前所未有的窗口,它不僅幫助我們理解最簡生命,其構建框架和方法也為未來模擬更復雜的細胞(例如人類細胞)奠定了基礎。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(26)00174-1
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.