![]()
圖片來(lái)自Chan Zuckerberg Initiative
克里斯汀.豪瑟|撰文
潘展| 編譯
生物學(xué)家正繞過(guò)培養(yǎng)皿,在計(jì)算機(jī)中借助人工智能驅(qū)動(dòng)的虛擬細(xì)胞開展實(shí)驗(yàn)。
得益于虛擬細(xì)胞技術(shù),藥物研發(fā)正蓬勃發(fā)展。這些由人工智能驅(qū)動(dòng)的活細(xì)胞模型,業(yè)已成為生物醫(yī)學(xué)研究中不可或缺的工具。它們能幫助科學(xué)家在進(jìn)行實(shí)驗(yàn)室前,先通過(guò)計(jì)算機(jī)模擬測(cè)試治療方法,從而節(jié)省時(shí)間、資金。
01
虛擬細(xì)胞發(fā)展的歷程
人工智能正迅速成為生物學(xué)領(lǐng)域最強(qiáng)大的 “顯微鏡”。頂尖研究中心正借助這項(xiàng)技術(shù)開發(fā)虛擬細(xì)胞——即基于人工智能,對(duì)所有生命形式的核心模塊進(jìn)行模擬。其模型可能對(duì)健康領(lǐng)域產(chǎn)生的影響,因此再怎么強(qiáng)調(diào)都不為過(guò)。
“我們的愿景是洞悉細(xì)胞的一切:分子結(jié)構(gòu)及其功能,細(xì)胞在生命體中的相互作用與運(yùn)作方式,以及它們的應(yīng)激反應(yīng)機(jī)制等。若這一愿景得以實(shí)現(xiàn),將在治療、預(yù)防和管理疾病方面為我們提供巨大助力。” 陳?扎克伯格基金會(huì)(CZI)一名研究者表示。
為探尋該技術(shù)的歷史以及未來(lái)發(fā)展方向,接下來(lái)我們將深入探討虛擬細(xì)胞:包括其定義、研發(fā)機(jī)構(gòu),以及它們?nèi)绾嗡茉灬t(yī)學(xué)的未來(lái)。
![]()
02
虛擬細(xì)胞首個(gè)里程碑突破
首個(gè)虛擬細(xì)胞誕生于十多年前。為何如今人們對(duì)它的關(guān)注度才大幅攀升呢?
答案在于,與斯坦福大學(xué)團(tuán)隊(duì)在2012年所構(gòu)建的模型相比,如今的虛擬細(xì)胞模型其運(yùn)作方式存在根本性差異。
當(dāng)時(shí),研究者構(gòu)建的虛擬細(xì)胞將生殖支原體(Mgen)的所有分子過(guò)程拆解為28個(gè)模塊,來(lái)實(shí)現(xiàn)對(duì)該細(xì)胞的建模。每個(gè)模塊都由專屬的數(shù)學(xué)方程式和生物學(xué)規(guī)則調(diào)控,舉個(gè)簡(jiǎn)化的例子:“若基因A被表達(dá),則基因B會(huì)被激活”。
為制定這些調(diào)控指令,該團(tuán)隊(duì)查閱了900多篇論文、書籍以及各類數(shù)據(jù)庫(kù),本質(zhì)上是將科學(xué)界關(guān)于生殖支原體運(yùn)作機(jī)制的所有已知知識(shí),提煉成了28個(gè)算法。模型構(gòu)建完成后,能夠模擬生殖支原體從誕生到分裂的完整生命周期,整個(gè)過(guò)程耗時(shí)約10小時(shí)——與真實(shí)生殖支原體細(xì)胞的分裂時(shí)長(zhǎng)大致相當(dāng)。
能夠觀察這一過(guò)程本身就具有重要價(jià)值,但虛擬細(xì)胞的真正效用在于,研究人員可對(duì)其進(jìn)行實(shí)驗(yàn)操作。他們無(wú)需借助CRISPR基因編輯技術(shù),只需敲擊鍵盤就能“敲除”某個(gè)基因,隨后通過(guò)運(yùn)行模擬程序,預(yù)測(cè)該基因缺失會(huì)對(duì)生殖支原體產(chǎn)生何種影響。在這個(gè)過(guò)程中,若發(fā)現(xiàn)有趣的現(xiàn)象,再投入時(shí)間開展實(shí)驗(yàn)。
多數(shù)情況下,虛擬細(xì)胞的預(yù)測(cè)結(jié)果會(huì)與實(shí)驗(yàn)結(jié)果相符。當(dāng)二者出現(xiàn)偏差時(shí),問(wèn)題通常出在那些科學(xué)界尚未充分了解的基因上。這一現(xiàn)象合乎邏輯:模型的性能受限于其編程。若科學(xué)家想改進(jìn)模型,就必須更新相關(guān)算法。
在斯坦福大學(xué)取得這一突破性進(jìn)展后的數(shù)年里,其他研究團(tuán)隊(duì)也采用相同方法構(gòu)建了各自的虛擬細(xì)胞:即把已知文獻(xiàn)中的知識(shí)提煉成基于規(guī)則的算法。
03
AI助力虛擬細(xì)胞更快發(fā)展
如今構(gòu)建虛擬細(xì)胞的人工智能通常采用的是一種名為 “轉(zhuǎn)換器(Transformer)” 的特定模型。谷歌研究人員于2017年首次提出這種AI架構(gòu),如今它已成為眾多頂尖生成式AI的基礎(chǔ)。
基于轉(zhuǎn)換器的AI通過(guò)對(duì)海量數(shù)據(jù)集進(jìn)行訓(xùn)練,學(xué)會(huì)識(shí)別“標(biāo)記(token,即小型數(shù)據(jù)單元)”之間的關(guān)聯(lián)。訓(xùn)練完成后,這類AI能通過(guò)預(yù)測(cè)序列中最可能出現(xiàn)的下一個(gè)標(biāo)記,生成新的內(nèi)容。
轉(zhuǎn)換器是AI最顯著的特點(diǎn)之一,能夠生成未包含在其訓(xùn)練數(shù)據(jù)中的內(nèi)容。例如,一款A(yù)I圖像生成器即使沒有被明確展示過(guò)用意大利面條做成的貓應(yīng)該是什么樣子,也能生成一張逼真的照片。
如今,研究人員正基于轉(zhuǎn)換器架構(gòu)構(gòu)建虛擬細(xì)胞,其成果令人矚目。例如CZI開發(fā)的轉(zhuǎn)錄組轉(zhuǎn)換器模型(TranscriptFormer),訓(xùn)練數(shù)據(jù)集涵蓋了1.12億個(gè)細(xì)胞的圖像、RNA序列及其他生物數(shù)據(jù)。這些細(xì)胞源自12個(gè)不同物種,其進(jìn)化史跨度長(zhǎng)達(dá)15億年。研究人員只需向該模型輸入所研究細(xì)胞的數(shù)據(jù),即便該細(xì)胞來(lái)自未納入模型訓(xùn)練數(shù)據(jù)的物種,AI也能預(yù)測(cè)出細(xì)胞類型、感染狀態(tài)等關(guān)鍵信息。
“展望未來(lái),虛擬細(xì)胞模型的目標(biāo)是成為實(shí)驗(yàn)系統(tǒng)的數(shù)字孿生體或計(jì)算替代物,”哈佛大學(xué)助理教授馬林卡?日特尼克(Marinka Zitnik)表示,“例如一個(gè)經(jīng)過(guò)驗(yàn)證的虛擬細(xì)胞可通過(guò)計(jì)算機(jī)模擬藥物或基因干預(yù)的結(jié)果,這有望減少對(duì)動(dòng)物實(shí)驗(yàn)的需求,或?yàn)閷?shí)驗(yàn)室研究設(shè)計(jì)提供指導(dǎo)。”
生物醫(yī)學(xué)研究領(lǐng)域的非營(yíng)利機(jī)構(gòu)Arc研究所也在開展虛擬細(xì)胞研發(fā)工作。該機(jī)構(gòu)近期開放了其首個(gè)模型——STATE的使用權(quán)限,其訓(xùn)練數(shù)據(jù)包括近1.7億個(gè)細(xì)胞的觀測(cè)數(shù)據(jù),以及超過(guò)1億個(gè)細(xì)胞的擾動(dòng)數(shù)據(jù)。擾動(dòng)數(shù)據(jù)記錄的是細(xì)胞在藥物、基因編輯或其他外部刺激干擾正常功能時(shí)所產(chǎn)生的反應(yīng)。
研究人員只需輸入細(xì)胞的轉(zhuǎn)錄組(即在特定時(shí)刻所有活躍表達(dá)的基因的完整集合)以及所設(shè)想的干擾因素,STATE就能預(yù)測(cè)細(xì)胞的基因表達(dá)模式可能發(fā)生的變化。這為科學(xué)家提供了一種無(wú)需實(shí)際開展實(shí)驗(yàn),即可測(cè)試疾病治療潛在效果的方法。
通過(guò)反向運(yùn)行這一過(guò)程,STATE甚至能為研究人員指出此前被忽略的有潛力的干預(yù)方向。
“你可以選取一個(gè)處于患病狀態(tài)的細(xì)胞——比如具有阿爾茨海默病轉(zhuǎn)錄組特征的細(xì)胞,再選取一個(gè)健康狀態(tài)的細(xì)胞,然后問(wèn)模型:‘我需要進(jìn)行哪些干預(yù),才能讓這個(gè)細(xì)胞從患病狀態(tài)轉(zhuǎn)變?yōu)榻】禒顟B(tài)?’”Arc 研究所首席技術(shù)官戴維?伯克(David Burke)解釋道。
伯克表示,根據(jù)干預(yù)類型的不同,STATE預(yù)測(cè)的準(zhǔn)確率在40%至60%之間。他認(rèn)為,當(dāng)AI預(yù)測(cè)結(jié)果的準(zhǔn)確率達(dá)到75%時(shí),生物學(xué)家就可以開始據(jù)此而無(wú)需開展真實(shí)實(shí)驗(yàn)了。
數(shù)據(jù)可以提升虛擬細(xì)胞的穩(wěn)定性,但虛擬細(xì)胞的改進(jìn)空間究竟有多大,目前仍無(wú)定論。若能獲取足夠多的高質(zhì)量數(shù)據(jù),是否有可能構(gòu)建出一個(gè)單一模型,精準(zhǔn)預(yù)測(cè)細(xì)胞在各種可能的干預(yù)條件下發(fā)生的所有變化,能否開發(fā)出一個(gè)揭示細(xì)胞間相互作用機(jī)制的模型,我們是否有能力構(gòu)建出完整組織、器官乃至整個(gè)生物體的虛擬模型。
這些目標(biāo)如果能實(shí)現(xiàn),生物學(xué)領(lǐng)域?qū)⒂瓉?lái)轉(zhuǎn)折點(diǎn)——從一門“觀察生命”的科學(xué),轉(zhuǎn)變?yōu)橐婚T“可模擬、可預(yù)測(cè)生命”的科學(xué)。這將為醫(yī)學(xué)、壽命研究以及對(duì)健康的認(rèn)知帶來(lái)革命性影響。
https://www.freethink.com/artificial-intelligence/virtual-cells
主題:氧化性左旋核酸與阿爾茲海默病;嘉賓:許代超(中科院上海有機(jī)化學(xué)研究所生物與化學(xué)交叉研究中心?研究員)
:714-6863-0945
![]()
Deep Science預(yù)印本
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.