![]()
編輯丨王多魚
排版丨水成文
生物分子的定向進化是一個迭代的過程。盡管語言模型(language model,LM)的進步加快了蛋白質的進化,但高效的 RNA 進化仍是一項挑戰。由于結合特性而被篩選出來的RNA 適配體(RNA aptamer)為解決這一挑戰提供了一個理想的系統,然而傳統的適配體發現仍然依賴于勞動密集型的多輪篩選。
2026 年 2 月 6 日,中國科學院深圳先進技術研究院合成生物學研究所王宇團隊等在Nature Biotechnology期刊發表了題為:Single-round evolution of RNA aptamers with GRAPE-LM 的研究論文。
該研究開發了一個用于RNA 適配體一輪式高效進化的生成式人工智能框架——GRAPE-LM(Generator of RNA Aptamers Powered by activity-guided Evolution and Language Model),GRAPE-LM 將基于Transfomer的條件自編碼器與核酸語言模型(Nucleic Acid Language Model)相結合,并由源自細胞內環境的基于 CRISPR-Cas 的適配體篩選數據引導。
![]()
核酸適配體(aptamer)由諾獎得主Jack Szostak命名,是一類短的單鏈 DNA(ssDNA)或 RNA 寡核苷酸,能夠折疊形成特定三維結構,并以“結構分子”的方式高親和力結合蛋白或小分子,從而具備開發成為核酸藥物和診斷探針的潛力。
然而,核酸適配體的發現,長期依賴指數富集的配體系統進化技術(SELEX),通常需要多輪、強人工參與的篩選與優化;更關鍵的是,在體外簡化條件下獲得的核酸適配體,親和力和特異性常常不高,限制了其開發成核酸藥物和探針的潛力。
王宇課題組在既往工作中提出了CRISmers(CRISPR/Cas-based aptamers screening system),將核酸適配體篩選從溶液和細胞表面體系推進到細胞內環境,使篩選過程天然包含內源生物學機制,體現了內源折疊構象、相互作用特異性、充分的分子競爭等關鍵變量,從源頭提升生物學相關性。在 CRISmers 篩選體系中,每個細胞作為一個獨立的物理微單元,其作用類似于微流控液滴,能夠有效隔離不同分子間的交叉反應,從而顯著降低背景噪音。與此同時,該系統以細胞存活等表型變化作為功能性的篩選輸出方式,相較于傳統的體外親和力篩選,其功能相關性也同時得到了顯著提升。
不過,胞內篩選不可避免面臨“遞送與細胞數量”帶來的通量上限:以 CRISmers 為代表的胞內篩選體系,文庫規模受轉染/遞送效率與細胞攝入能力限制,可能錯過大量潛在有效序列。也正是在這一瓶頸處,AI 驅動的“數字進化”開始展現決定性價值。
在這項最新研究中,研究團隊進一步提出了GRAPE-LM(Generator of RNA Aptamers Powered by activity-guided Evolution and Language Model),將“胞內篩選數據”與“核酸語言模型”耦合為一條端到端的一輪式高效進化路徑:模型以 Transformer 條件自編碼器為骨架,融合核酸語言模型,并由 CRISmers 在胞內環境產生的篩選數據提供“活性引導”,實現RNA適配體的一輪進化與生成。
在 GRAPE-LM 中,活性引導機制將模型推向更高活性的方向,預訓練核酸語言模型用于提出合理的高質量候選序列。該框架在三類跨度顯著的靶標上完成驗證——人 T 細胞受體 CD3ε、SARS-CoV-2 刺突蛋白的 RBD,以及人源致癌轉錄因子 c-Myc(一種胞內無序蛋白)。
更重要的是,GRAPE-LM 將“實驗進化”從傳統的多輪循環,重構為“物理進化+數字優化”的兩階段:第一階段由 CRISmers 在細胞內完成一輪篩選,第二階段由語言模型在更大序列空間中進行數字化優化與外推;在三類靶標上,僅用 “ 一輪 ” 即可獲得優于既往 SELEX 6–16 輪所得到的適配體的先導序列。這種效率躍遷也體現在起始文庫需求上: CRISmers+GRAPE-LM 路線可在約 108 規模的起始文庫上工作,而經典 SELEX 常需要 1014–1016 量級;換言之,前者僅需后者約百萬分之一到億分之一的初始文庫規模。
在 CRISmers+GRAPE-LM 的新范式中,CRISPR 脫離了基因編輯的框架,在這里扮演的是“高保真胞內 RNA 數據發動機”,捕獲 SELEX 等體外方法難以復現的胞內內源生物學機制 ;而 GRAPE-LM 則通過外推有限起始文庫,補足 CRISmers 通量受限的短板,并且引導生成更高活性 RNA 適配體。
![]()
加速 RNA 適配體進化的強大新范式
這一工作僅僅將 CRISmers 和 GRAPE-LM 兩個工具使用一次。面向未來,多輪迭代有望進一步提升分子質量和成藥性。此外,GRAPE-LM 僅僅應用了語言模型,物理模型的加入有望實現生成能力的進一步加強。該技術路線也已成功用于多肽分子的高效發現,并與某知名藥企合作開展藥物開發(未發表結果)。
在與王宇的通訊中,核酸適配體領域開創者Jack Szostak評價 CRISmers 和 GRAPE-LM 的工作 “ 非常有創造性,令人印象深刻 ” ( very creative and impressive )。在論文審稿過程中,審稿人評價該工作 “ 超級創新 ” ( super innovative ),并被編輯團隊選為亮點論文,邀請作者發表Research Briefing介紹論文成果和研究歷程。同時,Nature Biotechnology編輯團隊發表評論,表達了對這項工作的 “ 興奮 ”(exciting) 。
![]()
深圳大學人工智能學院助理教授張軍和中國科學院深圳先進技術研究院合成生物學研究所助理研究員張菊為論文共同第一作者。中國科學院深圳先進技術研究院合成生物學研究所王宇研究員為論文通訊作者,天津大學藥學院張陽教授和深圳大學人工智能學院張軍助理教授為論文共同通訊作者。唐少軒、劉傳承、蔡雨珊、曾浩、孟翔杰、柳貝作為參與作者,對該工作做出了重要貢獻。
論文鏈接:
https://www.nature.com/articles/s41587-026-03007-5
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.