![]()
編輯丨coisini
RNA 序列設計與蛋白質 - DNA 結合特異性預測均可被視為核酸逆折疊問題,即在給定核酸或核酸 - 蛋白質復合物固定三維結構的前提下,尋找最可能的核酸序列。
雖然已有研究針對特定任務開發工具,但目前尚未出現統一的深度學習模型來解決核酸逆折疊問題。單一模型將能利用規模更大、更多樣化的訓練數據集,并具備更廣泛的應用范圍。
最近,華盛頓大學大衛?貝克(David Baker)團隊等提出假設:基于深度學習的統一核酸逆折疊模型可協同解決上述兩類問題,通過聯合訓練兩類任務中的異構數據集獲得潛在優勢,并顯著拓展應用邊界。
研究團隊據此假設提出核酸消息傳遞神經網絡(Nucleic Acid MPNN,NA-MPNN),采用統一生物聚合物圖表示方法處理蛋白質、DNA 和 RNA。
![]()
論文地址:https://www.biorxiv.org/content/10.1101/2025.10.03.679414v2
NA-MPNN 在 RNA 序列設計和固定對接蛋白質 - DNA 特異性預測任務上優于現有方法,預計將在從頭 RNA 結構設計與 DNA 結合特異性預測領域發揮廣泛作用。
NA-MPNN
大衛?貝克(David Baker)團隊此前開發的蛋白質序列設計方法 ProteinMPNN,解決了蛋白質逆折疊問題。團隊推斷可通過擴展 ProteinMPNN 使其能計算核酸骨架,從而開發通用生物聚合物序列設計(逆折疊)網絡。
ProteinMPNN 采用以殘基為節點的圖神經網絡架構,但其節點僅支持蛋白質殘基。而在新模型 NA-MPNN 中,節點可包含蛋白質殘基、DNA 或 RNA 堿基,節點間連接支持蛋白質 - 蛋白質、核酸 - 核酸及蛋白質 - 核酸三類。
NA-MPNN 沿用 ProteinMPNN 的策略,采用殘基標簽平滑技術降低模型過自信,編碼器與解碼器架構與 ProteinMPNN 和 LigandMPNN 保持一致。
![]()
在架構層面,NA-MPNN 與 ProteinMPNN 存在兩點主要差異。
首先,每個殘基節點采用顯式聚合物類型 one-hot 編碼(蛋白質 / DNA/RNA)作為初始特征,取代了零值初始化方案。
其次,token 表經擴展后統一表征核酸:每種典型堿基的脫氧核糖與核糖形式共享單一 token(DA/A、DC/C、DG/G、DT/U),并增設未知核酸 token(DX/RX)。這促進了 DNA 與 RNA 語境間的交叉學習,在 NA-MPNN 不涉及側鏈化學信息的前提下顯得尤為珍貴,實驗表明該設計提升了驗證集的序列恢復率。
![]()
盡管 NA-MPNN 采用統一圖架構處理所有聚合物(蛋白質 / DNA/RNA),但研究團隊訓練了兩種任務專用模型:面向骨架約束序列設計的設計模型,以及用于固定對接蛋白質 - DNA 結合偏好的特異性模型。兩類模型均采用逐位置交叉熵優化,但監督目標不同。設計模型以晶體學序列為監督目標,特異性模型則以經驗位置概率矩陣為監督目標。
模型效果
NA-MPNN 為骨架條件化 RNA 序列設計領域樹立了新標準。在給定 RNA 結構的情況下,NA-MPNN 能穩定恢復 60.5% 的天然堿基身份,且通過 RibonanzaNet 和 AlphaFold 3 對 NA-MPNN 生成的序列進行結構預測,預測出的二三級結構,比 gRNAde 與 RhoDesign 的結果更接近輸入結構。
![]()
NA-MPNN 還與基于擴散過程的蛋白質核酸骨架生成器 RFDpoly 相結合,成功從頭設計了經電子顯微鏡驗證具有預期二三級折疊的 RNA 及蛋白質 - DNA 復合物,彰顯了該模型在正向大分子工程工作流中的實用價值。
在蛋白質 - DNA 結合特異性預測方面,NA-MPNN 在固定對接蛋白質 - DNA 特異性預測中達到頂尖精度。在 RFNA/RFAA 蒸餾復合物實驗 PPM 數據集上,盡管僅依據骨架坐標且忽略蛋白質側鏈原子,NA-MPNN 仍較 DeepPBS 顯著降低了平均絕對誤差與交叉熵的中位數。這種側鏈無關的建模方式避免了目標 DNA 序列信息泄露,從而為 DNA 結合蛋白設計提供了嚴格的早期篩選方案。
![]()
研究團隊預計 NA-MPNN 將成為轉錄因子研發流程中的重要組成部分,實現快速、結構感知的特異性譜篩選,而無需承擔側鏈采樣的計算開銷。
總的來說,NA-MPNN 為 RNA 序列設計與蛋白質 - DNA 結合特異性預測提供了穩健高效的工具,預計該模型將在下一代人工 RNA 分子、轉錄因子及基因組工程工具的創制中發揮廣泛作用。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.