
近年來,人工智能(AI)在分子結構預測與藥物設計領域取得了革命性的進展,例如AlphaFold 3等模型的問世極大地推動了結構生物學的發展。然而,當前的主流AI生成模型往往局限于特定的分子類型或任務,例如專門用于小分子對接、或者專門用于多肽序列設計,它們高度依賴為特定任務量身定制的算法與先驗分布。
這種“各自為戰”的局面源于一個核心挑戰:不同類型的分子(如小分子與蛋白質)通常使用截然不同的底層表示方式,這本質上限制了模型在不同分子類型和任務之間的遷移與通用性。此外,雖然自然語言提示在大型語言模型中大放異彩,但對于定義涉及復雜空間關系或多個分子片段的微觀化學任務而言,自然語言顯得過于模糊,不夠精確。由于所有的分子交互任務歸根結底都受制于基礎的原子間相互作用物理法則,一個自然的問題隨之產生:我們能否開發一個統一的、基于原子級別的AI基礎模型,通過學習海量數據來捕捉最底層的分子相互作用,從而在一個框架內解決所有基于口袋的藥物生成任務?
為了打破現有模型的局限性,近日,清華大學馬劍竹、首都醫科大學宣武醫院王子華、北京大學韓傳輝、清華大學王新泉聯合研究團隊,在Cell上發表了文章Unified modeling of 3D molecular generation via atomic interactions with PocketXMol,正式推出了一種全新的原子級生成式AI大模型——PocketXMol。該模型首次在同一框架內實現了小分子與多肽3D結構預測和從頭設計的“大一統”。
![]()
1. 三大核心技術創新,打破任務與分子類型的壁壘:PocketXMol摒棄了傳統的“氨基酸序列”或特定化學基團的顯式建模,直接將輸入的分子抽象為最基礎的“原子”和“化學鍵”的集合。為了實現多任務的統一,模型引入了三個關鍵組件:
原子級任務提示(Task Prompt): 創新性地使用二進制指示符(binary indicators)來精確控制哪些原子或化學鍵是已知的,哪些是需要生成的。這種方法比文本提示更精確地定義了輸入和輸出的空間與結構關系。
通用去噪器(Universal Denoiser): 采用了一種通用的去噪架構,能夠自動識別輸入分子中不同任務對應的噪聲類型和尺度。這使得不同任務的數據分布被映射到一個統一的噪聲空間中,從而允許模型在不進行任何“特定任務微調(fine-tuning)”的情況下,直接進行聯合多任務訓練并應用于新任務。
統一的原子級分子表示: 無論是小分子還是線性/環狀多肽,在模型眼中都是原子級別的三維排布。這種表示不僅無縫銜接了各類分子,還使其天然具備了設計非天然氨基酸(NAA)的能力,這對于現代多肽藥物開發至關重要。
2. 卓越的計算性能:在13項基準測試中擊敗55個前沿模型研究團隊構建了一個包含超1100萬個小分子、數萬個蛋白質-多肽以及蛋白質-小分子復合物的三維結構超大規模數據集對PocketXMol進行了聯合訓練。
在涵蓋小分子對接、多肽對接、3D構象預測、基于結構的藥物設計(SBDD)、PROTAC(蛋白降解靶向嵌合體)設計、片段連接與生長、分子優化、線性與環狀多肽設計等13項計算生成任務的全面評估中,PocketXMol與55個基準模型(包括AlphaFold 3、RFdiffusion、ProteinMPNN等)進行了對比。結果顯示,PocketXMol在其中11項任務上取得了當前最佳(State-of-the-art)的表現,并在剩余2項任務中保持了極高的競爭力。
3. 出色的濕實驗驗證:從小分子抑制劑到體內腫瘤靶向多肽為了驗證該AI模型的真實臨床轉化潛力,研究團隊針對具有高度挑戰性的抗腫瘤靶點進行了嚴格的濕實驗(Wet-lab)驗證,并取得了令人矚目的成果:
設計新型Caspase-9小分子抑制劑: Caspase-9介導的細胞內源性凋亡是阻礙腫瘤內源性免疫感應途徑的主要障礙之一。然而,現有的泛Caspase抑制劑難以對Caspase家族成員進行有效區分。研究團隊利用PocketXMol專門針對Caspase-9設計了新型抑制劑。合成的16種分子中,優化后的化合物(如D12)不僅能強效抑制Caspase-9及下游Caspase-3的激活,其抑制效力甚至可與市面上的商業泛Caspase抑制劑(如QVD)相媲美。酶學實驗進一步證實,D12不直接抑制Caspase-3,展現出了高度的靶向特異性。
開發靶向PD-L1的高親和力抗癌多肽: 針對著名腫瘤免疫檢查點PD-L1,PocketXMol直接“從頭設計”了數十種候選多肽。在實驗合成并測試的382種多肽中,有15種候選多肽對PD-L1的結合親和力(KD)達到了驚人的10-8M級別,這一命中率遠遠超過了傳統隨機多肽文庫的篩選效率。細胞實驗證實,代表性多肽(如P282)能夠特異性地結合在PD-L1陽性肺癌細胞(H1975)的細胞膜上,并有效阻斷PD-1與PD-L1的相互作用。更為關鍵的是,活體動物熒光成像實驗表明,通過靜脈注射的熒光標記AI多肽能夠快速、精準地在小鼠的腫瘤部位富集,展示了其作為腫瘤診斷探針及靶向治療藥物的巨大潛力。
總之,這項工作標志著人工智能在微觀分子世界“基礎大模型”構建上邁出了里程碑式的一步。PocketXMol模型通過學習最底層的原子級相互作用,成功彌合了3D結構預測與分子生成設計之間的鴻溝,首次證明了單一的AI基礎模型足以勝任并統一涵蓋小分子、多肽以及PROTAC等多種模態的藥物設計任務。憑借其卓越的計算性能與已被實驗證實的真實靶向藥物設計能力,PocketXMol為AI驅動的創新藥發現(AIDD)提供了一個強大而通用的平臺,有望極大加速未來各類重大疾病新型療法的研發進程。
![]()
https://www.cell.com/cell/fulltext/S0092-8674(26)00050-4
學術合作組織
(*排名不分先后)
![]()
戰略合作伙伴
(*排名不分先后)
![]()
![]()
轉載須知
【非原創文章】本文著作權歸文章作者所有,歡迎個人轉發分享,未經作者的允許禁止轉載,作者擁有所有法定權利,違者必究。
BioArt
Med
Plants
人才招聘
近期直播推薦

點擊主頁推薦活動
關注更多最新活動!
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.