![]()
撰文丨王聰
編輯丨王多魚
排版丨水成文
人工智能(AI)已經徹底改變了分子的結構預測和設計,然而當前的 AI 模型通常依賴于針對特定任務定制的專門算法。
所有分子任務本質上都遵循原子間相互作用的通用物理規律。這自然引出一個關鍵問題——能否借鑒自然語言、視覺等領域的基礎模型范式,通過大規模數據訓練構建統一的原子級模型,以捕捉分子相互作用的基本原理?
然而,要想統一分子任務,仍面臨著三大挑戰:首先,雖然文本提示在大語言模型中效果顯著,但用自然語言描述涉及復雜空間關系或多分子片段的分子任務時存在精度不足的缺陷;其次,現有生成式 AI 模型擅長單一任務,但其對任務特定先驗分布和采樣流程的依賴,阻礙了多任務協同學習的實現;最后,分子表示形式缺乏統一標準,當前模型采用的類型專用格式限制了跨任務與分子類型的遷移能力。
2026 年 2 月 18 日,清華大學馬劍竹、首都醫科大學宣武醫院王子華、北京大學國際癌癥研究院韓傳輝、清華大學王新泉作為共同通訊作者(北京大學彭新港為論文第一作者),在國際頂尖學術期刊Cell上發表了題為:Unified modeling of 3D molecular generation via atomic interactions with PocketXMol 的研究論文。
該研究推出了一個統一的原子級生成模型——PocketXMol,統一了蛋白質口袋相互作用相關的生成任務,通過使用原子提示作為任務規范,PocketXMol 支持包括小分子和多肽的結構預測以及從頭設計,無需針對特定任務進行微調。PocketXMol 在 13 個計算基準中的 11 個上取得了最先進(SOTA)表現,在其余 2 個中也保持了競爭力,超越了 55 個基線模型。研究團隊將 PocketXMol 應用于設計 caspase-9 小分子抑制劑,其效力與商業化的泛 caspase 抑制劑相當;研究團隊還使用 PocketXMol 生成了 PD-L1 結合多肽,成功率遠超文庫篩選,結合親和力達納摩爾級,可特異性結合 PD-L1 陽性細胞,配體抑制實驗和體內肺腫瘤成像驗證了其治療和診斷潛力。
總的來說,PocketXMol像一個精通“原子樂高”的萬能設計師, 為 AI 輔助藥物發現提供了一個通用平臺,有望徹底改變我們發現新藥的方式。
![]()
該研究的亮點:
原子級 AI 模型 PocketXMol 統一了分子生成任務;
PocketXMol 在 13 項計算任務中的 11 項上達到了最先進(SOTA)性能;
PocketXMol 設計的 caspase-9 小分子抑制劑媲美市售藥物;
PocketXMol 設計的多肽表現出對 PD-L1 的高親和力,并在體內顯示出腫瘤靶向性。
新藥研發的“老大難”:耗時、燒錢、靠運氣
傳統藥物研發就像大海撈針。科學家們需要從數百萬甚至數十億個化合物中,篩選出能與特定疾病靶點(通常是蛋白質上的一個“口袋”)結合的那一個。這個過程耗時漫長(平均超過 10 年)、耗費巨大(數十億美元),且失敗率極高。
盡管 AI 已廣泛用于預測蛋白質結構或篩選化合物庫,但大多數模型都是“專才”——有的只擅長把已知分子“對接”到口袋,有的只擅長設計小分子,還有的只擅長設計多肽。想要完成不同的任務,就得切換不同的模型和算法,既繁瑣又限制了創新。
PocketXMol:一位“原子級”的萬能藥物設計師
PocketXMol的核心突破在于統一性。它不再將分子視為氨基酸或化學基團等預制模塊,而是直接處理最基礎的單元——原子(碳、氮、氧等)和化學鍵。
統一的“語言”:無論是小分子還是多肽,在 PocketXMol 眼里,都是一套原子和化學鍵的集合。這種“原子級”的表示方法,讓它能無縫處理各種分子類型。
靈活的“任務說明書”:研究團隊通過一套“任務提示”(Task Prompt)機制,以原子為單位告訴模型:哪些部分是已知的(比如蛋白質口袋的結構、已有的分子片段),哪些部分是需要生成的,這就像給 AI 一張帶有標記的草圖,它就能補全整個分子。
“一通百通”的訓練:PocketXMol 采用了一種“通用去噪器”架構,在包含近 1200 萬個小分子、4 萬多個蛋白質-多肽復合物和 8.5 萬多個蛋白質-小分子復合物的海量數據上進行了聯合訓練。它學習的是原子之間相互作用的基本物理規律,因此學會一個任務(例如分子對接),就能舉一反三,應用到其他任務(例如藥物設計)上,無需針對每個任務重新訓練。
![]()
簡單說,PocketXMol 把藥物設計的不同任務,統一成了“在原子層面,根據給定的條件和規則,生成合理的原子和化學鍵排列”這一件事。
表現如何?在 13 項任務中,11 項達到頂尖水平
研究團隊在 13 個關鍵的計算任務上對 PocketXMol 進行了全面測試,對手是 55 個不同的專業基線模型。結果令人驚嘆:
小分子藥物設計:在 100 個測試口袋上生成分子,在 13 項任務中的 11 項排名第一。其生成分子在結合親和力和三維結構合理性上均表現出色。
分子對接:無論是小分子還是多肽對接,其準確率與 AlphaFold 3 模型相當,且在對接含有非標準氨基酸的多肽時優勢明顯。
多肽設計:設計的 PD-L1 靶向多肽,在實驗驗證中表現出極高的成功率。從 382 條合成多肽中,篩選出 15 條結合親和力達到納摩爾級別(10?? M)的候選分子,遠超隨機肽庫篩選的結果。
實用性驗證:
設計 caspase-9 抑制劑:針對這個重要的癌癥靶點,PocketXMol 設計了 16 個小分子。其中一種(分子 84663)在實驗中能有效抑制 caspase-9 及其下游信號,效果與商業化的廣譜 caspase 抑制劑相當,經過優化得到的分子 D12,效果更為突出。
設計 PD-L1 靶向多肽:設計出的多肽不僅能高親和力結合 PD-L1 蛋白,在細胞實驗和肺癌小鼠模型中,還能精準定位到腫瘤部位,顯示出用于腫瘤成像和免疫療法的巨大潛力。
![]()
超越“拼接”,實現真正的“生成”
與以往許多需要分步進行(先搭骨架、再設計序列、最后填充側鏈)的模型不同,PocketXMol 的“原子級”特性帶來了獨特優勢:
直接生成非標準氨基酸:因為它直接“捏”出側鏈的每個原子,所以能輕松設計出自然界不存在的、具有特殊功能的非標準氨基酸,極大擴展了多肽藥物的設計空間。
精準結合實驗驗證:生成的多肽的三維結合構象與實驗測得的相互作用高度吻合,突顯了其預測的準確性。
PocketXMol為代表的技術,標志著 AI 驅動藥物研發正從“預測與篩選”邁向“生成與設計”的新階段。它將復雜的分子設計過程,變成了一個更直接、更統一的 AI 生成問題。未來,隨著模型的進一步優化和應用,我們有望看到更多針對“不可成藥”靶點的創新療法被快速設計出來,最終惠及全球患者。
論文鏈接:
https://www.cell.com/cell/fulltext/S0092-8674(26)00050-4
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.