![]()
編輯丨coisini
分子動力學(MD)模擬已成為理解分子尺度物理、化學與生物過程不可或缺的工具,在揭示復雜分子體系的微觀行為機制方面具有巨大潛力。
然而,傳統的 MD 方法因為模擬的時間尺度有限,其有效性常受限于稀有事件相關的長時間尺度問題。為應對該挑戰,增強采樣方法應運而生,近年來更是與機器學習技術日益深度融合。
![]()
近期,浙江大學藥學院侯廷軍團隊聯合意大利技術研究院(IIT)等發布了一篇綜述 ——《Enhanced Sampling in the Age of Machine Learning: Algorithms and Applications》,全景解析了在機器學習技術的加持下,增強采樣方法的發展。浙江大學藥學院博士生祝凱是綜述共同一作。
![]()
綜述地址:https://arxiv.org/pdf/2509.04291
綜述概覽
該綜述旨在全面闡述 ML 與增強采樣技術融合的方法論進展,并為關注實際應用的研究者提供實踐視角。綜述展示了跨領域應用案例,重點分析了實際部署此類模型的需求與挑戰,涵蓋蛋白質折疊等生物構象變化、配體結合熱力學與動力學、化學催化反應及結構相變等重要領域。
![]()
在眾多機器學習與增強采樣的融合方向中,最具實質性和廣泛性的進展體現在集合變量(collective variable,CV)的構建方面,但由于即使采用近似變量也能實現顯著的加速效果,因此帶來了兩方面影響:一方面,它催生了多樣化策略與學習目標的開發應用;另一方面,由于缺乏單一明確的目標,方法學變體激增。
![]()
除構建 CV 外,機器學習還在多個層面推動增強采樣技術發展:包括表征偏置勢能、優化自由能微擾方案、指導副本交換協議等。
![]()
![]()
一些頗具前景的新方法正嶄露頭角,例如完全用機器學習算法取代偏置方案,甚至用生成模型替代傳統采樣。但這些研究仍處于萌芽階段,盡管前景可觀,新方法在成為通用解決方案之前仍面臨重大障礙,尤其對于具有大量自由度(如溶劑分子)的大型真實體系。
綜述指出:將機器學習技術加持的增強采樣方法擴展到更大更復雜的異質體系(如固有無序蛋白、生物分子組裝體或真實催化環境)仍存在巨大挑戰。關鍵原因在于這些方法的部署尚未實現全自動化:仍需大量化學直覺來選擇初始條件、定義合適表征方式及識別目標過程。
要實現全自動增強采樣的目標,需要在多個層面取得突破:
首先,表征學習的進步至關重要。對復雜大型體系而言,構建合適描述符仍是主要瓶頸,往往需要深厚的領域專業知識。
第二,將集合變量學習與偏置勢能學習統一于端到端框架尤其值得關注。傳統上這兩個環節相互分離,若將低維表征識別與偏置勢的自適應構建耦合,可以形成全集成工作流,實現探索與收斂的雙重自動化。
第三,隨著方法學復雜度和表現力的提升,可解釋性成為緊迫議題。領域需與可解釋人工智能更緊密融合,以確保工具保持透明性、可解釋性和實踐可用性。
要實現這些突破,還需進一步加強增強采樣與機器學習勢函數的融合,并開發統一的軟件生態系統,無縫集成工作流的所有環節:從表征學習與集合變量構建,到偏置方案設計、機器學習勢函數應用,再到后處理分析工具與結果解讀。
這些進展共同作用,終將把分子動力學轉化為真正的「計算顯微鏡」,在擴展時空尺度上揭示復雜物理、化學、生物體系的結構、動力學與反應活性,提供原子級的機理洞察。
感興趣的讀者可以閱讀綜述原文,了解更多研究內容。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.