機器學習技術和理論計算方法的融合,正讓多相催化劑的理性設計走向一個新的階段。北京大學蔣鴻課題組在《科學通報》“人工智能驅動的材料科學研究專題”發表題為“理論多相催化計算中的機器學習方法: 現狀與挑戰”的綜述文章,系統總結了機器學習方法在理論多相催化計算中的現狀與挑戰,以及它帶來的機遇與變革。
研究背景
![]()
為提高催化效率、降低多相催化反應的能耗,催化劑的理性設計已成為當前多相催化研究的熱點。以密度泛函理論 (DFT) 為代表的理論計算方法能夠根據相對簡單的模型得出催化反應的熱力學和動力學信息,在催化劑設計中發揮著重要作用。然而,由于時間尺度和空間尺度的問題,這樣的計算方法難以推廣到足夠復雜的多相催化反應體系。為了解決類似的問題,理論多相催化領域迫切需要一種計算量相對小但仍保持較高精度的研究策略,這可以通過機器學習方法解決。
針對特定催化問題的統計學習模型
![]()
在現代機器學習方法出現之前,多相催化研究已嘗試通過物理描述符建立不同量之間的關系。如Sabatier原理提出理想催化劑應具有適中的吸附能力,在實際應用中常以火山形曲線表示。該原理背后實際上是線性標度關系,以此啟發了后續的多元線性回歸方法。隨著研究深入,如何考慮不同描述符的非線性關聯成為問題所在。歐陽潤海等人提出的SISSO方法通過自動構建復合描述符并結合LASSO回歸,能夠提取出復雜環境下的非線性關聯,在近些年得到了廣泛應用。此外,多相催化領域還關注于如何將這類統計學習模型與實驗數據結合形成主動學習回路,以此助力于自動化實驗探索。
針對復雜多相催化體系的機器學習勢方法
![]()
機器學習勢是一類通過機器學習模型擬合第一性原理勢能面,構造兼具第一性原理精度和經典經驗性力場計算效率的機器學習勢能面求解器的方法。其中,神經網絡勢方法通過神經網絡表示體系中各原子能量貢獻對局域化學環境的依賴性,在概念和方法上具有最廣的多樣性,如劉智攀課題組開發的LASP軟件、蔣彬課題組開發的EANN勢、張林峰等開發的深度勢能(DP)模型等,它們已在針對多相催化領域各類問題的理論模擬中得到了廣泛的應用。近年來,通用機器學習勢逐漸得到了關注,它們能構建跨多種元素類型和不同結構特征的表示,并在海量數據集上訓練獲得優秀性能,有望在界面結構和化學鍵解離等關鍵問題上有更好表現,并在多相催化理論模擬中具有廣闊的發展和應用前景。
生成式人工智能
![]()
生成式人工智能的快速發展為物質科學研究帶來了新機遇,以ChatGPT為代表的大語言模型(LLMs)在多相催化等化學領域的應用前景廣闊。經過針對性訓練的化學專用LLMs,如ChemDFM,已在分子識別、設計及反應預測等任務中展現優越性能。生成式人工智能亦在催化體系模擬中嶄露頭角,如GAN模型可基于DFT數據生成高效催化劑表面,但在多樣性與效率上存在不足。而擴散模型則憑借其強大的數據生成能力,在快速預測材料結構、化學反應過渡態及催化劑表面結構方面表現突出,這類方法在未來大有可為。
展望
![]()
近十年來 AI for Science 的大背景下,理論多相催化計算領域內的新機器學習策略層出不窮 : SISSO 擬合、通用機器學習勢、擴散生成式模型等方法為理論多相催化提供了更多可能性。然而,新的挑戰也隨之而來,包括但不限于模型物理可解釋性與描述符可解釋性的距離、針對表面催化等多元素復雜體系機器學習勢函數的訓練和應用仍然存在挑戰,以及生成式模型在理論多相催化的應用有待進一步探索等。展望未來,隨著 AI 技術的不斷進步,我們可以相信 AI 驅動的催化劑理性設計時代終會到來。
文章信息
![]()
劉照清, 鄧哲, 蔣鴻. 理論多相催化計算中的機器學習方法: 現狀與挑戰. 科學通報, 2025, 70: 4081–4097
doi: 10.1360/TB-2024-1207
![]()
轉載、投稿請留言
| 關注科學通報 | 了解科學前沿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.