編者語:
“模型不需要理解整個結構,只需要理解局部原子環境的物理特性,EMLP能夠像DFT一樣真正描述原子間相互作用。”
01

背景介紹
催化研究領域,密度泛函理論(DFT)數十年來一直是揭示催化反應微觀機理的核心工具。然而,隨著研究的深入,DFT的計算瓶頸日益凸顯,其計算成本隨體系規模呈指數級增長,使得研究大型復雜體系或探索動態反應網絡變得不切實際。雖然經典力場方法計算成本較低,但在定量精度和普適性方面遠不及量子力學方法。
![]()
圖1. 用于材料模擬的機器學習方法
神經網絡機器學習勢函數(MLPs)的出現開始緩解這一矛盾(圖1),能夠在保持DFT級精度的同時實現接近經典力場的計算效率。但當前的MLP方法存在一個根本性局限——它們通常“系統依賴”,即只能在訓練時見過的特定結構體系上表現良好。這就像是一個只會解答特定題目的學生,遇到新問題就束手無策。
2025年9月23日,上海科技大學/英國貝爾法斯特女王大學胡培君、上海科技大學謝聞博團隊在Nature Catalysis期刊發表題為“General reactive element-based machine learning potentials for heterogeneous catalysis”的研究論文,開發了一種革命性的元素級機器學習勢函數(EMLP),通過獨特的隨機探索虛擬化學優化(REICO)采樣策略(圖2),打破了這一局限。該方法不再依賴特定的結構或反應路徑,而是專注于學習元素間的基本相互作用,從而實現了真正的普適性和反應性預測能力。
![]()
圖2. 圖文總覽
02

核心創新
1.革命性采樣策略:REICO方法
該研究提出了隨機探索虛擬化學優化(REICO)采樣策略,徹底改變了傳統機器學習勢函數的訓練數據生成方式。與傳統方法依賴特定表面結構或反應路徑不同,REICO通過完全隨機采樣來構建訓練數據集,生成包含隨機晶胞參數、原子數量和元素比例的虛擬化學結構。這種方法使訓練數據完全脫離結構空間的限制,專注于原子間相互作用的多樣性本質。
2.元素級機器學習勢函數(EMLP)架構
開發了元素級機器學習勢函數(EMLP)新架構,其核心創新在于僅需要知道涉及元素即可構建模型,無需任何領域專業知識。通過多階段選擇方案,從數百萬隨機結構中精選出最具代表性的數據點,確保了訓練集既包含隨機結構的多樣性,又涵蓋穩定結構的合理性。
3.卓越的普適性與反應性
EMLP展現了前所未有的普適性預測能力,能夠準確處理訓練時未見過的任意結構體系。在二聚體掃描測試中,EMLP精確預測了各種元素組合的相互作用;在分子動力學模擬中,其軌跡與DFT參考高度一致;在復雜催化反應網絡中,EMLP成功預測了從簡單表面到特殊表面的各種反應能壘和焓變。
4.多相體系的統一描述
實現了固液氣多相體系的統一精確描述,超越了傳統MLP的應用局限。研究證明EMLP不僅能準確預測多相催化反應,還能可靠模擬有機化學反應、表面動力學和液相環境,展示了其真正的通用性和跨領域應用潛力。
5.計算效率與可及性
相比傳統方法,REICO-EMLP框架具有顯著的計算效率優勢,僅需要約10,000個結構/元素的訓練數據即可達到優異性能。這種modest的CPU和GPU需求使該方法具有廣泛的可及性,為大規模推廣應用奠定了基礎。
![]()
圖3. REICO采樣、EMLP訓練流程及應用總結
03

圖文解析
1.開發了通用且高精度的EMLP勢函數
研究團隊構建了針對Pd-Ag催化劑與含C/H/O物種相互作用的Ag-Pd-C-H-O五元素EMLP。該勢函數僅基于元素信息,無需預設反應路徑或特定結構,即能實現與密度泛函理論(DFT)相媲美的定量精度。測試表明,其在能量和力預測上的誤差顯著低于MACE-mp、EquiformerV2和M3GNet等現有主流基礎模型。通過與傳統分子動力學(MD)采樣數據的對比,REICO生成的數據集不僅涵蓋了MD樣本的所有區域,還在能量和局部原子環境方面實現了顯著擴展。這種隨機采樣方法有效避免了傳統方法因過度依賴穩定金屬結構的周期性對稱性而導致的過擬合問題。
![]()
圖4. 分析RECIO生成的數據集和二聚體掃描性能
2.在多項基準測試中表現優異
二聚體掃描測試:對所有元素組合的二聚體相互作用預測與DFT結果高度吻合,準確捕捉了短程排斥作用和原子分離時的力變化趨勢。
分子動力學模擬:在Ag28O22和Pd34O56團簇的MD模擬中,EMLP軌跡與DFT
大分子吸附:對包含364個原子的PTCDA分子在Ag(111)表面的弛豫,EMLP精確預測了吸附構型和分子-表面距離。
![]()
圖5. 來自EMLP和其他基礎模型的MD和表面吸附結構預測
3.在多相催化反應預測中實現突破
研究系統評估了CO氧化、乙炔加氫、費-托合成等多個典型催化反應體系:
CO氧化:在多種Pd和Pd/Ag表面(包括簡單晶面、孿晶界、納米棒及單原子催化劑)上,EMLP均能準確預測反應能壘和焓變。
表面覆蓋效應:成功預測了清潔Pd(111)和氫覆蓋Pd(111)表面的乙炔加氫反應路徑,與DFT結果高度一致。
復雜反應網絡:對費-托合成過程中從C1到C6的21個基元步驟,EMLP完整復現了DFT計算的能量曲線,過渡態搜索成功率達100%。
![]()
圖6. 各種鈀和 Pd/Ag 表面上 CO 氧化反應的預測
![]()
圖7. 對具有覆蓋效應的各種鈀基表面上C2H2氫化(氫原子逐步添加到C2H2中形成C2H6)的反應預測。
![]()
圖8. 對 Pd(100) 上費托合成反應的擴展反應路徑的反應預測
4.超越多相催化的廣泛應用能力
研究還將EMLP拓展至有機化學反應、固-液界面和水溶液環境等多個領域:
有機反應標準測試:對Baker和Chan提出的標準測試反應,EMLP預測的活化能和反應焓與DFT值偏差僅0.1-0.2 eV。
液相環境模擬:通-過umbrella sampling獲得了Pd(111)表面CO氧化在explicit 水分子存在下的自由能剖面,與DFT結果高度一致。
溶液體系結構:對液態甲醇的徑向分布函數模擬成功復現了氫鍵網絡等關鍵結構特征。
![]()
圖9. 跨固相、液相和氣相的附加基準
04

總結
這項研究代表了機器學習勢函數發展的范式轉變:構建多相催化MLP不再僅僅是一個回歸問題,而根本上是一個采樣問題。通過REICO采樣策略,研究團隊成功地將訓練集構建與傳統的"有意義結構"概念分離,專注于生成多樣化和代表性的局部原子環境。
EMLP 的卓越性能體現在: 1 )在目標元素領域內實現了普適性和反應性的平衡; 2 )能夠準確預測任意結構的能量和力; 3 )在復雜催化反應網絡中保持高度一致性; 4 )超越多相催化的廣泛應用能力。
05

展望(巨人肩上前行)
1. 增加訓練數據規模來系統探索和提升EMLP的潛力。
2. 將自旋態、磁性、長程相互作用和外部場等更復雜的化學信息納入EMLP框架,拓展其應用范圍?
3. 利用EMLP的直接反應模擬能力,大規模研究反應機理和動力學。
文獻信息
Changxi Yang, Chenyu Wu, Wenbo Xie, Daiqian Xie & P. Hu, General reactive element-based machine learning potentials for heterogeneous catalysis, Nature Catalysis, 2025, 8, 891-904.
聲明:
1. 版權:推送內容僅供學習交流分享使用,無任何商業用途,如有侵權,請聯系后臺刪除或修改,感謝支持。
2. 投稿:非常歡迎各位老師在公眾號上介紹課題組前沿或經典研究成果!后臺或郵箱聯系即可!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.