近日, 加州大學伯克利分校的Bingqing Cheng提出了一種新的描述靜電相互作用的方法——隱空間內的Ewald求和(Latent Ewald Summation, LES), 其代碼可作為通用模塊加入絕大多數短程機器學習力場(machine learning force field, MLFF), 對具有離子性和強極性的體系進行更精準的研究. 該工作在 npj Computational Materials 發表 [1] .
近年來, MLFF的飛速發展使得以接近第一性原理的精度和接近傳統反應力場的速度進行原子模擬成為可能. 很多MLFF將整個體系的能量分解為原子的貢獻之和, 將原子周圍某個截斷半徑內化學環境(描述符)作為輸入, 通過神經網絡得到原子對體系總能量的貢獻. 這種分解方式使得原子的貢獻幾乎不依賴于截斷半徑之外的信息, 其合理性是基于Kohn提出的所謂近視性原則(nearsightedness), 然而近視性原則的前提是體系中沒有離子之間的長程相互作用, 如靜電能 [ 1 , 2 ] . 因此若要對離子性和強極性體系如離子晶體, 熔鹽, 鹽溶液等進行準確描述, 需要向這些短程的MLFF增加可以表示長程相互作用的機制.
早在2011年, Behler等人就在其提出的名為HDNNP的MLFF中加入了靜電能修正用于描述氧化鋅, 其通過和HDNNP相同架構的額外的一組神經網絡來預測原子所帶電荷, 再用Ewald求和以獲得體系靜電能, 稱之為第三代HDNNP [3] . 后續Behler等人又提出第四代HDNNP, 通過神經網絡預測電負性, 再通過電荷均衡(charge equilibration, QEq)來獲得具體電荷數值 [4] . 類似的機制還包括鄂維南帶領深度勢能團隊提出的DPLR, 其中需要擬合的則是Wannier軌道中心(Wannier centers) [5] . 這些直接增加靜電能修正的機制符合物理直覺, 但是其訓練過程分為兩步: 首先需要擬合原子所帶部分電荷, 然后從能量和力中扣除靜電修正后再進行短程相互作用的擬合. 而且部分電荷并非可觀測量, 不同的布居分析方法會給出不同的部分電荷數值, 從而影響實際靜電能的貢獻. 也有一些機制不直接增加靜電能, 而是通過長程的消息傳遞(message passing)隱式學習長程相互作用, 比如Ceriotti等人提出的LODE和LOREM [ 6 , 7 ] , Gunnemann等人提出的EwaldMP [8] , 鄭南寧等人提出的Neural P3M [9] 等. 這些基于長程消息傳遞的方法也都參考了倒空間內的Ewald求和, 因為最原始的Ewald求和就可視作標量特征的長程消息傳遞. 其優點在于不受靜電相互作用形式局限, 可以將矢量甚至張量特征進行長程消息傳遞, 因此可以學習到更復雜的相互作用. 然而由于沒有將部分電荷納入模型, 如果要在電場中進行模擬就不甚容易.
Bingqing Cheng提出了隱空間內Ewald求和(Latent Ewald Summation, LES)這樣一種新的描述靜電相互作用的方法 [1] , 通過MLFF的標量描述符同時讀出部分電荷和短程能量貢獻, 再通過Ewald求和或者實空間內長程部分的求和來獲得靜電能, 相加后得到總能量. 即若 i 原子的標量描述符為 Bi , 則其對短程能量的貢獻為 Ei = MLP E ( Bi ), 其帶的部分電荷為 Qi = MLP Q ( Bi ), 總能量 E = ∑ iEi + E lr({ Qi })為 Bi 的函數, 這里MLP E 和MLP Q 為兩個用于讀出的多層感知機(multilayer perceptron, MLP), E lr為靜電能求和. LES的獨特之處在于無需分兩步擬合部分電荷和短程部分, 而是通過一步擬合總能量和力來隱式學習部分電荷. 這就避免了前述不同布居分析方法對部分電荷數值的影響, 使得靜電力和短程力更相容.
為檢驗LES方法表示靜電相互作用的效果, Cheng在分子/離子二聚體, 界面水和體相水等體系中都進行了基準測試, 在增加LES模塊后測試的短程MLFF都取得了更準確的結果. 在分子/離子二聚體體系中, 短程MLFF在二聚體間距超過截斷半徑后預測的結合能只能為0, 定性上不正確, 而增加LES后結合能曲線和參考值一致, 預測的力也更符合參考值( 圖1(a) ). 在界面水和體相水體系中短程MLFF對水的偶極特性的描述也存在問題, 在界面水體系中界面偶極沒有被恰當地屏蔽而是穿透到體相當中( 圖1(b) ), 在體相水體系中偶極密度關聯函數的徑向部分在長波( k →0)處增大( 圖1(c) ), 增加LES模塊后這些問題也都得到了解決. 后續工作中Cheng等人還推導了LES框架下Born有效電荷(Born effective charge, BEC)的計算方法 [10] , 對比了RPBE-D3方法下密度泛函微擾法計算的和LES學習到的體相水的BEC, 發現兩者吻合較好, 說明LES方法能夠隱式地學習到靜電響應特性( 圖1(d) 插圖). 利用線性響應范圍內BEC張量乘以電場即為電場力, 他們在不同外加電場中進行了模擬并獲得了體相水的紅外光譜, 觀察到電場下的峰位移動和DFT分子動力學一致, O–H伸縮振動模式紅移, 低頻分子間模式藍移, 也證明了LES方法在外加電場中仍然是有效的( 圖1(d) ).
![]()
圖1
LES方法在不同體系中的基準測試 [ 1 , 10 ] . (a) 分子/離子二聚體體系, 從左到右為離子-離子(charged-charged, CC)、離子-分子(charged-polar, CP)和分子-分子(polar-polar, PP)二聚體體系的基準測試, 包括短程MLFF(short-ranged, SR)和加入LES后的長程MLFF(long-ranged, LR)計算的結合能和受力與基準結果的對比; (b) 界面水體系, 消息傳遞層數 T = 0和1時, SR和LR模擬的偶極取向cos θ 的平均值, 其中 θ 為水分子偶極和真空層方向的夾角; (c) 體相水體系, 消息傳遞層數 T = 0和1時, SR和LR模擬時倒空間內的偶極密度關聯函數的徑向部分, 插圖展示長波部分; (d) 電場下的體相水體系, 不同電場強度下LR模型模擬得到的水的紅外光譜, 插圖展示LR模型隱式學習到的Born有效電荷(Born effective charge, BEC)和真實值(DFT)的比較
綜上, Bingqing Cheng提出的LES方法能夠不依賴額外的參考數據, 僅從總能量和力學習長程的靜電相互作用, 且能夠在線性響應范圍內進行外加電場的模擬. 其代碼結構簡單, 物理圖像清晰, 具有很好的可解釋性, 可以作為一個通用的模塊加入絕大多數短程MLFF, 提升其精度和電荷表示能力, 使其能夠對具有離子性和強極性的體系進行研究. 該研究揭示了機器學習方法具有內在地學習到材料電荷響應行為的能力, 有望增強基座大原子模型對電荷的理解, 并推動具有特殊電學性能的材料的高通量篩選和理性設計.
參考文獻
[1] Cheng B. Latent Ewald summation for machine learning of long-range interactions . npj Comput Mater , 2025 , 11: 80
[2] Prodan E, Kohn W. Nearsightedness of electronic matter . Proc Natl Acad Sci USA , 2005 , 102: 11635 -11638
[3] Artrith N, Morawietz T, Behler J. High-dimensional neural-network potentials for multicomponent systems: applications to zinc oxide . Phys Rev B , 2011 , 83: 153101
[4] Ko T W, Finkler J A, Goedecker S, et al. A fourth-generation high-dimensional neural network potential with accurate electrostatics including non-local charge transfer . Nat Commun , 2021 , 12: 398
[5] Zhang L, Wang H, Muniz M C, et al. A deep potential model with long-range electrostatic interactions . J Chem Phys , 2022 , 156: 124107
[6] Grisafi A, Nigam J, Ceriotti M. Multi-scale approach for the prediction of atomic scale properties . Chem Sci , 2021 , 12: 2078 -2090
[7] Rumiantsev E, Langer M F, Sodjargal T E, et al. Learning long-range representations with equivariant messages.
[8] Kosmala A, Gasteiger J, Gao N, et al. Ewald-based long-range message passing for molecular graphs.
[9] Wang Y, Cheng C, Li S, et al. Neural P 3M: a long-range interaction modeling enhancer for geometric GNNs .
[10] Zhong P, Kim D, King D S, et al. Machine learning interatomic potential can infer electrical response.
轉載、投稿請留言
| 關注科學通報 | 了解科學前沿
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.