近日,師從新晉諾貝爾化學獎得主奧馬爾·亞吉(Omar M. Yaghi)、目前在美國加州大學伯克利分校讀博的榮自超,帶領一個跨國際的研究團隊,打造出名為AIRES (algorithmic iterative reticular synthesis)的機器學習指導的高通量實驗平臺,在尋找一種名為沸石咪唑酯框架(ZIF)材料的晶體時,效率比隨機探索的方法提高了一倍,并將已知的單連接體鋅基 ZIF 材料庫直接擴大三分之一,打破了領域內長達十年的停滯。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
研究中,榮自超首先使用 8 種已報道的 ZIF 連接體分子與鋅離子反應,進行了共計 2688 次結晶實驗。其中,反應條件(包括溫度,濃度,比例)從一個預先定義的反應空間中均勻采樣,借此建立了一個包含成功與失敗數據的初始知識庫。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
然后,他挑選了 48 種全新的、從未被做成 ZIF 單晶的連接體分子作為探索目標:
在 AIRES 組中,機器學習模型指導實驗進程,僅用了大約 700 次實驗就找到了 48 種新連接體中僅有的 10 種可形成 ZIF 單晶的連接體所對應的結晶條件。該效率比隨機探索組提高了一倍。后者開展的是完全依靠運氣的盲目嘗試,結果需要大約 1,400 次實驗才能達成同樣的目標。
這一對比不僅說明了 AIRES 擁有較高的效率,也表明在沸石咪唑酯框架這一看似已經被高度探索的化學空間里,依然隱藏著許多等待發現的驚喜。在材料發現這一更宏觀的領域中,通過 AIRES 加速發現的新框架材料,可以幫助我們從空氣中收集飲用水、高效捕獲導致氣候變暖的二氧化碳,甚至用于制造更加清潔的能源。
榮自超告訴 DeepTech:“選擇 ZIFs 的原因主要有兩點:首先其結晶窗口較小,這意味著隨機嘗試的效率低,需要花費大量資源才能找到正確的結晶條件。而且,這一化學空間除了生成 ZIF 外,還可能出現金屬有機配合物分子等其他副產物晶體。其次,對于不同的有機連接體,其成功的 ZIF 結晶條件和最終生成的 ZIF 晶體結構呈現出較強的多樣性,僅憑人的直覺很難捕捉不同反應體系之間的關聯。因此,這對我們驗證 AIRES 平臺的有效性是一個很好的挑戰。”
![]()
(來源:榮自超)
AIRES 的五個組成部分
AIRES 具備發現-學習-再發現的智能循環,由五個部分組成。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
第一是自動化合成部分:這一部分主要包含一個液體分配機器人。它像一位精確的化學廚師,可以按照指令在不同的小型反應容器中將金屬鹽、有機連接體和溶劑以不同的比例混合,,然后送入恒溫烘箱“烹飪”。
第二是圖像識別部分:反應結束之后,高清自動光學顯微鏡會給每個反應拍照。一個訓練好的神經網絡模型會迅速地掃描這些照片,判斷里面是否長出合格的晶體。模型的識別依賴晶體的幾何形狀、顏色均勻度等特征,具有很高的晶體召回率,能夠幫助人們省去大量查看圖片的辛苦工作,尤其是在絕大多數結果都是失敗反應的情況下,并能不遺漏包含合格晶體的照片。
第三是單晶 X 射線衍射:被上一步相中的候選晶體,會被送到衍射儀下進行最終裁決。只有這里才能給出原子級別的精確結構,從而據此來判斷是否是想要的新型 ZIF 材料。
第四是數據庫管理:這一部分負責將已經嘗試過的反應信息(包括反應物,反應條件,反應結果)進行歸納整理。為了更好地定量不同連接體對反應結果的影響,團隊通過量子化學手段設計了與實際結晶物理化學過程息息相關的描述符。
第五是算法決策:這也是 AIRES 的靈魂。在它的內部運行著機器學習模型(比如隨機森林),這個模型可以從之前所有成功和失敗的數據中學習,并能試圖找出什么樣的連接體分子特征和什么樣的反應條件搭配,更有可能長出晶體。
AIRES 的目標非常明確,那就是最大化地發現新晶體的數量。因此,算法總是最優先建議實驗模塊去嘗試那個預測成功率最高的實驗。為避免重復嘗試一些高度相似的成功結晶條件,一旦某個連接體成功生成了一個 ZIF 晶體,算法會及時將寶貴的實驗資源用于探索其他尚未成功的連接體。
為了讓 AIRES 每次能夠執行更多的批量實驗,團隊還設計了更高級的批量選擇算法。它不會簡單地選擇前 N 個最有可能的候選,而是會考慮候選反應們的條件結晶概率,基于此計算一批實驗整體能夠帶來多少新的發現期望值,從而更高效地利用每次實驗機會。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
什么是網格材料?為什么我們需要它們?
前面提到榮自超是亞吉的學生,亞吉課題組主要以研究網格材料而出名。以大家都熟悉的樂高積木為例,使用不同的形狀和顏色的積木,可以搭建出城堡、飛船或者任何其他能夠想象出來的結構。榮自超和他所在團隊也在做類似的事情,但是他們使用的是原子級別和分子級別的積木。
他們使用金屬原子比如鋅作為連接點,使用有機分子作為“棍棒”,把它們按照精確的、重復的圖案連接起來,形成一種名為金屬有機框架的晶體材料。前面提到的沸石咪唑酯框架材料,便是這種材料的其中一類。
這些材料內部充滿了納米級別的孔道和通道,就像是一個結構極其精密的蜂巢,正是這些孔洞讓它們擁有了以下能力:
首先,它們可以作為吸附器,可以像海綿吸水一樣,有選擇性地抓住空氣中的水分子以用于干旱地區收集水資源,或者可以鎖住工業廢氣中的二氧化碳以用于減緩全球變暖。
其次,它們可以作為分子篩,其所擁有的不同大小的孔洞可以只讓特定的氣體或液體分子通過,從而用于分離混合物,比如提純天然氣等。
再次,它們可以作為微型反應器,它們的孔洞可以作為“房間”,讓化學反應在里面更高效、更清潔地警醒。
然而,要想真正讓這些能力發揮作用,就必須得到高質量的晶體。這能保證框架材料內部孔結構的一致性和有序性。另一方面,通過單晶 X 射線衍射,我們能解析材料內部每個原子的精確位置,也就是給晶體拍攝一張原子級別的三維高清照片,以便能夠理解它的結構,以及精準預測和設計它的性能。
發現 10 種連接體,生成 7 種不同拓撲結構
通過 AIRES 發現的 10 種連接體,生成了 11 種全新的晶體,歸屬于 7 種不同的拓撲結構。有些新連接體在不同于已有文獻的溶劑中,形成了經典的方鈉石型和方沸石型結構。
![]()
(來源:https://doi.org/10.1038/s44160-025-00939-9)
同時,更多的連接體帶來了全新的結構。例如,在由 5-溴咪唑形成的 ZIF-A6 之中,展現出一種前所未有的雙層結構,兩層金屬節點被連接體進行了共價橋聯,而這在 ZIF 化學中也是一個全新的拓撲結構。
特別值得一提的是,5-溴咪唑和 4-氰基咪唑這兩種新的連接體分別形成了 crb 和 DFT 拓撲結構。而在過去,它們被認為只能由最簡單的、沒有任何取代基的咪唑連接體形成。現在,帶有單個取代基的連接體也能搭建出這些結構,這刷新了人們對于 ZIF 結構設計的認知。
不僅如此,復雜的配位化學反應還帶來了意外收獲。即 AIRES 還發現了四種連接體,它們沒有形成預期的三維 ZIF,而是形成了層狀 ZIF。在這些結構中,溶劑分子等配角與連接體這一主角,針對金屬的配位點形成了競爭,從而形成了二維層狀結構,這說明 AIRES 的機器學習模型捕捉到了配位化學的一些基本規律。
參考資料:
相關論文 https://doi.org/10.1038/s44160-025-00939-9
運營/排版:何晨龍
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.