63 次實(shí)驗(yàn)找出新反應(yīng)!用 AI 改寫化學(xué)發(fā)現(xiàn)方式
在有機(jī)化學(xué)的世界里,發(fā)現(xiàn)一項(xiàng)新反應(yīng)常常像是在無(wú)邊的化學(xué)空間里“摸黑前行”。研究者依賴經(jīng)驗(yàn)與直覺(jué),在數(shù)不清的催化劑、溶劑、氧化劑、添加劑之間反復(fù)試錯(cuò),而復(fù)雜體系中微妙的立體與電子效應(yīng)往往難以憑肉眼、憑直覺(jué)精準(zhǔn)判斷。尤其是構(gòu)建新型協(xié)同催化體系——例如長(zhǎng)期被設(shè)想?yún)s難以真正落地的 Co(IV)–烯胺內(nèi)圈機(jī)制——更是困難重重。傳統(tǒng)方法不僅耗時(shí)耗力,還容易陷入研究者已有認(rèn)知的偏見區(qū)間。面對(duì)廣袤但未知的化學(xué)反應(yīng)可能性,一個(gè)能同時(shí)結(jié)合人類直覺(jué)與 AI 算法的探索框架,顯然已迫在眉睫。
在此,清華大學(xué)羅三中教授和楊騏教授提出了一種全新的“啟發(fā)式數(shù)據(jù)驅(qū)動(dòng)反應(yīng)發(fā)現(xiàn)策略”:化學(xué)家給出機(jī)制啟發(fā)與合理假設(shè),AI 則負(fù)責(zé)在上百萬(wàn)反應(yīng)條件的龐大空間中智能探索。最終,研究者僅用 63 次實(shí)驗(yàn)便確定出一個(gè)全新的、可實(shí)現(xiàn) α-極性反轉(zhuǎn)的 Co(IV)–烯胺協(xié)同催化體系,在氧化偶聯(lián)反應(yīng)中展現(xiàn)出優(yōu)異的產(chǎn)率與對(duì)映選擇性。同時(shí),算法還挖掘出意料之外的反應(yīng)趨勢(shì),并通過(guò)聚類分析揭示廣泛的底物適用性。研究不僅建立了一種可擴(kuò)展、可遷移的 AI–人工協(xié)作反應(yīng)發(fā)現(xiàn)范式,也為復(fù)雜催化體系的精準(zhǔn)優(yōu)化提供了全新思路。相關(guān)成果以“Heuristic data-driven approach for synergistic cobalt(IV)–enamine catalysis”發(fā)表在《Nature Synthesis》上,程亮、譚臻至和Zongbin Jia為共同一作。
![]()
文章首先通過(guò)圖 1a 回到這項(xiàng)研究的起點(diǎn):Co(IV)–烯胺協(xié)同催化的概念雛形。研究者從傳統(tǒng)外圈機(jī)制出發(fā),基于團(tuán)隊(duì)此前關(guān)于 Co(III)–烷基自由基的研究經(jīng)驗(yàn),提出一個(gè)大膽假設(shè)——如果能夠讓 Co(III)–R 物種發(fā)生單電子轉(zhuǎn)移(SET),是否能生成一個(gè)高價(jià)態(tài)、具備親電特性的 α-亞胺基–Co(IV) 中間體?這一物種若能與烯胺在內(nèi)圈發(fā)生耦合,將意味著一種全新的極性反轉(zhuǎn)模式誕生(圖1a)。沿著這一概念,團(tuán)隊(duì)在圖 1b 里構(gòu)建出一個(gè)完全不同于傳統(tǒng)“人工試錯(cuò)”的反應(yīng)探索流程:化學(xué)家根據(jù)機(jī)制給出合理的反應(yīng)條件構(gòu)成元素——包括44種胺催化劑、20種鈷催化劑、15種氧化劑、14種添加劑與10種溶劑,組合后形成 超過(guò) 184.8 萬(wàn)種可能條件。這顯然不是人工可逐項(xiàng)篩查的規(guī)模,于是 ML 介入:通過(guò)參數(shù)描述、CVT 優(yōu)化取樣、貝葉斯優(yōu)化循環(huán)、專家監(jiān)督刪減條件空間,最終使 AI 能在快速迭代中逼近最優(yōu)解。一個(gè)清晰的 AI–人類協(xié)作路線由此成型(圖1b)。
![]()
圖 1: 展示 Co(IV)–烯胺協(xié)同催化的機(jī)制假設(shè),以及 AI × 化學(xué)協(xié)同探索新反應(yīng)的整體流程圖
圖 2 是這項(xiàng)研究的關(guān)鍵,它記錄了“AI 與人類化學(xué)家誰(shuí)更快找到最優(yōu)條件”的真實(shí)對(duì)比。在 BO-1 中,AI 從 CVT 選取的初始點(diǎn)出發(fā),有時(shí)會(huì)做出“看似糟糕”的推薦,但這些低反應(yīng)性實(shí)驗(yàn)正幫助模型識(shí)別失敗區(qū)間,使其逐步收斂。經(jīng)過(guò) 11 個(gè)批次、共 63 次實(shí)驗(yàn),算法鎖定最佳條件:cat-1·HNTf?(20 mol%) + [Co]-2(5 mol%) + NCS(氧化劑)+ KHCO? + DCM,得到 57% 收率、90% e.e. 的耦合產(chǎn)物(圖2,BO-1)。
與此同時(shí),人工優(yōu)化(HO)進(jìn)行了超過(guò) 200 次組合嘗試,雖然也找到不錯(cuò)的條件,但產(chǎn)率和 e.e. 均低于 BO-1。這并不意味著人類直覺(jué)失效,而是顯示 AI 能在復(fù)雜體系里跳出既有經(jīng)驗(yàn)路徑,去探索專家不一定會(huì)注意到的區(qū)域。例如,人類在 HO 最佳條件中更換氧化劑后反應(yīng)顯著變差,而 AI 卻能在高維空間中準(zhǔn)確識(shí)別 NCS 的整體協(xié)同效果。BO-2 和 BO-3 分別展示了“加入人類經(jīng)驗(yàn)后的偏置效應(yīng)”與“不同初始點(diǎn)導(dǎo)致的探索路徑差異”。整體而言,圖 2 呈現(xiàn)了一個(gè)重要信息:AI 不只是幫忙加速,而是能夠引導(dǎo)化學(xué)家跳出思維定式。
![]()
圖 2: 對(duì)比 AI 與人工優(yōu)化路徑,展示貝葉斯優(yōu)化收斂至最佳條件的過(guò)程與結(jié)果。
圖 3 用 UMAP 把龐大的反應(yīng)組合投影到二維平面,讓人直觀看到 AI 的“探索足跡”。在 BO-1 中,實(shí)驗(yàn)點(diǎn)幾乎覆蓋整個(gè)反應(yīng)空間(MD = 12.44),顯示出極高的多樣性;而 BO-2 因?yàn)槌跏蓟瘉?lái)自人類經(jīng)驗(yàn),點(diǎn)云明顯集中在局部區(qū)域(MD = 1.19),體現(xiàn)出“經(jīng)驗(yàn)所帶來(lái)的定勢(shì)”;而 BO-3 則嘗試跳離已探索區(qū)域,雖然未獲得更優(yōu)條件,但成功揭示了無(wú)需堿也能發(fā)生反應(yīng)的意外路徑。這些結(jié)果說(shuō)明,在復(fù)雜體系的多維空間中,不存在唯一最優(yōu)解,而可能存在多個(gè)局部?jī)?yōu)解簇。只有 AI 的全局探索能力與化學(xué)家的局部專業(yè)判斷相結(jié)合,才能看見整個(gè)反應(yīng)版圖。
![]()
圖 3: 用 UMAP 可視化三輪 BO 的反應(yīng)空間探索差異,展示探索范圍與偏置效應(yīng)。
在完成反應(yīng)條件優(yōu)化后,研究團(tuán)隊(duì)希望通過(guò)更系統(tǒng)的方式評(píng)估反應(yīng)的真正適用范圍,因此從市售六千余種含羥基化合物中篩選出 2356 個(gè)結(jié)構(gòu)多樣的候選底物,并借助 UMAP 聚類構(gòu)建出一張覆蓋廣泛化學(xué)空間的“醇類結(jié)構(gòu)地圖”。他們從每個(gè)簇中挑選代表進(jìn)行實(shí)驗(yàn),使底物選擇不再依賴人為經(jīng)驗(yàn),而成為一種具有統(tǒng)計(jì)意義的化學(xué)空間采樣。結(jié)果顯示,該 Co(IV)–烯胺體系對(duì)大多數(shù)芐醇、脂肪醇乃至源自天然產(chǎn)物的復(fù)雜醇類都保持良好反應(yīng)性和對(duì)映選擇性;而次級(jí)醇因空間擁擠導(dǎo)致選擇性下降,苯酚類因親核性不足表現(xiàn)較弱。整體趨勢(shì)與反應(yīng)機(jī)理高度吻合。
在人工條件與 BO 條件的全面對(duì)比中,兩組條件在不同底物上的表現(xiàn)十分接近,且都能覆蓋 UMAP 中的大部分結(jié)構(gòu)區(qū)域,僅在少數(shù)敏感底物上出現(xiàn)差異。這意味著 AI 找到的最優(yōu)條件并非偶然峰值,而是對(duì)底物變化具有穩(wěn)定遷移能力的普適體系,也進(jìn)一步證明數(shù)據(jù)驅(qū)動(dòng)的底物選擇策略能夠更客觀、全面地呈現(xiàn)反應(yīng)的真正適用性。
![]()
圖 4: 以聚類與代表性底物篩選構(gòu)建的“量化底物適用性”結(jié)果圖,涵蓋不同類型醇類反應(yīng)表現(xiàn)。
圖 5 將底物進(jìn)一步擴(kuò)展至更具挑戰(zhàn)性的 α-支化醛體系。無(wú)論是帶有給電子或吸電子取代的芳環(huán),還是含有雜環(huán)、長(zhǎng)鏈烷基或多重取代的骨架,這些醛類都能在催化體系中順利發(fā)生 α-極性反轉(zhuǎn)耦合,形成高對(duì)映選擇性的產(chǎn)物。反應(yīng)對(duì)結(jié)構(gòu)變化的穩(wěn)定適應(yīng)性說(shuō)明此內(nèi)圈機(jī)制并未受到局部電子或立體變化的強(qiáng)烈干擾,體現(xiàn)出體系內(nèi)在的穩(wěn)健性。
當(dāng)比較不同優(yōu)化路徑時(shí),BO 條件在部分電子特性敏感或立體更擁擠的底物上表現(xiàn)出略優(yōu)的轉(zhuǎn)化與選擇性,說(shuō)明算法能夠在復(fù)雜條件空間中捕捉到更細(xì)致的催化協(xié)同關(guān)系,為推動(dòng)反應(yīng)通用性提供更多結(jié)構(gòu)支撐。整體來(lái)看,圖 5 進(jìn)一步鞏固了該催化體系的底物兼容范圍,使其具有進(jìn)入實(shí)用合成場(chǎng)景的潛力。
![]()
圖 5: 展示 α-支化醛底物的廣譜適用性,以及 AI 條件在部分底物上的優(yōu)勢(shì)表現(xiàn)
圖 6 則通過(guò)一系列關(guān)鍵實(shí)驗(yàn)驗(yàn)證了反應(yīng)機(jī)制的真實(shí)性。缺少鈷催化劑、胺催化劑或氧化劑時(shí)反應(yīng)均無(wú)法進(jìn)行,說(shuō)明三者共同構(gòu)成反應(yīng)所需的基本循環(huán);使用化學(xué)計(jì)量的 Co(III)·OTf 仍可驅(qū)動(dòng)反應(yīng),確認(rèn) Co(III) 是核心氧化物種;預(yù)制亞胺在體系中也能順利轉(zhuǎn)化,進(jìn)一步證明烯胺/亞胺是關(guān)鍵活化形式。隨后,通過(guò) CV 與 UV–Vis 監(jiān)測(cè)到 Co(III) 被底物轉(zhuǎn)化為 Co(II) 的過(guò)程,與 SET 氧化路徑對(duì)應(yīng);而 TEMPO 截獲實(shí)驗(yàn)捕獲到自由基加合物,則為 α-亞胺自由基的存在提供了直接證據(jù)。這些結(jié)果共同描繪出一個(gè)自由基–極性跨界的內(nèi)圈機(jī)制:Co(III) 介導(dǎo)烯胺氧化形成自由基中間體,再經(jīng)歷 Co(IV) 極性反轉(zhuǎn)并與醇類耦合,形成最終產(chǎn)物。這也意味著 AI 優(yōu)化的不是一個(gè)“黑箱反應(yīng)”,而是一個(gè)與機(jī)制預(yù)測(cè)高度一致的真實(shí)化學(xué)體系。
![]()
圖 6: 通過(guò)對(duì)照實(shí)驗(yàn)、自由基探測(cè)、電化學(xué)測(cè)試等手段構(gòu)建反應(yīng)機(jī)理證據(jù)鏈
小結(jié)
研究最終總結(jié)指出,這種結(jié)合專家直覺(jué)與 AI 探索的啟發(fā)式策略,不僅顯著加速了 Co(IV)–烯胺體系的發(fā)現(xiàn),也展示了它在高維條件空間中的強(qiáng)大導(dǎo)航能力。AI 通過(guò)系統(tǒng)探索提供跨底物遷移性更強(qiáng)的條件,而化學(xué)家通過(guò)機(jī)理驗(yàn)證確保其科學(xué)可靠性,兩者形成互補(bǔ)的循環(huán),使反應(yīng)發(fā)現(xiàn)不再依賴漫長(zhǎng)試錯(cuò),而能在短時(shí)間內(nèi)抵達(dá)有效區(qū)域。該策略具有高度可遷移性,未來(lái)可被用于其他類型的金屬催化、自由基反應(yīng)或協(xié)同催化體系,推動(dòng)反應(yīng)設(shè)計(jì)從經(jīng)驗(yàn)驅(qū)動(dòng)邁向數(shù)據(jù)驅(qū)動(dòng)的新時(shí)代
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.