![]()
導語
從有限數據中推導最優解是科學發現的終極目標,人工智能為加速這一過程提供了有效途徑。現有方法受數據集規模、目標函數假設及傳統機器學習技術所限,僅適用于低維或數據充足的問題。本文提出一款優化框架,可高效解決有限數據下的復雜高維優化問題:該方法利用深度神經網絡作為代理模型,迭代地搜索最優解,并引入多種機制以避免陷入局部最優,從而顯著降低所需樣本量。實驗結果表明,該方法可在高達 2000 維的問題中穩定找到優于現有方法的解,而傳統方法通常受限于約 100 維且需要更多數據。該框架在多種真實系統中均表現出色,性能超越現有算法,不僅推動了高效的知識發現,也為構建新一代自驅動實驗室提供了方法基礎。
關鍵詞:DANTE、深度主動優化(Deep active optimization)、高維優化(High-dimensional optimization)、黑箱優化(Black-box optimization)、主動學習(Active learning)、深度神經網絡(Deep neural networks)
鄭鴻盛丨作者
趙思怡丨審校
![]()
論文題目:Deep active optimization for complex systems 論文鏈接:https://www.nature.com/articles/s43588-025-00858-x 發表時間:2025年8月25日 論文來源:nature computational science
為什么高維、有限數據的優化問題如此困難?
從有限數據中推導最優解,是科學發現與工程設計中的核心目標。在材料科學、生命科學和復雜工程系統中,研究者往往需要在極高維參數空間中尋找最優方案,而每一次性能評估都依賴昂貴實驗或高精度仿真。人工智能因此被寄予厚望,期望通過更智能的試驗選擇策略顯著降低試錯成本,加速科學發現進程。
然而,現有優化方法在高維、數據稀缺場景下普遍受限。多數經典算法依賴大規模數據或對目標函數作出較強的連續性與平滑性假設,在真實復雜系統中難以成立。貝葉斯優化(Bayesian Optimization, BO)雖適用于黑箱問題,但其有效性通常局限于低維空間;基于蒙特卡洛樹搜索(MCTS)或強化學習(Reinforcement Learning, RL)的方法則依賴累積獎勵結構和大量交互數據,難以處理非累積目標和高成本評估問題。與此同時,傳統代理模型在高維非線性條件下要么依賴強先驗、要么易發生過擬合,進一步制約了優化性能。
一種面向有限數據的高維優化新框架:
DANTE
針對有限數據、非累積目標條件下的高維復雜優化問題,研究提出了“深度主動優化結合神經代理引導樹探索(DANTE)”算法。該方法并非試圖精確重建目標函數,而是以“如何更高效地分配有限試錯資源”為核心出發點,構建了一套數據驅動的閉環優化框架。
整體流程以深度神經網絡(Deep Neural Network, DNN)作為代理模型,學習輸入參數與目標性能之間的復雜映射關系;在此基礎上,通過神經代理引導樹探索(Neural-surrogate-guided Tree Exploration, NTE)策略,對高維搜索空間進行結構化探索;利用數據驅動的上置信界(Data-driven Upper Confidence Bound, DUCB)機制平衡探索與利用;最終將篩選出的高價值候選樣本送入真實驗證源(如實驗、第一性原理計算或高精度仿真)進行評估,并將新獲得的標注數據反饋至數據庫,更新代理模型,形成持續迭代的優化循環。
![]()
圖1 整體框架示意,該圖展示了DANTE的閉環優化流程:數據庫中的初始樣本用于訓練深度代理模型;代理模型引導樹搜索模塊在參數空間中生成候選解;真實驗證源對候選解進行評估;新數據回流至數據庫并更新模型。該流程強調“模型—搜索—驗證”的協同演化,是典型的主動優化(Active Optimization)框架。
值得注意的是,DANTE在方法設計上突破了現有優化算法的維度限制。實驗結果表明,該算法能夠穩定處理高達 2000 維的優化問題,而多數主流方法的有效維度通常受限于 100 維左右。同時,DANTE在樣本利用效率上具有顯著優勢,能夠在有限數據條件下持續逼近甚至達到全局最優解。
DANTE 如何在高維空間中避免“走錯路”?
DANTE的方法創新集中體現在神經代理引導樹探索(NTE)模塊及其配套機制上,這些設計均針對高維、有限數據場景下的核心難題進行優化。首先,算法引入條件選擇機制與局部反向傳播機制,以解決傳統樹搜索中常見的“價值衰減問題”和局部最優陷阱。條件選擇通過比較根節點與子節點的潛在價值,避免搜索過程在低價值區域盲目擴展;局部反向傳播則僅在有限范圍內更新訪問信息,減弱早期錯誤判斷對后續搜索路徑的長期約束。
其次,研究將傳統上置信界(UCB)推廣為數據驅動的 DUCB,將深度神經網絡的節點價值預測直接納入置信界計算中。這一改進有效避免了高維場景下 UCB 因訪問次數為零而產生的無窮值問題,同時顯著降低了對大量隨機模擬的依賴,從而減少計算成本。進一步地,算法引入自適應探索機制,在發現高價值數據點時主動增強探索強度,實現探索與利用之間的動態平衡。
此外,DANTE還提出了頂級訪問采樣策略,在候選樣本選擇階段綜合考慮模型預測性能與節點訪問頻率,從而提升代理模型在后續迭代中的泛化能力。在代理模型選擇上,深度神經網絡被證明是DANTE成功的關鍵因素之一。相比高斯過程、決策樹等傳統模型,DNN 更擅長擬合高維非線性分布,能夠捕捉復雜系統中的隱含結構關系。
![]()
圖2 神經代理引導樹探索(NTE)機制示意。深度神經網絡為搜索節點提供潛在價值評估,數據驅動的上置信界(DUCB)據此調控搜索方向。通過條件選擇與局部反向傳播機制的協同作用,算法能夠避免在高維空間中陷入局部最優,并逐步向全局最優解推進。
從方法論角度看,DANTE與 BO、MCTS、RL 形成了明確區分:其無需訓練策略網絡,不依賴累積獎勵結構,且在高維、大初始數據集條件下表現出更優的收斂特性。
從數學基準到真實系統:
DANTE 的效果如何?
為系統評估DANTE的性能,研究從合成函數基準測試和真實世界任務兩個層面展開了大規模實驗,對比對象涵蓋 11 類主流的啟發式、貝葉斯及樹基優化算法。在合成測試中,研究選取了 20 至 2000 維范圍內的 6 類經典非線性非凸函數(包括 Ackley、Rastrigin、Rosenbrock 等)作為驗證基準。結果顯示,DANTE在 80%–100% 的測試案例中,以極少樣本成功達到全局最優,而多數對比算法在樣本受限條件下無法收斂至全局最優。
在無噪聲、數據易獲取的真實任務中,DANTE被應用于神經網絡架構搜索、復雜合金性能優化、月球著陸最優控制以及透射電子顯微鏡(TEM)圖像分辨率優化等跨學科問題。實驗結果表明,DANTE在關鍵性能指標上普遍優于現有方法 10%–20%,在部分場景中(如 TEM 參數優化)甚至超越了人類專家的經驗選擇。在與強化學習算法(如 PPO)的對比中,DANTE在初始階段表現出明顯優勢,體現了其對有限數據場景的適配能力。
圖3 基準測試與真實任務結果,該圖系統展示了DANTE在高維合成函數和真實科學任務中的收斂行為。相比其他方法,DANTE在更少樣本下更快逼近最優解,驗證了其在數據效率與高維適應性方面的優勢。
在高成本、高維、帶噪聲的復雜真實任務中,如結構材料設計、環肽結合體設計以及高維合金輸運性能優化,DANTE在樣本數量更少的前提下,實現了 9%–33% 的性能提升,進一步證明了其方法的通用性與穩健性。
從算法到范式:高維優化的新可能
通過系統的理論設計與多維度實驗驗證,研究表明,深度學習與樹搜索機制的有機結合能夠有效應對有限數據、高維非線性優化問題。DANTE的核心優勢在于其對高維場景的高度適配性,以及在樣本受限條件下穩定收斂的能力,使其成為解決復雜系統優化問題的一種高效工具。
研究同時指出,當前DANTE的性能瓶頸主要受限于代理模型的表達能力和計算機內存資源,而非算法框架本身。未來,隨著更先進代理模型的引入以及計算資源的提升,DANTE有望進一步突破 2000 維以上的優化限制。在應用層面,該方法不僅適用于材料科學、物理和計算機科學等基礎研究領域,也可擴展至金融優化等多種量化場景。尤其是在與機器人系統和自動化實驗平臺相結合后,DANTE有潛力推動自主化實驗室的發展,加速材料發現與藥物研發等科學過程的智能化進程,成為跨學科高維非線性優化的重要通用方法。
計算神經科學第三季讀書會
從單個神經元的放電到全腦范圍的意識涌現,理解智能的本質與演化始終是一個關于尺度的問題。更值得深思的是,無論是微觀的突觸可塑性、介觀的皮層模塊自組織,還是宏觀的全局信息廣播,不同尺度的動力學過程都在共同塑造著認知與意識。這說明,對心智的研究從最初就必須直面一個核心挑戰:局部的神經活動如何整合為統一的體驗?局域的網絡連接又如何支撐靈活的智能行為?
繼「」與「」讀書會后,集智俱樂部聯合來自數學、物理學、生物學、神經科學和計算機的一線研究者共同發起,跨越微觀、介觀與宏觀的視角,探索意識與智能的跨尺度計算、演化與涌現。重點探討物理規律與人工智能如何幫助我們認識神經動力學,以及神經活動跨尺度的計算與演化如何構建微觀與宏觀、結構與功能之間的橋梁。
詳情請見:
1.
2.
3.
4.
5.
6.
7.
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.