![]()
實驗室的光譜儀常常是科研流程中最昂貴、最慢的一環(huán)。每當新材料被設計出來,它還需經(jīng)過繁瑣的掃描與驗證——晶格結(jié)構(gòu)、分子基團,諸如此類。一次完整的表征,往往要切換多臺設備、耗費數(shù)小時乃至幾天。
而在另一端,人工智能的推演速度早已飛奔。計算模型每天生成成千上萬種新配方,卻被現(xiàn)實的實驗節(jié)奏拖慢。MIT 的研究團隊決定,從「理解光譜」的角度出發(fā),讓 AI 也能學會替科學家「測」一次材料。
該研究以「SpectroGen: A physically informed generative artificial intelligence for accelerated cross-modality spectroscopic materials characterization」為題,于 2025 年 10 月 14 日發(fā)布在《Matter》。
![]()
論文鏈接:https://www.cell.com/matter/abstract/S2590-2385(25)00477-1
讓 AI 理解「光譜的語言」
AI 驅(qū)動的材料發(fā)現(xiàn)能夠快速設計新型材料成分,但合成與表征卻相對滯后。尤其是表征環(huán)節(jié),仍受限于依賴電磁光譜學、由專家操作儀器進行的勞動密集型實驗。
MIT 推出了 SpectroGen,這是一種用于跨模態(tài)光譜生成的生成式 AI 模型,旨在加速材料表征。SpectroGen 生成的高分辨率、高信噪比光譜與真實值的相關性達 99%,均方根誤差為 0.01 原子單位。
它的關鍵在于將光譜重新定義為一種數(shù)學分布,而非分子信號。每種光譜曲線——無論是高斯形的紅外峰,還是洛倫茲形的拉曼線——都能用方程表達。團隊據(jù)此為模型加入「物理先驗」:AI 不再盲目擬合,而是受制于這些已知的分布規(guī)律。
![]()
圖 1:SpectroGen 工作流程。
![]()
圖 2:建模策略。
在此基礎上,研究者構(gòu)建了一個變分自編碼器(VAE)架構(gòu)。模型先將輸入光譜壓縮成潛空間的特征分布,再利用這些物理約束生成另一種模態(tài)的光譜。 這一「物理+生成」的混合邏輯,使 SpectroGen 既能保持可解釋性,又能高速運行。它本質(zhì)上是一臺虛擬光譜儀——輸入一種信號,生成另一種測量結(jié)果。
用數(shù)據(jù)打點樣
團隊以國際礦物學協(xié)會標準數(shù)據(jù)庫 RRUFF 為驗證集,共使用約 6000 個礦物樣本。 在 IR–Raman 和 XRD–Raman 兩類跨模態(tài)任務中,SpectroGen 生成的光譜與真實實驗結(jié)果平均相關性達到 99%,強度均方誤差僅 0.01 a.u.,結(jié)構(gòu)相似度指數(shù)(SSIM)高達 0.96–0.97。
![]()
圖 3:對紅外到拉曼和 X 射線衍射到拉曼任務的整個生成數(shù)據(jù)集進行了光譜特征評估。
更令人意外的是,AI 生成的光譜信噪比甚至優(yōu)于實驗數(shù)據(jù)——例如某礦物樣本的信噪比由 3.1 提升至 11.1。在信息保持性測試中,研究者用生成光譜訓練材料分類網(wǎng)絡,準確率達90.476%,比直接用實驗光譜(69.878%)提升約 20 個百分點。
在效率上,SpectroGen 能在一分鐘內(nèi)完成一次完整生成,速度比傳統(tǒng)測量快約一千倍。團隊指出,這意味著在未來的生產(chǎn)線中,僅需一臺紅外攝像機即可完成多模態(tài)檢測,而無需昂貴的 X 射線或拉曼設備。
結(jié)語
團隊表示,SpectroGen 可以為任何類型的礦物生成光譜。在制造業(yè),它可用于電池、半導體、藥物等產(chǎn)業(yè)的質(zhì)量控制,只需一次簡單掃描便可獲得多模態(tài)指標。在科研與藥物研發(fā)中,研究者能快速篩查大規(guī)模候選樣本,節(jié)省大量實驗時間與設備成本。
通過將光譜數(shù)據(jù)視為一種抽象的數(shù)學分布表示,模型能夠生成獨立于鍵和晶體結(jié)構(gòu)的標準物理表示的光譜,這種抽象使 SpectroGen 能夠彌合物理實驗與計算分析之間的差距,拓展光譜生成在各個領域的通用性。
SpectroGen 不是簡單的數(shù)據(jù)擬合,而是一個具有物理意識的生成系統(tǒng)——它知道光譜為何成形,也能在不同實驗模式間自洽地「遷移」信息。這類模型或?qū)⒊蔀槲磥砜茖W AI 的基礎模板。
https://phys.org/news/2025-10-quality-materials-easier-ai-tool.html
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.