![]()
導讀
2025年,人工智能在科學界的角色發生了決定性轉變,它已超越單純的“分析工具”,成為一個能主動作為的科研伙伴,能夠提出新穎假說、從頭設計全新分子,并以前所未有的精細度預測行星系統。
2025年,人工智能在藥物發現、氣候科學和材料工程等關鍵領域取得了突破性進展,大大加速科學發現,由人工智能引領科學革命的浪潮已經到來。
值得一提的是,中國雖然沒有選一例入選,但許多關鍵領域都接近行業領先水平。本文結合行業專家、ChatGPT、Gemini、Deepseek等模型的分析,對2025年最具代表性的研究案例進行分析總結。
深究科學|來源
01
BioEmu-1:模擬蛋白質復雜構象
BioEmu-1模型由微軟研究院AI for Science團隊開發,今年發表在Science雜志上,團隊核心成員包括SarahLewis、TobiasHempel等。
BioEmu采用擴散模型架構,結合AlphaFold的Evoformer編碼器和二階積分采樣技術高效地從蛋白質構象分布中采樣,通過結合AlphaFold數據庫中的靜態結構、超過200毫秒的分子動力學(MD)模擬數據,以及50萬條蛋白穩定性實驗數據,訓練后能夠在單張GPU上每小時生成上千個獨立蛋白質結構。
![]()
![]()
BioEmu模型示意圖
BioEmu能模擬蛋白質在功能過程中出現的關鍵結構變化,如隱性口袋、局部解折疊和結構域重排,模擬成功率分別達到70%、75%、80%。
BioEmu以前所未有的效率和精度模擬了蛋白質的構象變化,這為理解蛋白質功能機制和加速藥物發現打開了新路徑。應用場景包括藥物研發、蛋白質工程、結構生物學等。
02
MatterGen:材料設計突破性工具
MatterGen是基于擴散模型的晶體材料生成模型,該模型由微軟研究院
團隊完成,并發表在Nature發表,團隊核心成員包括謝天等。
![]()
MatterGen是材料逆向設計的突破性工具,可大幅提升新型穩定材料的生成效率與定向可控性。應用場景包括新型能源材料、功能材料設計等。
與現有生成模型相比,MatterGen生成的穩定、獨特且新穎材料的比例提高了2.9倍,接近局部能量最小值程度提升了17.5倍。
在合成材料驗證中,模型生成的結構與實際材料高度一致,并且模型能夠識別具有相同成分無序結構的不同材料。
03
Aurora:精準預測大氣
Aurora是一款大氣預測模型,該模型由微軟研究院與劍橋大學等機構聯合開發,論文發在Nature雜志上,核心團隊成員包括Paris Perdikaris等。
Aurora模型基于超百萬小時天氣氣候模擬數據訓練,采用3D SwinTransformer與Perceiver編碼器解碼器架構,能處理多維度大氣變量,訓練周期僅4-8周,遠短于傳統基線模型的數年時長。
![]()
![]()
Aurora架構示意圖
相較于最先進的數值預報系統IFS,Aurora計算速度提升約5000倍,且成本更低,其在空氣質量、海浪、熱帶氣旋路徑及高分辨率天氣預報四大領域均達SOTA水平,如5天熱帶氣旋路徑預報全面超越7個業務預報中心。
Aurora可靈活微調適配多樣預測任務,可讓數據稀缺地區獲得精準氣象信息,可助力農業、能源、災害應對等領域應對氣候變化挑戰,為構建全地球系統綜合模型奠定了基礎。
04
Quantum Echoes:量子物理模型
Quantum Echoes是一款基于超時序關聯器(OTOC)的量子算法,由谷歌Quantum AI團隊及其合作者開發,論文于2025年10月發表于Nature雜志。
其核心原理是通過量子系統正向演化—擾動—反向演化的流程,借助相長干涉放大信號、抵消噪聲,將難測量的量子關聯轉化為可觀測的“量子回聲”,從而實現高靈敏度的系統結構與動力學映射。
![]()
Quantum Echoes算法不僅在量子多體動力學模擬上比Frontier超級計算機快約13000倍(2小時完成經典機3年任務),更首次達成可驗證、可復現的量子優勢。在分子結構測定實驗中,其結果與成熟技術高度一致。其應用覆蓋量子多體物理、材料科學、量子化學等領域,可為相關研究提供高效工具,并助力加速量子計算實用化進程。
05
RFdiffusion2:全新蛋白設計
RFdiffusion模型是華盛頓大學David Baker團隊開發的深度學習驅動的蛋白質結構從頭設計工具。2025年,基于該模型Baker團隊發了一系列高水平論文。
簡單來說,RFdiffusion2模型基于RoseTTAFold All-Atom架構,可自動推斷側鏈構象與序列索引,高效生成蛋白支架,其核心優勢在于可僅基于功能基團原子坐標設計酶,無需規定殘基順序或逆向旋轉異構體枚舉,能直接適配無序列索引原子、部分配體等復雜活性位點需求。
![]()
RFdiffusion2蛋白質設計示意圖
![]()
2025年,Baker團隊在Nature雜志的一項研究顯示其設計的抗體與流感血凝素、艱難梭菌毒素B等靶點結合構象契合度高,CDR環設計達原子級精度,經親和力成熟后可實現個位數納摩爾級結合強度。
![]()
另外,Baker團隊使用RFdiffusion從頭設計針對三指毒素(3FTx)蛇毒中和蛋白,獲得了具有顯著熱穩定性、高親和力以及與計算模型近乎原子水平一致性的蛋白質,論文同樣發表于Nature雜志上。
RFdiffusion強大的功能使得其成為當前計算蛋白設計領域的核心工具之一。
06
Evo-2:基因組模型
Evo-2模型由來自 Arc研究所、斯坦福大學及NVIDIA等團隊聯合推出,核心成員包括Brian L. Hie、Patrick D. Hsu等,可廣泛應用于疾病基因組學、合成生物學等領域,助力臨床變異評級、基因組設計等任務。
![]()
Evo-2是一款兼顧預測與生成的基因組基礎模型,覆蓋原核、古菌等全生命域,具備單核苷酸分辨率,支持100萬bp超長上下文窗口。其核心能力突出,零樣本即可精準預測非編碼致病變異、BRCA1臨床變異等,還能生成高自然度基因組序列,自主習得外顯子-內含子邊界等生物特征。
相較于同類模型,Evo-2數據覆蓋更全、架構更高效,零樣本性能優異且完全開源,大幅降低落地門檻。
07
DeepMind全自動實驗室
DeepMind Automated Labs是DeepMind公司提出的一項研究新范式和物理科研設施,它基于通用模型Gemini架構,由AI系統基于現有數據生成假設并負責實驗設計,機器人系統執行實驗,機器學習模型分析結果以確定下一步流程。設施全流程自動化,可7×24小時運行。其中Gemini作為核心智能層,負責多模態理解、實驗規劃、代碼生成與多智能體協作。
![]()
DeepMind自動化實驗室旨在加速涉及復雜的化學和物理相互作用、需要大規模迭代實驗的新材料研發進程,特別是超導體和先進半導體材料。
人工智能系統則以規模化的方式執行的新范式,并有望擴展到制造、藥物發現、能源優化,甚至工業研發等任何依賴重復測試和優化的領域。
08
MAGE:抗體全新設計范式
MAGE是首個無需模板即可設計多種靶標抗體的序列型蛋白質語言模型,由Vanderbilt大學Ivelin S.Georgiev團隊提出并發表在今年的Cell雜志上。
![]()
MAGE基于十億級蛋白序列上預訓練的自回歸解碼器模型Progen2微調,經18507對抗體-抗原序列訓練,可僅輸入抗原序列,直接生成配對人源抗體的重鏈和輕鏈抗體可變區序列,且生成抗體具備多樣化序列特征與新型互補決定區序列。
![]()
MAGE模型示意圖
在MAGE模型生成的1000條抗體序列中,99.1% 通過結構完整性與人源性篩選。與訓練集中最相似序列相比,重鏈平均差異 11.7 個殘基,輕鏈差異 1.4 個,這顯示其創新性。在針對新冠病毒抗體設計中,20種生成抗體中9種具結合特異性,1種中和效價優于10納克/毫升。
MAGE為新興病原體快速響應提供可能,未來結合結構預測等技術,有望重塑抗體發現與疫苗設計范式。
09
AlphaEvolve:通用算法
AlphaEvolve是一款由Gemini系列大語言模型驅動的進化式編碼智能體,專注于通用算法的自主發現與迭代優化,由Google Deepmind提出,預印本發表于arxiv平臺。
![]()
其核心依托Gemini Flash與Gemini Pro協同工作,前者拓展思路廣度,后者深挖優化要點,結合自動化評估器與進化算法,實現“提示生成-程序創作-評估篩選-迭代進化”的全鏈路自主運行,確保解決方案的準確性與優質性。
![]()
AlphaEvolve工作流程
應用層面,AlphaEvolve已深度賦能谷歌計算生態:優化數據中心調度提升資源利用率,優化芯片設計Verilog代碼,成果融入下一代TPU芯片;提升AI訓練效率,使Gemini核心矩陣運算提速23%,Flash Attention機制運算最高提速32.5%。
在學術領域,它突破4×4復矩陣乘法最優解,為“接觸數問題”等50余個開放性數學問題提供解法,20%案例超越現有最優解。AlphaEvolve突破單點函數局限進化完整代碼庫,為數學領域及計算實用場景提供了高性能算法解決方案。
未來,其通用架構有望拓展至材料科學、藥物研發等領域,推動更多行業創新。
10
Future House:人工智能科研代理
Future House是由MIT博士山姆·羅德里格斯(Sam Rodriques)和安德魯·懷特(Andrew White)建立的一家多智能體代理平臺。
平臺核心為四款專業代理:Crow通用檢索,提供簡明學術答案;Falcon深耕文獻綜述,覆蓋多專業數據庫;Owl聚焦“前人是否做過X”的問題;Phoenix(實驗性)助力化學實驗規劃。另有一款尚未發布的專為實現生物學領域數據驅動的自動化發現而設計的智能體Finch。
這些平臺智能體基于其擁有240億參數的開源化學推理模型ether0模型。經基準測試,前三者檢索精度與準確性優于主流模型,且超越博士級研究人員。
![]()
不同模型搜索精度與準確性比較
未來,這一平臺應用場景包括可快速挖掘疾病機制、識別文獻矛盾、批判分析研究方法,還能通過API定制流程,助力蛋白靶點篩選與化學空間分析等,大幅加速科學發現進程。
簡而言之,2025年不僅有更好的模型,更是“科研伙伴”崛起的一年。像AlphaEvolve和谷歌最新科研智能體這樣的系統,能夠識別藥物重定位候選者,并在數天內預測抗菌素耐藥性,其工作成果可媲美人類團隊過去數年的努力。
隨著人工智能從工具轉變為合作伙伴,科學方法本身正在被改寫——其進程加速了百倍,唯一的限制僅在于實驗室驗證的速度。
人工智能已深度參與科研過程的各個環節,并將在今后仍會帶來一系列突破。
Deep Science預印本
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.