![]()
編輯 | 心悅
從 AlphaFold 驚艷亮相、AI 和科學的交叉成果登上諾貝爾獎殿堂,到科學智能(AI for Science,AI4S)探索的全面開花,AI 已不再只是計算機科學家的「倚天劍」,而是正在成為各領域科學家的科研全流程合作伙伴。
這種轉變很大程度上得益于交叉型科研人才不斷的共同探索,特別是青年人敢于顛覆傳統范式、直面 AI 技術給科學研究帶來的挑戰與機遇。越來越多的創新突破乃至應用由帶有研發底色的年輕人創造。
因此,要了解科學智能的前瞻趨勢和新穎見解,最直接的途徑就是聆聽一線青年研究員的聲音。
9 月 26 日,一場聚焦科學智能前沿進展的青年分享會 ——SAIS Talk「上智院星辰之夜」,在位于上海西岸的上海科學智能研究院(下稱「上智院」)舉辦。五位青年研究員著眼于物質科學、生命科學、地球科學、AI 共性技術等方向,分享了他們的核心工作和創新思辨。
![]()
![]()
![]()
![]()
![]()
![]()
成立于 2023 年 9 月的上智院是一個聚焦科學智能基礎研究、前沿技術與場景落地的戰略性新型研發機構,致力于「用人工智能驅動科學研究范式變革、賦能千行百業」。在此次分享會上,通過五位青年研究員的講述,我們看到了上智院面向科學智能核心方向為多項科研難題給出的解決方案,兼具前沿深度和實踐價值。
我們來一起回顧下這場前沿分享。
表征學習
數據的表征決定了機器理解世界的深度。上智院研究員、復旦大學人工智能創新與產業研究院助理教授姜若曦長期從事表征學習研究工作。她認為,生成模型與表征學習就像是一枚硬幣的兩面,相輔相成。
![]()
在分享會上,姜若曦圍繞靜態圖像生成和動態系統模擬兩個關鍵任務,分享了兩項前沿工作。
第一項工作是關于靜態圖像生成,研究論文《Nested Diffusion Models Using Hierarchical Latent Priors》還被 CVPR 2025 接收。
![]()
論文地址:https://arxiv.org/pdf/2412.05984
圖像包含多尺度的語義結構 —— 從局部紋理、邊緣到部件、物體乃至整體連貫場景。生成系統要產生逼真圖像,就必須對所有層級進行建模。現有生成模型常難以準確表征物理屬性和幾何布局等特征,難以捕捉復雜的視覺關系。
![]()
姜若曦介紹道,該研究融合擴散模型與層級表征,不僅顯著提高了復雜場景的圖像生成質量,更實現了零成本的語義重采樣控制,為復雜場景建模提供了新的研究方向。
![]()
在第二項工作中,研究團隊將層級表征應用于動態系統的自回歸建模(神經模擬器),研究論文被 NeurIPS 2025 接收。
![]()
論文地址:https://www.arxiv.org/pdf/2506.04528
神經網絡數值模擬器為科學計算帶來了革新,可其在破解傳統計算成本瓶頸的同時,往往面臨長期誤差累積,難以保持穩定性和物理一致性的巨大挑戰。
![]()
該研究提出了一種層級化時空表征與跨尺度隱式自回歸的創新建模框架,基于傳統的自回歸模型,顯著提升了長期預測的穩定性與短期的準確度,在氣候建模、流體力學等復雜動力系統中展現出重要的應用潛力。
![]()
介紹了兩項關鍵工作之后,姜若曦還分享了自己對于「表征」的見解,就像藝術家畢加索對于「抽象」的定義:「我們首先需要有一個對于事物的理解,然后再把一些冗余修飾進行抹除。」她指出:「表征是機器對于數據的一個理解,我們想得到更好的生成模型,就要確保模型通過表征對數據有一個很好的理解。」
![]()
催化反應預測
催化反應是構筑新物質的一種關鍵手段,能幫助化學家構筑材料、能源、生命、藥物相關的新分子。但是由于催化反應涵蓋復雜多樣的化學空間,化學結構與反應性能之間的關系通常是不明晰的。
![]()
近年來,機器學習和深度學習等數據驅動方法在反應性能預測與合成規劃方面展現出巨大潛力。然而,數值回歸驅動的反應性能預測與基于序列生成的合成規劃之間的固有方法差異,為構建統一的深度學習架構帶來顯著挑戰。
上智院物質科學方向研究員徐麗成主要從事催化反應模型開發工作,他在分享會上介紹了一種統一的預訓練反應預測框架 ——RXNGraphormer。該框架創新性地將反應性能預測(如反應活性和選擇性)與單步合成規劃(正向與逆向合成)整合至同一系統中,研究論文還登上了《Nature Machine Intelligence》9 月刊的封面。
![]()
論文地址:https://www.nature.com/articles/s42256-025-01098-4
研究團隊特別開發了一種「片段交換算法」,通過生成虛構反應樣本并與真實反應進行對比學習,使模型在預訓練過程中自主掌握化學鍵的斷裂與形成模式。這一獨特策略不僅使模型無需依賴顯式標注即可區分不同反應類型,還能生成具有明確化學意義的嵌入表示。
![]()
RXNGraphormer 不僅實現了對化學反應活性、選擇性和單步正向 / 逆向合成的精準預測,還使模型能夠自發學習化學鍵的變化規律,在多項預測任務中均達到領先水平。以該框架為基礎的燧人催化大模型已與中國科學院上海有機化學研究所合作,在實際反應中實現選擇性提升 3 倍,顯著減少了項目的濕實驗次數、原料浪費和副產物。
![]()
在分享會現場提問環節,一個有趣的問題吸引了大家的注意:「AI 有沒有可能會基于成斷鍵規律等本質物理化學現象,去重新定義化學反應分類?AI for Science 能否從底層去顛覆傳統經驗范式?」
徐麗成給出的答案是肯定的:「在我看來是可以的,因為我們這個實驗確實驗證了 AI 學會了鍵的變化,鍵的變化其實就是化學反應的本質,可以通過其來做一些分類。」
生物分子動態模擬
蛋白質的許多關鍵功能源于其隨時間演化的構象變化,蛋白質的主要功能是由它的動態結構來完成的。例如,阿爾茨海默病其中一個成因就是由神經細胞之間生長的斑塊中 β - 淀粉樣蛋白的積累引起的。
![]()
精準生成蛋白質構象對于深入理解蛋白質功能機制及推進藥物發現(如抑制劑設計)至關重要。然而,現有模型主要聚焦于蛋白質靜態結構的預測。盡管靜態結構為學術研究提供了重要基礎,但蛋白質在生理過程中實際處于動態變化中,因此攻克蛋白質動態變化預測這一難點,對于推動 AI 應用于藥物設計等實際場景中具有關鍵意義。
![]()
上智院生命科學方向主任研究員楊自雄,主要從事生物大模型開發工作。在分享會上,他介紹了其負責團隊提出的基于 4D 擴散模型的生成框架。相關研究論文《4D Diffusion for Dynamic Protein Structure Prediction with Reference and Motion Guidance》已被學術頂會 AAAI 2025 接收。
![]()
論文地址:https://ojs.aaai.org/index.php/AAAI/article/view/31984
該方法能夠實現蛋白質動力學軌跡生成或長時間尺度的構象生成,為闡釋蛋白質功能與加速藥物設計提供了全新的計算范式。
![]()
研究團隊還進一步提出了「女媧蛋白狀態遷移大模型」,實現了亞微秒級蛋白質動態過渡路徑預測,并搭建了行業最大的全原子精度構象數據集 dynamicPDB。該數據集發布不到一年,已在開源社區獲得超過 760 顆 Star、近百名關注者和 130 余個分支,迅速成長為全球蛋白質動力學研究的重要基礎設施之一。
![]()
在產業合作方面,楊自雄介紹了研究團隊正在進行的兩項產業試點:
- 針對不同的蛋白質構象設計對應的抗體,實現針對變異構象的抗體誘導的自體免疫療法;
- 以端到端構象生成模型預測 RSV 兩種實驗結構的轉變構型,并設計蛋白質抑制劑。
![]()
![]()
單細胞圖譜
隨著單細胞測序技術的發展,我們對于疾病的發病機制有了更深刻的理解。在單細胞尺度下解析遠距離的基因調控關系,對于理解細胞中的轉錄調控機制,進而闡明疾病相關的非編碼變異的致病機制有重要意義。
上智院生命科學方向研究員張雨主要關注生命科學多組學領域的算法研究,及其在精準醫療、疾病機制解釋和藥物靶點發現等生物醫學領域的應用。在分享會上,張雨介紹了一項關于「單細胞順式調控關系」的工作。
![]()
論文地址:https://advanced.onlinelibrary.wiley.com/doi/10.1002/advs.202505021
順式調控關系在基因組上廣泛存在,人體發育過程實際上就是胚胎干細胞不斷分化的過程,而順式調控關系是細胞分化的主要驅動因素之一,順式調控關系的不同塑造了人體多種多樣的細胞類型。
![]()
現有工具還不能對順式調控關系進行非常精確的預測,一是因為沒有把生物學原理建模進去,還只是通過數據的相關性做出預測,二是因為沒有充分利用公開數據庫中大量的單細胞測序數據提高模型的預測性能。
為了解決現有計算方法預測能力不足的問題,研究團隊開發了一種新的計算框架 ——SCRIPT,核心思路是將生物學的基因調控知識融合到模型中,精準預測單細胞分辨率的順式調控關系。
研究團隊認為:一維基因組上的調控元件可以通過在三維空間的折疊影響目標基因的表達,這種生物學原理很適合用圖神經網絡的方式進行建模,因而選擇圖神經網絡作為基礎模型架構。整個算法的設計旨在使用配對的 Single-cell ATAC-seq 和 Single-cell RNA-seq 數據模擬細胞內轉錄調控的過程,進而利用這個 Simulation Model 預測每個細胞內的順式調控關系。
![]()
SCRIPT 在長程調控預測上取得了突破性進展,性能較當前最優方法提升逾兩倍。利用其優異的預測性能,SCRIPT 在阿爾茲海默癥和精神分裂癥中發現了當前最優計算工具未發現的分子遺傳學機制,有望在復雜疾病的遺傳診斷和藥物靶點發現上發揮重要作用。
![]()
由于圖預訓練模型存在模型結構和參數量的限制,其性能有明顯的上限,因此研究團隊提出了一個更先進的基礎模型 ChromFound—— 基于 Mamba-Transformer 混合架構和基因組感知編碼,擁有更大的參數量和更強的擴展性,在六種下游任務上達到最優性能。
![]()
全球天氣預測
傳統的數值天氣預報系統通常由基于物理的預報模式和資料同化模塊構成。其中,數值預報模式主要從當前的大氣狀態出發,通過求解偏微分方程來獲取未來的大氣狀態;資料同化系統則負責吸收描述當前大氣狀態的大量觀測,來估計當前的大氣狀態。預報模型和同化系統是缺一不可的,同化系統提供初始氣象場,預報模型從初始氣象場出發,預報未來的天氣。
近年來,基于機器學習的天氣預報模型已在預報性能上展現出與傳統模式相當的能力,但其運行仍依賴于傳統資料同化系統生成的初始場。但傳統資料同化系統中衛星觀測資料預處理過程特別復雜,計算資源消耗大、觀測利用率低。
上智院地球科學方向研究員徐孝澤長期關注人工智能在數值天氣預報與資料同化中的應用,實習期間就在上智院研發了首個可直接同化真實衛星觀測的人工智能同化框架 FuXi-DA。這次分享會上,他介紹了伏羲氣象大模型團隊基于 FuXi-DA 的最新成果 —— 完全基于機器學習的全球天氣預報系統 FuXi Weather。
首先,基于傳統資料同化方法計算量大,觀測利用率低等問題,研究團隊提出了同化框架 FuXi-DA。FuXi-DA 簡化了流程,提高了資料利用率,降低了計算成本,并通過引入預報損失聯合優化,提高了長期預報精度。
![]()
在同化框架 FuXi-DA 的基礎上,研究團隊構建了全球天氣預報系統 FuXi Weather。FuXi Weather 采用在線學習策略,動態更新同化系統,具備對多源衛星觀測資料進行同化的能力,實現了循環資料同化與一體化預報。
![]()
在使用觀測資料遠少于傳統數值預報系統的條件下,FuXi Weather 能夠生成未來 10 天的高精度天氣預報,并在觀測稀疏區域的預報表現上優于歐洲中期天氣預報中心(ECMWF)運行的 HRES 系統。
![]()
值得一提的是,FuXi Weather 采用的伏羲氣象大模型不僅成功當選中國氣象局官方認定的三大核心大模型之一,還在中國氣象局開展的人工智能天氣預報大模型示范計劃中,三項綜合指標均排名第一。其實戰價值也在 2024 年的超級臺風「貝碧嘉」等極端天氣預測中得到了驗證。
目前,FuXi Weather 的研究論文已被《Nature Communications》收錄,徐孝澤表示研究團隊正在積極推進 FuXi Weather V2 的研發工作。
![]()
論文地址:https://www.nature.com/articles/s41467-025-62024-1
匯聚青年智慧
科學智能的發展需要既懂 AI 又懂領域科學的復合型人才推動。2025 全球開發者大會期間,上智院院長漆遠在接受媒體采訪時就表示:「人工智能的發展,以前缺的是算力,現在比算力更缺的是人才。尤其是當人工智能走向了千行百業,和垂直領域結合,那你就需要懂這個領域。否則就像做了一個引擎,但它不是個車,不能把你從 A 點運到 B 點,所以你既要懂得領域也要知道怎么使用人工智能。」
為了匯聚青年創新力量,上智院已連續三年主導舉辦世界科學智能大賽,挖掘出不少創新團隊。這次 SAIS Talk「上智院星辰之夜」的活動命名就源于世界科學智能大賽中備受矚目的青年聚會傳統,寓意著年輕智慧如星辰般匯聚閃耀,照亮科學智能的無限未來。
經過兩年的探索,上智院已牽頭研發伏羲氣象大模型、燧人物質大模型、女媧生命大模型、早期中華文明多模態大模型、星河啟智科學智能開放平臺等一系列關鍵成果。在 SAIS Talk「上智院星辰之夜」上我們看到,這些成果內在的創新驅動力正是來源于眾多優秀的交叉型青年科研人才。
如今的科學智能,正同步推動著基礎技術突破、產業新興應用以及全球創新生態發展。作為創新生力軍,青年人才必將憑借其敢于挑戰的科研精神,驅動科學智能走向新紀元。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.