★置頂zzllrr小樂公眾號(主頁右上角)數學科普不迷路!
像ChatGPT這樣的流行AI模型是基于語言或照片訓練的,而由熨斗(Flatiron)研究所的研究人員及 Polymathic(博學)AI 協作組的成員創建的新模型則是使用真實的科學數據集訓練的。模型們已經利用從一個領域學到的知識,去解決另一個領域看似完全不同的問題。
![]()
Walrus(海象)AI模型模擬流暢運動
海象(Walrus)/ 博學人工智能(Polymathic AI)
https://youtu.be/3iM_rd3t0_Q
作者:Elizabeth Fernandez 2025-12-9
譯者:zzllrr小樂(數學科普公眾號)2025-12-13
雖然大多數AI人工智能模型——包括 ChatGPT——都是基于文本和圖像訓練的,但一個多學科科學家團隊則有不同的目標:物理訓練AI。
最近,Polymathic AI https://polymathic-ai.org 合作組成員展示了兩款使用真實科學數據集訓練的新人工智能模型,旨在解決天文學和類流體系統中的問題。
這些模型——被稱為 Walrus(海象) https://neurips.cc/virtual/2025/loc/san-diego/poster/119922 和 AION(永恒)-1 https://neurips.cc/virtual/2025/loc/san-diego/poster/119776 ——獨特之處在于它們能夠將從某一類物理系統獲得的知識應用于看似完全不同的問題。例如,海象(Walrus)可以應對從爆炸恒星到 Wi-Fi 信號再到細菌活動等各種系統。
Walrus首席開發者、Polymathic AI研究科學家 Michael McCabe(邁克爾·麥凱布)表示,這種跨學科技能組尤其令人興奮,因為它能加速科學發現,并在面對小樣本或小預算時賦予研究人員優勢。
“也許你的場景里有新的物理,是你們領域不習慣處理的。也許你用的是實驗數據,但不太確定它屬于哪個類別。也許你根本不是機器學習研究者,不想花時間去研究所有可能符合你情景的模型,“麥凱布解釋道。“我們希望,這些更廣泛的類別訓練能讓它更易使用,并且更有可能被這些用戶推廣,因為對他們來說,'新'的物理可能是其他領域已經處理了一段時間的事情。”
加州大學伯克利分校博士生、AION-1 項目首席研究員利亞姆·帕克(Liam Parker)表示,使用跨學科模型也能在數據稀少或研究罕見事件時提升預測效果。
Polymathic AI團隊最近在arXiv.org https://arxiv.org/abs/2511.15684 發布了Walrus(海象)的預印本 ,并于12月5日星期五在圣地亞哥舉行的 NeurIPS https://neurips.cc 大會上展示了 AION-1。
Walrus 和 AION-1 是“基礎模型”,意味著它們是通過來自不同研究領域或實驗數據集訓練的https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/ 。這與大多數科學中的人工智能模型不同,后者是針對特定子領域或問題訓練的。基礎模型不是從一組基本方程開始學習特定情境的細節,而是學習物理過程的底層基礎。由于這些物理過程是普遍的,人工智能所學到的知識可以應用于具有相同物理原理的各個領域或問題。基礎模型有諸多好處——從加快計算速度、在低數據環境中的良好表現,到發現跨領域共享的物理學。
AION(永恒)-1 是天文學的基礎模型。它基于本身就已龐大的天文巡天(astronomical surveys)數據進行訓練: 巡天資產(Legacy Survey)https://www.legacysurvey.org 、 高分辨率深場巡天(HSC,Hyper Suprime-Cam) https://www.naoj.org/Projects/HSC/ 、 斯隆數字巡天(SDSS,Sloan Digital Sky Survey) https://sloan.org/programs/research/sloan-digital-sky-survey 、 暗能量光譜儀(DESI,Dark Energy Spectroscopic Instrument)https://www.desi.lbl.gov 和蓋亞(Gaia) https://www.esa.int/Science_Exploration/Space_Science/Gaia_overview 。總的來說,這相當于超過 2億次恒星、類星體和星系的觀測,總數據總量約為 100TB。AION-1 利用圖像、光譜及多種其他測量數據,盡可能多地了解天體。然后,當科學家獲得一個星系的低分辨率圖像時,AION-1 可以從數百萬個星系的物理學中提取更多關于該星系的信息。
Walrus(海象)的領域是流體和類流體系統。Walrus 利用了 Well——一個由 Polymathic AI 團隊編制的龐大數據集,參閱:
Well的數據涵蓋了 19 個不同的場景和 63 個流體動力學領域。總的來說,它包含 15TB 的數據,描述了密度、速度和壓力等參數,涵蓋了從中子星合并、聲波到地球大氣層層變化等廣泛物理系統中的變化。
這樣的基礎模型可以非常強大。AION-1和Walrus可以利用物理學在不同案例中應用,學習新事物。這類似于我們的感官。AION-1 團隊在一篇關于該項目的博客文章中解釋道:“多感官結合——而不是一次只感知一種感官——能讓你更全面地理解一次體驗,https://polymathic-ai.org/blog/aion-1/ 。“隨著時間推移,你的大腦會學會將事物的外觀、味道和嗅覺聯系起來,所以如果某個感官無法使用,你通常能從其他感官中推斷出缺失的信息。”
然后,當科學家進行新的實驗或觀察時,他們有一個起點——一張在類似情境下的物理表現的地圖。“就像看到了許多人類,”Polymathic AI的首席研究員、天體物理學家和機器學習專家 Shirley Ho 說。Shirley Ho是熨斗研究所的高級研究科學家,同時也是紐約大學的教授。當你遇到一個新朋友,因為你之前認識了很多人,你能在腦海中繪制地圖......這個人類會比你以前的朋友們怎么樣,“她說。
基礎模型通過簡化數據處理,使科學家的工作更加輕松。科學家們不再需要為每個項目或任務從零創建新的框架;取而代之的是,他們可以從已經訓練好的人工智能作為基礎開始。“我認為我們對這個基礎模型的愿景是,它讓任何人都能從他們感興趣的數據的強大嵌入出發......并且在不必從零開始構建整個管道的情況下,依然能實現最先進的精度,“AION-1 首席研究員 Parker 說。
他們的目標是制造科學家日常研究中可用的工具。Shirley Ho 說:“我們希望把所有這些AI智能帶給需要的科學家。”
NeurIPS 2025 會議的其他亮點
宇宙學基準測試集(CosmoBench)
https://neurips.cc/virtual/2025/loc/san-diego/poster/121643
CosmoBench 是一個多視圖、多尺度、多任務的幾何深度學習宇宙學基準測試集。CosmoBench 基于最先進的宇宙學模擬,是同類中最大的基準測試,擁有超過 34000 個點云和 25000 棵定向樹。CosmoBench 包含來自宇宙學和多樣化基線的具有挑戰性的評估任務,包括宇宙學方法、簡單線性模型和圖神經網絡。該演講展示 CosmoBench 如何推動宇宙學和幾何深度學習的前沿。
迷失在潛空間(Lost in Latent Space)
https://neurips.cc/virtual/2025/loc/san-diego/poster/115208
物理學家利用對物理定律的理解,建模并預測物理系統的行為。然而,這些計算需要相當大的計算能力。熨斗研究所的科學家及 Polymathic AI 合作組的其他成員研究了一種較輕負擔的計算方式是否仍能產生準確結果。這種被稱為“潛在擴散建模”(latent diffusion modeling)的計算模型,利用人工智能以更低的計算成本生成高質量圖像,同時準確刻畫物理行為。
神經元作為感覺動力學中相干集合的探測器(Neurons as Detectors of Coherent Sets in Sensory Dynamics)
https://neurips.cc/virtual/2025/loc/san-diego/poster/117502
我們對觸覺、味覺、視覺和疼痛的感知由將外周受體信號傳遞到大腦的神經元介導。這項工作表明,這些神經元可以被理解為檢測感官流中的“連貫集合”——即隨時間共同演化、因此共享共同過去或共同未來的刺激軌跡群。通過區分這些相干集合,一些神經元主要編碼剛剛發生的事情,而另一些則可靠地提示接下來可能發生的事情。
因此,傳統的感覺神經元分類可以被重新解釋為反映了對過去的聚焦處理與對未來的預測處理之間的分歧。理解神經系統如何以這種方式分離和轉化感官輸入,可能為治療精神疾病提供新途徑,也可能指導生物啟發人工智能的發展。
預測部分可觀測動力系統(Predicting Partially Observable Dynamical Systems)
https://neurips.cc/virtual/2025/loc/san-diego/poster/118611
科學家可以通過確定性模型預測下落物體的運動或流體的演化,這些模型從過去的觀測中計算出單一的未來結果。但這種方法在物理系統中失效,因為大部分狀態被隱藏。一個顯著的例子是太陽:我們可以觀察到太陽表面的活動,但深處的過程大多是看不見的。沒有這些內部條件,就沒有足夠的信息來預測一個單一的“正確”未來。
熨斗研究所的研究人員與 Polymathic AI 項目的合作者共同開發了一種概率方法,可以推斷這些隱藏的太陽過程。通過將遙遠過去的信息納入基于擴散的生成模型,他們的方法生成了一個合理的未來集合,更清晰地理解過去太陽黑子活動如何塑造其未來演變。
參考資料
https://www.simonsfoundation.org/2025/12/09/these-new-ai-models-are-trained-on-physics-not-words-and-theyre-driving-discovery/
https://youtu.be/3iM_rd3t0_Q
https://polymathic-ai.org
https://neurips.cc/virtual/2025/loc/san-diego/poster/119922
https://neurips.cc/virtual/2025/loc/san-diego/poster/119776
https://arxiv.org/abs/2511.15684
https://neurips.cc
https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/
https://www.legacysurvey.org
https://www.naoj.org/Projects/HSC/
https://sloan.org/programs/research/sloan-digital-sky-survey
https://www.desi.lbl.gov
https://www.esa.int/Science_Exploration/Space_Science/Gaia_overview
https://polymathic-ai.org/blog/aion-1/
https://neurips.cc/virtual/2025/loc/san-diego/poster/121643
https://neurips.cc/virtual/2025/loc/san-diego/poster/115208
https://neurips.cc/virtual/2025/loc/san-diego/poster/117502
https://neurips.cc/virtual/2025/loc/san-diego/poster/118611
小樂數學科普近期文章
·開放 · 友好 · 多元 · 普適 · 守拙·![]()
讓數學
更加
易學易練
易教易研
易賞易玩
易見易得
易傳易及
歡迎評論、點贊、在看、在聽
收藏、分享、轉載、投稿
查看原始文章出處
點擊zzllrr小樂
公眾號主頁
右上角
置頂加星★
數學科普不迷路!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.