<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      上交大 SciMaster 團隊新作:一個「AI 物理博士」的誕生

      0
      分享至


      五個真實物理任務(wù)實測,PhysMaster 可推導、寫碼、數(shù)值驗證。

      作者丨鄭佳美

      編輯丨岑峰

      當大模型的能力從能回答問題走向能完成任務(wù),AI for Science 也正在經(jīng)歷一次更深層的轉(zhuǎn)向。

      過去行業(yè)更關(guān)注模型在標準題目、知識問答和文獻總結(jié)上的表現(xiàn),但這些能力本質(zhì)上仍屬于信息處理,它們可以提升效率,卻很難真正改變科研本身的推進方式。

      現(xiàn)實科研的核心難點并不在于單點能力是否強,而在于研究過程天然是長鏈條、不確定、強依賴驗證的閉環(huán)系統(tǒng)。一個看似簡單的物理問題,往往需要經(jīng)歷建模選擇、推導路徑、數(shù)值實驗設(shè)計、代碼實現(xiàn)、調(diào)參排錯、對照基準結(jié)果、誤差來源分析等一整套流程,任何一步出錯都可能導致結(jié)論失效。

      也正因為如此,科研效率的瓶頸長期不在想法是否聰明,而在能否把想法變成可信結(jié)果,大量時間消耗在重復工程與試錯迭代中。

      在這樣的行業(yè)背景下,上海交通大學 SciMaster 團隊聯(lián)合深勢科技、中科院理論物理所在研究論文《PHYSMASTER: Building an Autonomous AI Physicist for Theoretical and Computational Physics Research》中給出了一個更激進的答案,與其把 AI 當作分散的輔助工具,不如直接構(gòu)建一個能夠組織、規(guī)劃并執(zhí)行科研閉環(huán)的自主系統(tǒng)。

      研究團隊用五個真實的物理科研任務(wù)驗證其能力,從加速成熟工作流,到自動完成復雜數(shù)值研究,再到嘗試自主探索開放問題,展示了 AI 邁向可持續(xù)推進科研的可能路徑。

      這項研究真正值得關(guān)注的地方,不只是模型算得更快或?qū)懙酶袢耍撬屛覀兛吹揭环N潛在的新科研范式,AI 不再只是科研流程中的局部工具,而可能成為能夠承擔完整研究鏈條的研究主體之一。


      論文地址:https://arxiv.org/pdf/2512.19799

      01
      五項任務(wù)跑通科研閉環(huán)

      這項工作并不是在一個統(tǒng)一的數(shù)據(jù)集上跑模型分數(shù),而是通過五個真實的物理科研任務(wù)來驗證系統(tǒng)能力,并將這些任務(wù)按能力層級分為三檔:加速、自動化、自主發(fā)現(xiàn)。換句話說,這項工作希望證明的是,這個系統(tǒng)并非只停留在會聊天的層面,而是能夠像物理博士一樣完成一個完整的研究閉環(huán)。

      首先在加速類任務(wù)中,研究團隊展示了兩個代表性成果:第一個成果是從格點 QCD 數(shù)據(jù)中提取 Collins–Soper kernel。研究人員完成了一條非常標準但極其繁瑣的粒子物理計算鏈條,輸入是一批格點 QCD 的原始歐式相關(guān)函數(shù)數(shù)據(jù)以及 Wilson loop 數(shù)據(jù)。


      這些通常是科研團隊計算得到的原始數(shù)值結(jié)果,輸出則是一個關(guān)鍵物理量 Collins–Soper kernel,用來描述 TMD(橫動量相關(guān)分布)隨尺度變化的規(guī)律。

      研究人員強調(diào),該系統(tǒng)得到的結(jié)果與已有研究人員工作(Tan 等人 2025 的處理)在中心趨勢上是一致的,同時它給出的統(tǒng)計誤差更小,但研究團隊也說明這可能是因為它在某些系統(tǒng)誤差的處理上更樂觀。


      這一成果的重要性并不在于得到某一個數(shù),而在于它能把整條工作流自動跑完,包括從噪聲很大的格點數(shù)據(jù)中完成擬合、自動選擇合理的擬合區(qū)間(這一步在人工分析中很容易帶入主觀性)、進行重整化來消除發(fā)散項、處理遠距離區(qū)間信號爆噪的問題(用符合物理預(yù)期的形式補齊尾部)、做傅里葉變換得到動量空間對象,并最終從不同動量輸入中提取出 kernel,因此它相當于證明AI 不只是會說理論,而是真的能執(zhí)行嚴謹?shù)奈锢頂?shù)據(jù)分析流程。


      第二個加速類任務(wù)是從零寫程序計算鋰原子的第一激發(fā)能,并且不允許依賴軟件工具。在這一任務(wù)中,系統(tǒng)從頭構(gòu)建了一個變分求解器,最終算出了鋰原子的基態(tài)能量、第一激發(fā)態(tài)能量,并用兩者差值得到第一激發(fā)能,且結(jié)果與實驗值非常接近,誤差小到幾乎可以認為足夠支撐科研驗證。

      這個實驗的關(guān)鍵不在于鋰原子本身有多難,而在于它證明了系統(tǒng)在嚴格限制條件下仍具備獨立完成高強度計算物理工程的能力,研究團隊明確規(guī)定它不能調(diào)用任何成熟量化化學軟件(如 Gaussian 或 PySCF),不能依賴外部檢索(等于不能查答案),只能使用 Julia 標準庫,并必須自己推導所需的積分形式、自己完成數(shù)值積分實現(xiàn)、自己進行參數(shù)優(yōu)化。

      真正困難的部分來自工程細節(jié):三電子體系的交換項很容易寫錯,數(shù)值積分同時要處理核附近的發(fā)散行為和遠處的拖尾行為,而基函數(shù)如何選擇、如何保持正交、如何調(diào)整參數(shù),也都要求較強的物理直覺與計算經(jīng)驗。研究人員的結(jié)論是,這類工作研究生往往需要幾天甚至更長時間才能完成,但系統(tǒng)能在很短時間內(nèi)完成,并且結(jié)果還能對得上實驗。

      隨后研究團隊進入自動化類任務(wù),第三個成果是用量子蒙特卡洛(QMC)計算 Union Jack 格子 Bose–Hubbard 模型的相變臨界點,它得到一個非常精確的量子相變臨界點(從超流到莫特絕緣體的轉(zhuǎn)變點),誤差很小,而且結(jié)論符合物理直覺:Union Jack 格子由于連接更豐富、更容易形成超流,因此臨界點相較普通方格子顯著降低。

      這個實驗之所以比前兩個更強,是因為它不是簡單照著公式寫代碼就結(jié)束,而更像一個完整的科研項目級流程,它必須自行實現(xiàn) QMC 的核心算法(SSE 與 directed-loop 更新),處理格子拓撲帶來的細節(jié)差異(例如 winding number 的計算不再與普通格子完全一樣),自動調(diào)參使系統(tǒng)精確落在莫特區(qū)的關(guān)鍵位置(并非隨便選一個化學勢即可),并需要在不同系統(tǒng)尺寸上重復計算,再通過有限尺度分析把有限系統(tǒng)結(jié)果外推到無限系統(tǒng),從而得到可靠的臨界點。

      研究人員還強調(diào),這個任務(wù)是在沒有外部知識庫檢索的情況下完成的,因此等于證明它能夠從物理定義出發(fā)獨立跑完一個高精度數(shù)值研究任務(wù)。


      第四個成果仍屬于自動化類,但形式不同,這項工作研究的是潮汐瓦解事件(TDE)中 nozzle shock 的耗散是否會被廣義相對論效應(yīng)顯著增強,這個案例并不是要算一個固定標準答案,而是要驗證一個假設(shè)是否成立。

      背景是傳統(tǒng)理論往往認為碎片流在近地點附近發(fā)生 nozzle shock 會耗散大量能量,從而快速形成吸積盤,但后來更高分辨率的模擬發(fā)現(xiàn)過去可能高估了耗散強度,甚至高估了兩到三個數(shù)量級。

      在這個背景下,系統(tǒng)要測試的機制是,如果考慮恒星并非一個點,則會產(chǎn)生能量展寬,在 Kerr 黑洞時空中不同能量碎片的軌道進動程度不同,這會導致碎片再次匯合時發(fā)生非零夾角碰撞,從而帶來額外耗散并可能增強 nozzle shock 的總耗散。

      這個實驗體現(xiàn)的能力是自動化科研循環(huán):給系統(tǒng)一個研究人員提出的方向或假設(shè),它能夠自己建模、自己開展數(shù)值實驗、自己判斷這一機制是否可能解釋問題,這比單純做題更接近真實科研。


      最后第五個成果是自主發(fā)現(xiàn)類任務(wù),研究對象是粲介子半輕衰變中的哈密頓量構(gòu)造與振幅預(yù)測,研究團隊將其定義為真正的跨越,意味著系統(tǒng)從協(xié)作科學家邁向自主科學家,即不再是人類一步步告訴它怎么做,而是面對仍然開放、復雜的問題時能夠自主探索,并提出研究人員認為具有創(chuàng)新性的方法。研究團隊認為這一部分體現(xiàn)的是最高等級能力:不僅能夠執(zhí)行任務(wù),還能產(chǎn)出新的研究路線。


      02
      讓物理研究流程化與可復用

      這項工作將 PHYSMASTER 的整體流程拆分為三個階段:前處理、執(zhí)行、沉淀復用,因此它更像一個具備組織能力的科研團隊,而不是單一模型。

      前處理階段,研究人員指出真實科研問題常常信息過載、缺乏層次且存在歧義,如果直接開始計算,很容易跑偏,同時浪費計算資源和上下文長度,因此系統(tǒng)會先進行問題澄清與拆解,明確問題屬于哪個物理方向,厘清輸入內(nèi)容與輸出形式,判斷任務(wù)類型屬于工程計算、假設(shè)檢驗、開放探索或現(xiàn)象學分析中的哪一種,梳理必須遵守的物理約束(如守恒律、對稱性、尺度等),補足所需背景知識,并最終拆成一系列可執(zhí)行子任務(wù),這一步相當于研究人員在正式研究前制定工作計劃。

      隨后在前處理的第二部分,研究團隊會建立一個只服務(wù)當前任務(wù)的專用知識庫,該知識庫并非用于百科式存儲,而是用于補齊關(guān)鍵概念與關(guān)鍵做法,引入必要的數(shù)值基準或標準方法,避免后續(xù)推導與實現(xiàn)憑空編造。

      其構(gòu)建依賴兩類協(xié)作角色,一類負責擴展檢索范圍以盡量不遺漏,另一類負責通過強推理篩選高相關(guān)內(nèi)容,并從中提取定性知識(如機制、物理圖像和效應(yīng)競爭關(guān)系)以及定量知識(如關(guān)鍵數(shù)值結(jié)果、參數(shù)與校準信息),同時強調(diào)證據(jù)鏈,使系統(tǒng)每一步結(jié)論盡量可追溯來源。


      進入執(zhí)行階段后,系統(tǒng)開展理論推導、代碼實現(xiàn)與試錯迭代,研究人員認為物理研究屬于超長任務(wù),通常需要多輪草稿、檢查和修改,因此系統(tǒng)采用多軌跡探索策略,同時并行嘗試多條路線,每條路線產(chǎn)出階段性結(jié)果,最終選擇最可靠、最完整的一條作為最終方案,這更像科研團隊并行推進多個方案,而不是單一路線死磕。

      執(zhí)行階段還包含明確分工:Supervisor 更像導師或項目負責人,負責決定下一步做什么、管理進度以避免遺忘前面結(jié)論、嚴格檢查輸出是否可靠,并提出批評、指出錯誤和要求修正。

      Theoretician 更像具體執(zhí)行的研究員,負責理論推導與建模,把模型轉(zhuǎn)化為可運行程序,并通過數(shù)值實驗得到結(jié)果,而研究團隊強調(diào)系統(tǒng)可靠性的關(guān)鍵在于 Supervisor 提供的批判式反饋,否則系統(tǒng)可能越改越錯。


      最后在沉淀復用階段,研究人員提出長期記憶系統(tǒng) LANDAU,目的不是完成一次任務(wù)就結(jié)束,而是讓系統(tǒng)未來遇到類似問題更快更穩(wěn),它會沉淀任務(wù)中檢索到的可靠文獻知識、已經(jīng)驗證有效的方法流程,以及人工整理的高置信物理常識以避免基礎(chǔ)錯誤,并且每次任務(wù)結(jié)束后,本次構(gòu)建的小型知識庫會并入長期庫,使系統(tǒng)不斷積累經(jīng)驗,逐漸更像一個經(jīng)驗豐富的物理學家。


      03
      從助手到研究者的轉(zhuǎn)變

      整體來看,這項工作可以從四個層面理解其意義。第一,它證明AI 可以完成端到端的物理科研流程,而不僅僅停留在做競賽題、回答事實問題或進行文獻檢索與總結(jié),因為這些傳統(tǒng)評估方式并不能構(gòu)成真正的研究閉環(huán)。

      而真實物理研究更需要抽象建模、嚴謹推導、可執(zhí)行代碼實現(xiàn)以及數(shù)值驗證能力,這些恰恰是過去許多 AI 系統(tǒng)明顯欠缺的地方,因此 PHYSMASTER 的價值就在于把這些關(guān)鍵能力整合到同一個系統(tǒng)里。

      第二,它將物理研究中最耗費人力的重復工程勞動顯著壓縮,例如寫求解器、調(diào)參、調(diào)試、反復跑計算等工作往往占據(jù)大量時間,而加速類案例表明 AI 有可能把原本需要資深博士生花費一到三個月完成的重工程環(huán)節(jié)壓縮到幾個小時,從而直接改變科研推進的節(jié)奏。

      第三,自動化類案例進一步說明科研循環(huán)本身也可以被壓縮到一天左右,即在研究人員給出一個假設(shè)或思路后,系統(tǒng)能夠自動完成探索循環(huán),包括做實驗、驗證假設(shè)并持續(xù)迭代,把原本不可預(yù)測、可能拖延數(shù)月的過程收斂到一天級別,這意味著未來的科研分工可能逐漸變成由人類負責提出方向,由 AI 負責將方向快速轉(zhuǎn)化為可驗證的結(jié)論。

      第四,自主發(fā)現(xiàn)類案例體現(xiàn)出AI 有機會從科研助手轉(zhuǎn)向研究者,因為自主發(fā)現(xiàn)意味著系統(tǒng)不再只是執(zhí)行命令,而是能夠在面對開放性問題時自己探索路徑并推進研究,這正是其所強調(diào)的從協(xié)作科學家邁向自主科學家的關(guān)鍵轉(zhuǎn)變。

      04
      點亮 PhysMaster 的人

      第一作者苗庭嘉本科就讀上海交通大學致遠學院,現(xiàn)為上海交通大學人工智能學院2026級博士研究生,研究方向聚焦于 AI Agents 與 AI for Science,導師為陳思衡副教授。

      2023 至 2024年,他曾在上海交通大學李政道研究所擔任科研助理,從事凝聚態(tài)物理理論研究;此后,在字節(jié)跳動Seed、北京大學計算機學院進行過AI領(lǐng)域研究工作。

      自 2025 年起,苗庭嘉開始與深勢科技合作,深度參與 SciMaster 科研智能體生態(tài)的構(gòu)建與完善。


      本論文的通訊作者為陳思衡。他是上海交通大學人工智能學院長聘教軌副教授、博士生導師。

      陳思衡于 2016 年獲得美國卡內(nèi)基梅隆大學電氣與計算機工程博士學位,并入選國家級人才計劃青年項目。他的研究方向涵蓋圖機器學習、群體智能、多智能體協(xié)同感知以及大模型智能體,并在圖信號處理與圖結(jié)構(gòu)數(shù)據(jù)采樣理論方面做出開拓性貢獻,曾獲得 IEEE 信號處理協(xié)會最佳青年作者論文獎。

      在群體智能領(lǐng)域,他提出群智交互感知的語用社會學習思想,緩解了多智能體協(xié)同感知中通信效率與性能之間的矛盾。近年來,他致力于大模型驅(qū)動的智能體技術(shù),開發(fā)了科研智能體 SciMaster 和 ML-Master,并在 AI4AI 方向取得了顯著進展。


      參考鏈接:https://siheng-chen.github.io/

      未經(jīng)「AI科技評論」授權(quán),嚴禁以任何方式在網(wǎng)頁、論壇、社區(qū)進行轉(zhuǎn)載!

      公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標注來源并插入本公眾號名片。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      廣州男子因狗吠亂拉投毒致寵物狗死亡,法院最終判決

      廣州男子因狗吠亂拉投毒致寵物狗死亡,法院最終判決

      愛下廚的阿釃
      2026-02-06 17:10:03
      中國農(nóng)業(yè)銀行河北省分行原黨委委員、副行長陳元良被開除黨籍

      中國農(nóng)業(yè)銀行河北省分行原黨委委員、副行長陳元良被開除黨籍

      澎湃新聞
      2026-02-06 15:45:06
      體面分手!哈登聲明揭露真相:我從未申請離隊,只是看不到未來

      體面分手!哈登聲明揭露真相:我從未申請離隊,只是看不到未來

      鍵侃籃球
      2026-02-07 02:19:56
      馬未都:我身價至少100億,但這點錢,跟我母親比,我就是個貧農(nóng)

      馬未都:我身價至少100億,但這點錢,跟我母親比,我就是個貧農(nóng)

      忠于法紀
      2026-01-15 22:08:28
      成功了!中國向世界宣布重大科技成果

      成功了!中國向世界宣布重大科技成果

      元爸體育
      2026-02-04 16:44:45
      第一批獨生子女的扎心現(xiàn)實:父母去世后,成了舉目無親的“孤兒”

      第一批獨生子女的扎心現(xiàn)實:父母去世后,成了舉目無親的“孤兒”

      千秋文化
      2026-02-01 20:31:47
      第三次世界大戰(zhàn)導火索如果中國攔截了美國的

      第三次世界大戰(zhàn)導火索如果中國攔截了美國的

      林子說事
      2026-02-07 00:57:11
      霍金也被愛潑斯坦檔案害慘了,都癱瘓成這樣,真的還能玩女人嗎?

      霍金也被愛潑斯坦檔案害慘了,都癱瘓成這樣,真的還能玩女人嗎?

      我心縱橫天地間
      2026-02-05 19:14:54
      終于有人管管美國了!美國遇到大麻煩,美國:中美兩國需要攜手

      終于有人管管美國了!美國遇到大麻煩,美國:中美兩國需要攜手

      福建平子
      2026-01-28 10:52:25
      媒體人:申花吸金能力在中超第一檔,胸前廣告贊助額每年兩億元

      媒體人:申花吸金能力在中超第一檔,胸前廣告贊助額每年兩億元

      懂球帝
      2026-02-07 01:04:18
      11歲玥兒罕見穿黑衣現(xiàn)身,眼神哀傷克制:她其實什么都懂

      11歲玥兒罕見穿黑衣現(xiàn)身,眼神哀傷克制:她其實什么都懂

      橙星文娛
      2026-02-05 17:06:04
      逆行救出51人的劉海洋轉(zhuǎn)院至長沙,病房里向女兒重述救援過程:這就是爸爸的警察故事

      逆行救出51人的劉海洋轉(zhuǎn)院至長沙,病房里向女兒重述救援過程:這就是爸爸的警察故事

      瀟湘晨報
      2026-02-06 14:57:30
      賴清德喊話大陸對話,提出兩岸有三大共同敵人,國臺辦:有個前提

      賴清德喊話大陸對話,提出兩岸有三大共同敵人,國臺辦:有個前提

      午夜搭車a
      2026-02-07 02:23:47
      最新任命!查爾斯宣布由威廉王子代替,哈里王子不得不“妥協(xié)”

      最新任命!查爾斯宣布由威廉王子代替,哈里王子不得不“妥協(xié)”

      夜深愛雜談
      2026-02-06 17:37:17
      大反轉(zhuǎn)!向嫣然醫(yī)院捐款429.2萬元?李亞鵬哽咽:感謝董宇輝!

      大反轉(zhuǎn)!向嫣然醫(yī)院捐款429.2萬元?李亞鵬哽咽:感謝董宇輝!

      小娛樂悠悠
      2026-02-06 09:09:39
      樊振東球隊三天內(nèi)三位實力隊友接連宣布離隊,冠軍陣容解體。

      樊振東球隊三天內(nèi)三位實力隊友接連宣布離隊,冠軍陣容解體。

      章民解說體育
      2026-02-06 04:33:53
      正式復出!WTA多哈1000簽表:鄭欽文首秀對手出爐,或戰(zhàn)萊巴金娜

      正式復出!WTA多哈1000簽表:鄭欽文首秀對手出爐,或戰(zhàn)萊巴金娜

      大秦壁虎白話體育
      2026-02-06 20:51:54
      訪華回國后,斯塔默日子不好過,被逼到公開道歉,首相當不成了?

      訪華回國后,斯塔默日子不好過,被逼到公開道歉,首相當不成了?

      燦若銀爛
      2026-02-07 03:20:27
      中央定調(diào),延遲退休實施后,每晚1年退休,養(yǎng)老金能增加6%嗎?

      中央定調(diào),延遲退休實施后,每晚1年退休,養(yǎng)老金能增加6%嗎?

      另子維愛讀史
      2026-02-05 17:45:59
      戲子誤國!離春節(jié)不到20天,4位明星相繼塌房,一個比一個荒唐

      戲子誤國!離春節(jié)不到20天,4位明星相繼塌房,一個比一個荒唐

      往史過眼云煙
      2026-02-06 16:40:38
      2026-02-07 04:16:49
      AI科技評論 incentive-icons
      AI科技評論
      點評學術(shù),服務(wù)AI
      7071文章數(shù) 20728關(guān)注度
      往期回顧 全部

      科技要聞

      獨角獸版圖巨變:SpaceX奔萬億 中美差在哪

      頭條要聞

      電動車行業(yè)"老三"沖刺上市 分股東2億克扣員工社保3億

      頭條要聞

      電動車行業(yè)"老三"沖刺上市 分股東2億克扣員工社保3億

      體育要聞

      西甲射手榜第2,身價不到姆巴佩1/40

      娛樂要聞

      微博之夜搶C風波 楊冪工作室9字討說法

      財經(jīng)要聞

      愛爾眼科董事長旗下7家精神病院騙保

      汽車要聞

      寶馬"本命年"關(guān)鍵詞:20款新車與"新世代"耐力賽

      態(tài)度原創(chuàng)

      家居
      旅游
      房產(chǎn)
      數(shù)碼
      手機

      家居要聞

      現(xiàn)代輕奢 溫馨治愈系

      旅游要聞

      瑯琊古城·“文旅迎春 馬躍新程”2026河東文旅新春聯(lián)歡晚會舉行

      房產(chǎn)要聞

      新春三亞置業(yè),看過這個熱盤再說!

      數(shù)碼要聞

      零刻SER10 Max迷你主機上市:AI 9 HX 470,0+0款4499元

      手機要聞

      榮耀600被曝光:6.57英寸+9000mAh±電池,友商拿什么打!

      無障礙瀏覽 進入關(guān)懷版