Denario是由熨斗研究所、劍橋大學(xué)、巴塞羅那自治大學(xué)等機(jī)構(gòu)的科學(xué)家共同開發(fā)的一款新工具,利用大語言模型來幫助科學(xué)家完成從提出新假設(shè)到總結(jié)研究結(jié)果等各項(xiàng)任務(wù)。該團(tuán)隊(duì)希望 Denario 能夠使研究過程更快、更高效、更具跨學(xué)科性。
![]()
圖源:Lisa Feng / Simons Foundation
作者:Jane Beaufore(科學(xué)作家)2025-11-4
譯者:zzllrr小樂(數(shù)學(xué)科普公眾號(hào))2025-11-5
人工智能正迅速成為許多領(lǐng)域的必備工具,科學(xué)領(lǐng)域也不例外。人工智能可以輔助科學(xué)過程的許多方面,例如 ChatGPT 等工具可以幫助可視化數(shù)據(jù)或撰寫摘要。但這些工具通常一次只能處理科學(xué)過程中的一個(gè)環(huán)節(jié)。
借助一款名為 Denario https://github.com/AstroPilot-AI/Denario 的新工具, 熨斗研究所的科學(xué)家們及其合作者推出了一種新型的“科學(xué)助手”:它能夠整合現(xiàn)有論文、提出新的研究問題、分析和解釋數(shù)據(jù),并撰寫論文。在 arXiv.org 上發(fā)表的一篇預(yù)印本 https://arxiv.org/abs/2510.26887 中,開發(fā)者們對(duì)這款新工具進(jìn)行了概述。他們認(rèn)為,Denario 有望加速和拓展科學(xué)進(jìn)程,使科學(xué)家能夠?qū)⑵鋺?yīng)用于他們認(rèn)為最有幫助的科學(xué)流程的各個(gè)方面,并快速發(fā)現(xiàn)和測(cè)試新的研究方法。
“有時(shí)候,最有趣的是想法本身,因?yàn)樗赡苁且粋€(gè)尚未被探索過的新想法,” Francisco Villaescusa-Navarro(弗朗西斯科·維拉埃斯庫(kù)薩-納瓦羅) 說道,他是熨斗研究所計(jì)算天體物理中心的研究科學(xué)家,也是 Denario 的主要開發(fā)者之一。“有時(shí)候,它是一種從未應(yīng)用于特定數(shù)據(jù)集的新方法。Denario 可以通過多種方式幫助我們拓展思維,并為我們指明新的方向。”
重要的是,該團(tuán)隊(duì)強(qiáng)調(diào),Denario 并不能取代科學(xué)家。目前版本的 Denario 存在重大缺陷。只有大約十分之一的輸出結(jié)果能提供有價(jià)值的見解——而且在某些情況下,Denario 還會(huì)捏造數(shù)據(jù)。
“我們認(rèn)為這個(gè)工具是輔助科研人員的,可以幫助他們簡(jiǎn)化科研流程,而不是取代真正的科學(xué)家,”維拉埃斯庫(kù)薩-納瓦羅說道。他表示,人類仍然是科研過程中不可或缺的一部分,Denario的研究成果也必須經(jīng)過仔細(xì)審查。
Denario 項(xiàng)目由 Villaescusa-Navarro 牽頭,劍橋大學(xué)的 Boris Bolliet 博士和巴塞羅那自治大學(xué)的 Pablo Villanueva Domingo 博士也參與其中。完整的作者名單(他們的專業(yè)領(lǐng)域涵蓋天體物理學(xué)、生物學(xué)、生物物理學(xué)、化學(xué)、材料科學(xué)、神經(jīng)科學(xué)、數(shù)學(xué)、機(jī)器學(xué)習(xí)、量子物理學(xué)和哲學(xué)等)可在預(yù)印本中找到。
多層次人工智能助手
幾十年來,研究人員一直致力于將機(jī)器學(xué)習(xí)應(yīng)用于科學(xué)領(lǐng)域。隨著 ChatGPT、Google Gemini 和 Anthropic 的 Claude 等大語言模型的最新進(jìn)展,Denario 團(tuán)隊(duì)看到了在研究過程的每個(gè)階段測(cè)試這些工具有效性的機(jī)會(huì)。
Bolliet解釋說,Denario 的關(guān)鍵在于它采用了許多人工智能“代理”(智能體 agent),每個(gè)代理負(fù)責(zé)不同的任務(wù)。Denario 可以完成從頭到尾的整個(gè)研究流程,但各個(gè)代理也可以單獨(dú)使用。“我們?yōu)?Denario 設(shè)計(jì)了模塊化架構(gòu),這樣用戶就可以選擇最適合他們研究的組件,無論是編碼、探索研究思路、總結(jié)結(jié)果還是其他任務(wù),”Bolliet說道。
![]()
上圖展示了 Denario 的模塊(代理,智能體)如何協(xié)同工作以產(chǎn)生輸出。改編自 arXiv:2510.26887
要完整使用 Denario,科學(xué)家需要上傳數(shù)據(jù)集以及描述數(shù)據(jù)集和預(yù)期功能的說明文本。第一組智能體負(fù)責(zé)開發(fā)和完善處理數(shù)據(jù)集的最佳方案,最終生成研究項(xiàng)目構(gòu)想。接下來,第二組智能體會(huì)搜索相關(guān)主題的現(xiàn)有研究文獻(xiàn),確保科學(xué)家的項(xiàng)目構(gòu)想具有創(chuàng)新性,并借鑒了前人的研究成果。
項(xiàng)目構(gòu)想完善后,方法論和規(guī)劃代理會(huì)提出數(shù)據(jù)分析方案。下一組代理隨后會(huì)執(zhí)行這些方案。這通過團(tuán)隊(duì)開發(fā)的名為CMBAgenthttps://github.com/CMBAgents/cmbagent 的多代理系統(tǒng)實(shí)現(xiàn),該系統(tǒng)作為 Denario 的研究分析后端。這些代理負(fù)責(zé)編寫、調(diào)試和運(yùn)行代碼,并對(duì)結(jié)果進(jìn)行解釋。最后,編寫和審查模塊會(huì)生成并修改每個(gè)模塊的輸出和發(fā)現(xiàn)的摘要。
所有代理都協(xié)同工作,使之成為可能,”Villanueva Domingo說道,并強(qiáng)調(diào)科學(xué)家可以輕松檢查每個(gè)模塊的工作情況,如果需要,還可以單獨(dú)運(yùn)行代理。
迄今為止,Denario 已在涵蓋天體物理學(xué)、生物學(xué)、生物物理學(xué)、生物醫(yī)學(xué)信息學(xué)、化學(xué)、材料科學(xué)、數(shù)學(xué)物理學(xué)、醫(yī)學(xué)、神經(jīng)科學(xué)和行星科學(xué)等 12 個(gè)不同學(xué)科的數(shù)據(jù)集上進(jìn)行了數(shù)百次端到端測(cè)試。Villaescusa-Navarro 承認(rèn),其大部分輸出結(jié)果都不值得進(jìn)一步研究。大多數(shù)結(jié)果在 Denario 生成結(jié)果的學(xué)科領(lǐng)域?qū)<以u(píng)審后被認(rèn)為不適用。然而,約有 10% 的輸出結(jié)果提出了引人入勝的問題或發(fā)現(xiàn)。
![]()
“我認(rèn)為 Denario 在嘗試各種想法方面尤其有用,”Villaescusa-Navarro 說道。“你可以查看每個(gè)輸出結(jié)果中的不同研究文檔,并判斷哪些內(nèi)容引人入勝,值得進(jìn)一步探索。” 由于 Denario 能夠整合多個(gè)學(xué)科的信息,團(tuán)隊(duì)希望它能夠發(fā)現(xiàn)一些即使是某個(gè)特定領(lǐng)域的專家科學(xué)家也未必會(huì)想到的新研究問題。
“Denario可以從其他領(lǐng)域汲取靈感,而這些領(lǐng)域可能是科學(xué)家不太熟悉甚至從未考慮過的,”Villanueva Domingo說。“這種跨學(xué)科性質(zhì)非常令人興奮。”
例如,Denario 在瘧疾方面的研究成果展現(xiàn)了他對(duì)瘧疾生物學(xué)的專家級(jí)知識(shí),并針對(duì)尚未解答的研究問題提出了幾種創(chuàng)造性的方法。
針對(duì)一個(gè)天體物理數(shù)據(jù)集,Denario 應(yīng)用了一種名為張量列(tensor trains)的數(shù)據(jù)壓縮數(shù)學(xué)方法。這種方法在量子物理學(xué)中應(yīng)用廣泛,但在天體物理學(xué)領(lǐng)域卻鮮為人知。Denario 利用這些張量列以及機(jī)器學(xué)習(xí)技術(shù),追蹤了暗物質(zhì)暈(星系所在的微環(huán)境)的時(shí)間演化。Villaescusa-Navarro 表示,這是一種新方法,未來有望應(yīng)用于宇宙學(xué)和天體物理學(xué)中的許多其他問題。
該團(tuán)隊(duì)還預(yù)計(jì),Denario 將幫助科學(xué)家們重新獲得他們最寶貴的資源:時(shí)間。
“我希望 Denario 能夠通過為研究人員提供工具來加速科學(xué)發(fā)展,幫助他們減少在諸如瀏覽 arXiv、格式化圖像、總結(jié)分析等瑣碎任務(wù)上花費(fèi)的時(shí)間,從而有更多時(shí)間進(jìn)行深入的創(chuàng)造性思考,”Bolliet 說道。
Denario的未來
在下一版本中,科學(xué)家們的目標(biāo)是提高 Denario 的效率,并幫助它產(chǎn)生更高質(zhì)量的工作成果(包括自動(dòng)識(shí)別和剔除低質(zhì)量的輸出)。
“或許在未來幾年內(nèi),我們可以開發(fā)出另一個(gè)代理,讓 Denario 可以用來分析想法并進(jìn)行篩選,從而不斷改進(jìn)好的想法,” Villanueva Domingo 說。
像 Denario 這樣的工具仍然面臨挑戰(zhàn)。從寫作角度來看,它生成的一些最終報(bào)告未能充分傳達(dá)結(jié)果中的不確定性。此外,盡管 Denario 能夠熟練地撰寫以往研究的內(nèi)容,但在引用以往研究和清晰闡述其方法方面卻存在不足。
Villaescusa-Navarro 也意識(shí)到其中存在技術(shù)和倫理方面的考量,包括 Denario 可能利用“幻覺”(生成式人工智能的產(chǎn)物,其中可能包含誤導(dǎo)性或虛假信息)的風(fēng)險(xiǎn),以及版權(quán)和作者身份方面的問題。
“幻覺始終是一個(gè)令人擔(dān)憂的問題,”Francisco Villaescusa-Navarro說道。“我們使用一種名為 Perplexity 的模型來確保Denario引用的論文確實(shí)存在,但即便如此,幻覺仍然可能通過代碼混入其中。”例如,在工具生成虛假數(shù)據(jù)后,研究人員不得不添加一行文本,指示Denario不要捏造“虛擬數(shù)據(jù)”。
該團(tuán)隊(duì)期待就如何更好地在科學(xué)研究中利用 Denario 及類似項(xiàng)目,以及如何防止?jié)撛诘臑E用展開公開討論。他們還強(qiáng)調(diào),Denario 的成功離不開學(xué)術(shù)界和產(chǎn)業(yè)界眾多合作者的鼎力支持。
“能與來自世界各地不同領(lǐng)域的眾多優(yōu)秀人才共事,真是太棒了,”Francisco Villaescusa-Navarro說道。“即使僅僅在熨斗研究所內(nèi)部,我們也收到了來自各個(gè)中心成員的意見。創(chuàng)建這樣一個(gè)社群真是令人贊嘆。”
參考資料
https://www.simonsfoundation.org/2025/11/04/meet-denario-an-ai-assistant-for-every-step-of-the-scientific-process/
https://github.com/AstroPilot-AI/Denario
https://arxiv.org/abs/2510.26887
https://github.com/CMBAgents/cmbagent
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.