<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      Nature重磅:首個(gè)“AI科學(xué)家”的誕生!實(shí)現(xiàn)端到端自動(dòng)化科研,撰寫論文通過(guò)頂會(huì)同行評(píng)審

      0
      分享至

      撰文丨王聰

      編輯丨王多魚

      排版丨水成文

      2024 年 8 月,Sakana AI 公司、不列顛哥倫比亞大學(xué)、牛津大學(xué)的研究人員組成的研究團(tuán)隊(duì)在預(yù)印本平臺(tái) arXiv 推出首個(gè)旨在全面自動(dòng)化科學(xué)流程的人工智能工具——“AI 科學(xué)家”(AI scientist),其能夠完成科學(xué)發(fā)現(xiàn)的整個(gè)周期——從提出想法到驗(yàn)證想法再到撰寫科學(xué)論文。

      如今,一年多過(guò)去了,可供研究人員使用的 AI 研究助手種類繁多,其中一些也能夠像“AI 科學(xué)家”那樣進(jìn)行自主研究甚至撰寫科學(xué)論文。

      而現(xiàn)在, “AI 科學(xué)家”再次完成了一個(gè)新壯舉——其完成了首個(gè)通過(guò)人類專家同行評(píng)審的完全 AI 生成論文 ,從 研究想法、編寫代碼、運(yùn)行實(shí)驗(yàn)、繪制和分析數(shù)據(jù),到撰寫完整的科學(xué)論文,均由“AI 科學(xué)家”自主完成。

      2026 年 3 月 25 日,研究團(tuán)隊(duì)在國(guó)際頂尖學(xué)術(shù)期刊Nature上發(fā)表了題為:Towards end-to-end automation of AI research 的研究論文,更新了 2024 年的這篇描述“AI 科學(xué)家”的預(yù)印本論文,對(duì)其能力進(jìn)行了適度調(diào)整,進(jìn)一步展示了“AI 科學(xué)家”將生成的三篇原創(chuàng)研究論文提交給了一個(gè)頂級(jí)機(jī)器學(xué)習(xí)會(huì)議——國(guó)際學(xué)習(xí)表征會(huì)議(ICLR),其中一篇論文通過(guò)人類專家同行評(píng)審后被接收,且評(píng)分超過(guò)了該會(huì)議接收論文的平均值。

      這一成就展示了 AI 在科學(xué)貢獻(xiàn)方面日益增強(qiáng)的能力,并預(yù)示著科學(xué)研究方式可能發(fā)生的范式轉(zhuǎn)變。研究團(tuán)隊(duì)表示,如果負(fù)責(zé)任地開發(fā),“AI 科學(xué)家”等自主系統(tǒng)能夠極大地加速科學(xué)發(fā)現(xiàn)。


      什么是“AI 科學(xué)家”?

      “AI 科學(xué)家”是一個(gè)端到端自動(dòng)化科學(xué)研究全過(guò)程的 AI 系統(tǒng),由一系列“智能體”(Agent)構(gòu)成,這些智能體建立在現(xiàn)有的大語(yǔ)言模型(LLM)之上(例如 GPT-4o 或 Claude Sonnet 4)。

      它能夠自主完成從研究構(gòu)思到論文發(fā)表的整個(gè)科研生命周期,包括——

      1、生成研究想法:在用戶指定的機(jī)器學(xué)習(xí)研究子領(lǐng)域中,迭代生成高水平的研究方向和假設(shè);

      2、執(zhí)行實(shí)驗(yàn):編寫代碼、運(yùn)行實(shí)驗(yàn)、可視化結(jié)果;

      3、撰寫論文:按照標(biāo)準(zhǔn)機(jī)器學(xué)習(xí)會(huì)議論文格式,使用 LaTeX 模板逐節(jié)撰寫完整論文;

      4、進(jìn)行同行評(píng)審:通過(guò)自動(dòng)評(píng)審系統(tǒng)評(píng)估論文的科學(xué)質(zhì)量。

      這個(gè)“AI 科學(xué)家”有兩種工作模式:基于模板的模(使用人類提供的代碼模板作為起點(diǎn))和模板自由的模式(完全自主生成代碼并進(jìn)行更廣泛的科學(xué)探索)。


      “AI 科學(xué)家”工作流程

      突破:AI 論文通過(guò)同行評(píng)審

      為了驗(yàn)證“AI 科學(xué)家”的實(shí)際能力,研究團(tuán)隊(duì)進(jìn)行了一項(xiàng)大膽的實(shí)驗(yàn):將完全由“AI 科學(xué)家”生成的研究論文提交給國(guó)際學(xué)習(xí)表征會(huì)議(ICLR)的一個(gè)研討會(huì)進(jìn)行同行評(píng)審。ICLR 是由圖靈獎(jiǎng)得主Yoshua Bengio楊立昆于 2013 年創(chuàng)立的深度學(xué)習(xí)領(lǐng)域?qū)W術(shù)會(huì)議,其與 NeurIPS、ICML 并稱為機(jī)器學(xué)習(xí)領(lǐng)域主要會(huì)議,在谷歌學(xué)術(shù)會(huì)議期刊排名中位列全球前十。

      整個(gè)實(shí)驗(yàn)過(guò)程完全透明且符合倫理規(guī)范:

      • 會(huì)議組織者事先知情并同意;

      • 人類評(píng)審專家被告知有部分論文是 AI 生成的,但不知道具體是哪幾篇;

      • 所有 AI 生成的論文在評(píng)審后都會(huì)被撤回,避免在科學(xué)界建立明確標(biāo)準(zhǔn)前設(shè)定先例。

      結(jié)果令人震驚:“AI 科學(xué)家”提交的三篇 AI 生成論文中,有一篇獲得了人類評(píng)審專家的平均分 6.33 分(個(gè)人評(píng)分分別為 6、7、6),成為第一篇完全由 AI 生成并通過(guò)了標(biāo)準(zhǔn)的科學(xué)同行評(píng)審流程的研究論文,這一分?jǐn)?shù)超過(guò)了該研討會(huì)接收論文的平均分?jǐn)?shù)。這篇題為:Compositional regularization: Unexpected obstacles in enhancing neural network generalization(組合正則化:增強(qiáng)神經(jīng)網(wǎng)絡(luò)泛化能力中的意外障)的論文報(bào)告了一個(gè)負(fù)面結(jié)果,與研討會(huì)關(guān)注“有趣負(fù)面結(jié)果”的主題高度契合。


      “AI 科學(xué)家”生成的一篇論文的精選部分,該論文已通過(guò)同行評(píng)審,在頂級(jí)機(jī)器學(xué)習(xí)會(huì)議的研討會(huì)上被接受

      自動(dòng)評(píng)審系統(tǒng):與人類評(píng)審者媲美

      “AI 科學(xué)家”不僅能夠生成論文,還配備了“自動(dòng)評(píng)審器”來(lái)評(píng)估論文質(zhì)量。這個(gè)自動(dòng)評(píng)審系統(tǒng)的表現(xiàn)如何?

      根據(jù)論文中的對(duì)比數(shù)據(jù),自動(dòng)評(píng)審器在關(guān)鍵指標(biāo)上與人類評(píng)審者表現(xiàn)相當(dāng)甚至更優(yōu):

      • 平衡準(zhǔn)確率:自動(dòng)評(píng)審器 69% vs 人類評(píng)審者 66%;

      • F1 分?jǐn)?shù):自動(dòng)評(píng)審器 0.62 vs 人類評(píng)審者 0.49;

      • 曲線下面積(AUC):自動(dòng)評(píng)審器 0.69 vs 人類評(píng)審者 0.65。

      即使在訓(xùn)練數(shù)據(jù)截止日期后的 2025 年的新論文上,自動(dòng)評(píng)審器仍保持 66% 的平衡準(zhǔn)確率,與人類評(píng)審者水平相當(dāng)。

      系統(tǒng)工作原理:四階段科研流程

      “AI 科學(xué)家”按照四個(gè)主要階段順序工作——

      第一階段:想法生成與篩選,系統(tǒng)迭代生成研究想法檔案,為每個(gè)方向生成描述性標(biāo)題、研究理由和實(shí)驗(yàn)計(jì)劃。然后通過(guò)連接語(yǔ)義學(xué)者API和網(wǎng)絡(luò)訪問(wèn)工具,篩選掉與現(xiàn)有文獻(xiàn)過(guò)于相似的想法。

      第二階段:實(shí)驗(yàn)執(zhí)行與可視化,系統(tǒng)執(zhí)行提出的實(shí)驗(yàn)計(jì)劃,可視化結(jié)果,并為后續(xù)寫作做好筆記記錄。在模板自由模式下,系統(tǒng)會(huì)從零開始生成代碼,并通過(guò)樹搜索優(yōu)化實(shí)驗(yàn)執(zhí)行。

      第三階段:論文撰寫,系統(tǒng)使用筆記和圖表,按照會(huì)議論文模板逐節(jié)填充內(nèi)容,通過(guò)查詢獲取相關(guān)文獻(xiàn),并在 20 輪比較中為論文添加適當(dāng)引用。

      第四階段:自動(dòng)評(píng)審,生成的論文由自動(dòng)評(píng)審系統(tǒng)評(píng)估,提供數(shù)值評(píng)分、優(yōu)缺點(diǎn)列表和接受/拒絕的二元決策。


      “AI 科學(xué)家”工作的四個(gè)階段

      意義與局限:科學(xué)研究的范式轉(zhuǎn)變

      這項(xiàng)研究的成功標(biāo)志著 AI 在科學(xué)貢獻(xiàn)能力上的重大進(jìn)步,可能預(yù)示著科學(xué)研究方式的范式轉(zhuǎn)變。如果負(fù)責(zé)任地開發(fā),這種自主系統(tǒng)可以極大地加速科學(xué)發(fā)現(xiàn)。

      當(dāng)然,研究團(tuán)隊(duì)也坦誠(chéng)指出了當(dāng)前系統(tǒng)的局限性:三篇提交論文中只有一篇被接受,且研討會(huì)接受率(70%)遠(yuǎn)高于主會(huì)議(32%);提交的論文尚不能達(dá)到頂尖論文的標(biāo)準(zhǔn);常見失敗模式包括想法幼稚、實(shí)現(xiàn)錯(cuò)誤、方法嚴(yán)謹(jǐn)性不足、實(shí)驗(yàn)錯(cuò)誤和多種類型的幻覺(jué)。

      未來(lái)展望與倫理考量

      隨著 AI 系統(tǒng)能力的指數(shù)級(jí)增長(zhǎng)和成本的指數(shù)級(jí)下降,“AI 科學(xué)家”的性能有望大幅提升。未來(lái),同樣的方法可以應(yīng)用于其他科學(xué)領(lǐng)域,例如自動(dòng)化化學(xué)實(shí)驗(yàn)室。

      然而,自動(dòng)化論文生成能力也帶來(lái)了重要的倫理和社會(huì)關(guān)切——可能壓垮同行評(píng)審系統(tǒng)、人為夸大研究資歷、未經(jīng)適當(dāng)認(rèn)可地挪用他人想法、消除科學(xué)家工作崗位、進(jìn)行不道德或危險(xiǎn)的實(shí)驗(yàn)等等。

      研究團(tuán)隊(duì)強(qiáng)調(diào),在科學(xué)界建立明確的披露和評(píng)估標(biāo)準(zhǔn)前,需要謹(jǐn)慎推進(jìn)這類 AI 系統(tǒng)的應(yīng)用,確保它們被用于促進(jìn)而非破壞科學(xué)誠(chéng)信。

      “AI 科學(xué)家”生成并通過(guò)同行評(píng)審的論文,是 AI 發(fā)展史上的一個(gè)重要里程碑。它不僅是技術(shù)能力的展示,更是對(duì)傳統(tǒng)科研模式的深刻挑戰(zhàn)。當(dāng) AI 開始涉足人類智慧的最高殿堂——科學(xué)發(fā)現(xiàn)時(shí),我們既看到了加速進(jìn)步的巨大潛力,也面臨著重新定義科研倫理邊界的緊迫任務(wù)。

      論文鏈接

      https://www.nature.com/articles/s41586-026-10265-5

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      35歲男子常用微波爐加熱食物,2年后確診胃癌,醫(yī)生:犯了3個(gè)錯(cuò)

      35歲男子常用微波爐加熱食物,2年后確診胃癌,醫(yī)生:犯了3個(gè)錯(cuò)

      健康科普365
      2026-04-22 15:25:03
      又打起來(lái)了,以色列遭斬首行動(dòng),伊朗發(fā)出嚴(yán)厲警告:隨時(shí)準(zhǔn)備開火

      又打起來(lái)了,以色列遭斬首行動(dòng),伊朗發(fā)出嚴(yán)厲警告:隨時(shí)準(zhǔn)備開火

      別吵吵
      2026-04-23 09:15:23
      奧沙利文:打斯諾克就是一份工作 收入配不上付出 就去打中式黑八

      奧沙利文:打斯諾克就是一份工作 收入配不上付出 就去打中式黑八

      羅克
      2026-04-23 08:56:36
      廣西一佳人好漂亮, 身高169cm,體重50kg 美的讓人移不開眼

      廣西一佳人好漂亮, 身高169cm,體重50kg 美的讓人移不開眼

      動(dòng)物奇奇怪怪
      2026-04-15 18:16:01
      破防了!一37歲女子相親遇國(guó)企月薪5500男生,稱不接受貧窮的生活

      破防了!一37歲女子相親遇國(guó)企月薪5500男生,稱不接受貧窮的生活

      匹夫來(lái)搞笑
      2026-04-23 09:22:07
      男子曬兩任老婆做的菜,問(wèn)這說(shuō)明什么,網(wǎng)友:證明前妻能陪你吃苦

      男子曬兩任老婆做的菜,問(wèn)這說(shuō)明什么,網(wǎng)友:證明前妻能陪你吃苦

      丫頭舫
      2026-04-22 21:55:06
      算力租賃概念反復(fù)活躍,多股漲停

      算力租賃概念反復(fù)活躍,多股漲停

      每日經(jīng)濟(jì)新聞
      2026-04-23 10:11:08
      2026-2032房?jī)r(jià)大預(yù)測(cè):現(xiàn)在200萬(wàn)的房子,5年后還值幾個(gè)錢?

      2026-2032房?jī)r(jià)大預(yù)測(cè):現(xiàn)在200萬(wàn)的房子,5年后還值幾個(gè)錢?

      貓叔東山再起
      2026-04-23 10:45:03
      網(wǎng)紅藍(lán)戰(zhàn)非復(fù)出:帶貨3天破千萬(wàn),曾稱年入9位數(shù)

      網(wǎng)紅藍(lán)戰(zhàn)非復(fù)出:帶貨3天破千萬(wàn),曾稱年入9位數(shù)

      三言科技
      2026-04-22 22:51:05
      若本輪意甲米蘭和那不勒斯無(wú)法取勝,國(guó)米贏球就能提前4輪奪冠

      若本輪意甲米蘭和那不勒斯無(wú)法取勝,國(guó)米贏球就能提前4輪奪冠

      懂球帝
      2026-04-23 10:10:09
      雷霆2-0!亞歷山大帶傷轟37+9+5嘲諷狄龍 再擒太陽(yáng)拒絕26分大逆轉(zhuǎn)

      雷霆2-0!亞歷山大帶傷轟37+9+5嘲諷狄龍 再擒太陽(yáng)拒絕26分大逆轉(zhuǎn)

      追球者
      2026-04-23 12:20:00
      收官戰(zhàn)廣東VS福建!賽前3個(gè)好消息1個(gè)壞消息 新簽外援有望完

      收官戰(zhàn)廣東VS福建!賽前3個(gè)好消息1個(gè)壞消息 新簽外援有望完

      羅納爾說(shuō)個(gè)球
      2026-04-23 12:30:57
      張柏芝沒(méi)料到,陪伴了謝霆鋒23年的女人,如今會(huì)讓他“深陷泥潭”

      張柏芝沒(méi)料到,陪伴了謝霆鋒23年的女人,如今會(huì)讓他“深陷泥潭”

      阿訊說(shuō)天下
      2026-04-23 12:20:19
      許家印認(rèn)罪!2.4萬(wàn)億窟窿,家族只拿走500億,其余真金白銀去哪了

      許家印認(rèn)罪!2.4萬(wàn)億窟窿,家族只拿走500億,其余真金白銀去哪了

      蜉蝣說(shuō)
      2026-04-23 09:41:11
      交管12123出現(xiàn)綠拇指!連續(xù)3年無(wú)扣分,交強(qiáng)險(xiǎn)最低475元、免審驗(yàn)

      交管12123出現(xiàn)綠拇指!連續(xù)3年無(wú)扣分,交強(qiáng)險(xiǎn)最低475元、免審驗(yàn)

      生活魔術(shù)專家
      2026-04-21 11:21:13
      中方不伺候了!對(duì)荷光刻機(jī)優(yōu)待全部取消,450億芯片不做了!

      中方不伺候了!對(duì)荷光刻機(jī)優(yōu)待全部取消,450億芯片不做了!

      史智文道
      2026-04-23 10:05:02
      太敢說(shuō)!34歲方博:現(xiàn)在全是內(nèi)斗+拉踩隊(duì)友 不求自己好但求別人差

      太敢說(shuō)!34歲方博:現(xiàn)在全是內(nèi)斗+拉踩隊(duì)友 不求自己好但求別人差

      念洲
      2026-04-22 13:49:49
      偉偉道來(lái) | 備戰(zhàn)

      偉偉道來(lái) | 備戰(zhàn)

      經(jīng)濟(jì)觀察報(bào)
      2026-04-22 14:26:02
      陳亞楠訂婚后狀態(tài)曝光!未婚夫曬兩人同框視頻,眉目傳情盡顯甜蜜

      陳亞楠訂婚后狀態(tài)曝光!未婚夫曬兩人同框視頻,眉目傳情盡顯甜蜜

      阿鳧愛吐槽
      2026-04-23 12:04:35
      康凱:把“張飛”演成傻子,無(wú)戲可拍11年,如今現(xiàn)狀令人唏噓

      康凱:把“張飛”演成傻子,無(wú)戲可拍11年,如今現(xiàn)狀令人唏噓

      流云隨風(fēng)去遠(yuǎn)方
      2026-04-18 15:35:50
      2026-04-23 13:19:00
      生物世界 incentive-icons
      生物世界
      最前沿、最有趣的生命科學(xué)研究
      9258文章數(shù) 145058關(guān)注度
      往期回顧 全部

      科技要聞

      車沒(méi)賣爆,利潤(rùn)卻大漲,特斯拉發(fā)布財(cái)報(bào)

      頭條要聞

      媒體:當(dāng)下越南"極度不安" 蘇林訪華簽文件對(duì)沖"焦慮"

      頭條要聞

      媒體:當(dāng)下越南"極度不安" 蘇林訪華簽文件對(duì)沖"焦慮"

      體育要聞

      萊斯特城降入英甲,一場(chǎng)虧麻了的豪賭

      娛樂(lè)要聞

      《凌探未來(lái)》公益紀(jì)錄片今日發(fā)布

      財(cái)經(jīng)要聞

      全球第一個(gè)國(guó)家宣布:儲(chǔ)備6月耗盡

      汽車要聞

      長(zhǎng)安"1445"戰(zhàn)略:一張走向"世界長(zhǎng)安"的行軍地圖

      態(tài)度原創(chuàng)

      藝術(shù)
      數(shù)碼
      時(shí)尚
      本地
      公開課

      藝術(shù)要聞

      生完7個(gè)女兒后,60歲的她被香奈兒邀請(qǐng)走高定秀!

      數(shù)碼要聞

      2026游戲本必看!暗影精靈PRO 15耐用解析 適配直播用戶+硬核玩家

      比白襯衫還火!入夏一定要擁有這條裙子,太時(shí)髦了

      本地新聞

      SAGA GIRLS 2026女團(tuán)選秀

      公開課

      李玫瑾:為什么性格比能力更重要?

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版