設(shè)置星標(biāo)★關(guān)注,從此你的世界多點(diǎn)科學(xué)~
![]()
越來(lái)越多企業(yè)、研究所開(kāi)始展示其利用人工智能取得的優(yōu)秀科研成果。但此類(lèi)“AI科學(xué)家”系統(tǒng)能成為真正的創(chuàng)新者、探索者嗎?如果它們的確足夠強(qiáng)大,人類(lèi)科學(xué)家又該如何調(diào)整自己在實(shí)驗(yàn)室里的位置、在論文稿上的地位?
為論文而生,到實(shí)驗(yàn)中去
那是2025年4月,有一場(chǎng)人工智能大會(huì)即將召開(kāi)。科學(xué)家卡爾(Carl)則早已將自己撰寫(xiě)的4份論文呈遞至大會(huì)的同行評(píng)審專(zhuān)家組處,希望作品最終被公開(kāi)展示。經(jīng)歷了雙盲同行評(píng)審后,4篇文章里的3篇順利入圍。
評(píng)審專(zhuān)家確信卡爾的成果水平高、亮點(diǎn)足,而他們不知道的是,這3篇論文其實(shí)是AI寫(xiě)的,從一眾人類(lèi)投稿者中脫穎而出的卡爾是AI系統(tǒng)。(當(dāng)然,撰文過(guò)程有不同程度的人類(lèi)參與。)研發(fā)出卡爾系統(tǒng)的科技企業(yè)名為Autoscience Institute,該機(jī)構(gòu)表示,這款模型能加速人工智能領(lǐng)域的研究進(jìn)程。
時(shí)間過(guò)去短短一年,像卡爾這樣的“AI科學(xué)家”越來(lái)越多。比如,美國(guó)的非營(yíng)利性研究所FutureHouse開(kāi)發(fā)了科研智能體羅賓(Robin)、科斯莫斯(Kosmos);更早些時(shí)候,日本AI初創(chuàng)公司Sakana AI也推出過(guò)全自動(dòng)科學(xué)發(fā)現(xiàn)系統(tǒng)——產(chǎn)品名就叫“AI科學(xué)家”。
AI科學(xué)家由多個(gè)大型語(yǔ)言模型(LLM)整合而成。Autoscience Institute聯(lián)合創(chuàng)始人埃利奧特·考恩(Eliot Cowan)表示:不同于聊天機(jī)器人,以卡爾為代表的AI科學(xué)家被設(shè)計(jì)用于生成、驗(yàn)證研究思路并產(chǎn)出科研成果。此類(lèi)系統(tǒng)能在不同程度上自主梳理文獻(xiàn)、提出假設(shè)、開(kāi)展實(shí)驗(yàn)、分析數(shù)據(jù),最終取得創(chuàng)新性的科研發(fā)現(xiàn);而開(kāi)發(fā)者的目標(biāo)是借助人工智能提高科研效率、擴(kuò)大科研產(chǎn)出。
至于AI科學(xué)家會(huì)不會(huì)取代人類(lèi)科學(xué)家——企業(yè)普遍覺(jué)得可能性很小。
不過(guò)無(wú)論如何,科學(xué)研究攜手人工智能的自動(dòng)化發(fā)展趨勢(shì)已經(jīng)引發(fā)某些復(fù)雜情緒。正如知名學(xué)者朱利安·托格利烏斯(Julian Togelius)所言:“你很難不感到不安,因?yàn)橄裉峒僬f(shuō)、整文獻(xiàn)這些工作,本該是我們做的。”
托格利烏斯既是計(jì)算機(jī)科學(xué)家又是AI研究專(zhuān)家。實(shí)際上,有許多像托格利烏斯這樣的AI領(lǐng)域研究者都心懷憂(yōu)慮,認(rèn)為AI科學(xué)家可能擠占下一代科研人員的發(fā)展空間,將大量低質(zhì)量、不可靠的數(shù)據(jù)引入科研系統(tǒng),削弱人們對(duì)科學(xué)發(fā)現(xiàn)的信任度。
英國(guó)艾倫·圖靈研究所的學(xué)者大衛(wèi)·萊斯利(David Leslie)則感慨:“科研是一項(xiàng)已經(jīng)高度成熟且充滿(mǎn)社會(huì)性、由人類(lèi)主導(dǎo)的事業(yè)。傳統(tǒng)上的科研實(shí)踐與計(jì)算系統(tǒng)的運(yùn)作存在本質(zhì)區(qū)別——人工智能在其中該如何定位?”
“為科學(xué)研究帶來(lái)無(wú)限可能”
過(guò)去5年間,AI驅(qū)動(dòng)的自動(dòng)化系統(tǒng)已助力取得多項(xiàng)重大科研突破。
例如,谷歌DeepMind公司推出的AlphaFold能以高分辨率預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu),其運(yùn)算速度遠(yuǎn)非科研人員得實(shí)驗(yàn)速度可比。作為AlphaFold的主要開(kāi)發(fā)者德米斯·哈薩比斯(Demis Hassabis)和約翰·江珀(John Jumper),也憑借在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方面的卓越貢獻(xiàn)而收獲2024年諾貝爾化學(xué)獎(jiǎng)。(詳見(jiàn):)
萊斯利曾提出所謂“計(jì)算弗蘭肯斯坦拼接體”(computational Frankensteins)的概念:對(duì)各類(lèi)生成式AI基礎(chǔ)設(shè)施、算法及其他組件做融合,再利用融合后的技術(shù)開(kāi)發(fā)應(yīng)用,嘗試模擬那些復(fù)雜、本需人類(lèi)親身參與的社會(huì)實(shí)踐,其中包括科學(xué)發(fā)現(xiàn)過(guò)程。
僅2025年一年,就至少有Sakana AI、Autoscience Institute、FutureHouse三家單位高調(diào)公布其首批由人工智能生成的科研成果。部分受雇于美國(guó)政府的科研人員也開(kāi)始接納AI:在阿貢國(guó)家實(shí)驗(yàn)室、橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室和勞倫斯伯克利國(guó)家實(shí)驗(yàn)室,科學(xué)家成功開(kāi)發(fā)出由AI驅(qū)動(dòng)的全自動(dòng)材料實(shí)驗(yàn)室。
這些人工智能系統(tǒng)和大語(yǔ)言模型一樣,有望被用于整合文獻(xiàn)、挖掘海量數(shù)據(jù),進(jìn)而發(fā)現(xiàn)潛在規(guī)律。在材料科學(xué)領(lǐng)域,AI系統(tǒng)能設(shè)計(jì)、發(fā)現(xiàn)新型材料;在亞原子粒子物理學(xué)領(lǐng)域,它們也能幫助人類(lèi)取得深刻的見(jiàn)解。
萊斯利表示,人工智能系統(tǒng)能以人類(lèi)不可企及的方式,在數(shù)百萬(wàn)、數(shù)十億乃至數(shù)萬(wàn)億個(gè)變量間建立關(guān)聯(lián)。“單是這項(xiàng)能力,就為科研帶來(lái)了無(wú)限可能。”
舉例來(lái)說(shuō),F(xiàn)utureHouse開(kāi)發(fā)的羅賓通過(guò)對(duì)文獻(xiàn)資料的挖掘,發(fā)現(xiàn)一種有望治療致盲性病變的候選藥物,還提出了驗(yàn)證該藥物療效的實(shí)驗(yàn)方案,并完成相關(guān)數(shù)據(jù)分析。
編造風(fēng)險(xiǎn)大,創(chuàng)新力不足
在創(chuàng)造無(wú)限可能的對(duì)面,是生產(chǎn)科研糟粕的風(fēng)險(xiǎn)。
正如卡內(nèi)基梅隆大學(xué)計(jì)算機(jī)科學(xué)家尼哈爾·沙阿(Nihar Shah)所擔(dān)憂(yōu)的,未來(lái)或?qū)⒂写罅抠|(zhì)量低下、缺乏創(chuàng)新的AI生成研究充斥學(xué)術(shù)文獻(xiàn)。當(dāng)然,沙阿對(duì)人工智能助力新發(fā)現(xiàn)的前景“總體上更為樂(lè)觀”。
值得一提的是,沙阿團(tuán)隊(duì)還測(cè)試過(guò)兩款輔助科研的AI模型,試圖找出系統(tǒng)的缺陷和不足。一款是Sakana AI的“AI科學(xué)家2.0”,另一款是半導(dǎo)體企業(yè)AMD與約翰霍普金斯大學(xué)合作打造的“智能體實(shí)驗(yàn)室”(Agent Laboratory)系統(tǒng),其任務(wù)是充當(dāng)科研助理。
在測(cè)試中,AI科學(xué)家2.0開(kāi)展某一特定任務(wù)時(shí)報(bào)告了達(dá)到95%乃至100%準(zhǔn)確率;鑒于研究人員事先向數(shù)據(jù)集內(nèi)引入了噪聲,如此準(zhǔn)確率顯然不合理。智能體實(shí)驗(yàn)室也存在類(lèi)似問(wèn)題,即有時(shí)會(huì)編造合成數(shù)據(jù)集用于分析,卻在最終報(bào)告里聲稱(chēng)分析基于原始數(shù)據(jù)集。
為此,沙阿與同事創(chuàng)建了新算法用以標(biāo)記這類(lèi)方法學(xué)誤區(qū),比如“分析時(shí)只挑選對(duì)研究有利的數(shù)據(jù)集”“選擇性公布陽(yáng)性結(jié)果”等。
另一方面,生成式AI系統(tǒng)存在創(chuàng)新能力不足的問(wèn)題。
例如,曾有專(zhuān)家判斷聊天機(jī)器人GPT-4僅能實(shí)現(xiàn)漸進(jìn)式的科學(xué)發(fā)現(xiàn);又如,《科學(xué)-免疫學(xué)》(Science Immunology)雜志2025年發(fā)文稱(chēng):盡管AI聊天機(jī)器人能準(zhǔn)確整合文獻(xiàn),但至少在疫苗學(xué)領(lǐng)域,它們提不出富有洞見(jiàn)的研究假設(shè)或?qū)嶒?yàn)方案。
該如何審查、驗(yàn)證AI產(chǎn)出的成果?
沙阿認(rèn)為,AI科學(xué)家的持續(xù)應(yīng)用并不會(huì)導(dǎo)致實(shí)驗(yàn)室中的人類(lèi)被邊緣化。
“就算機(jī)器強(qiáng)大到無(wú)與倫比,人類(lèi)仍有施展才華的天地;當(dāng)然,目前還難以明確未來(lái)人類(lèi)的角色定位,能參與科研的哪些環(huán)節(jié)。”
用萊斯利的話(huà)說(shuō),科學(xué)研究一直都是充滿(mǎn)“人性”的事業(yè),由人類(lèi)的詮釋、構(gòu)建、探討和探索組成,常常受到科研人員自身的價(jià)值觀和偏好的影響。為預(yù)測(cè)最優(yōu)答案而生的計(jì)算系統(tǒng)則與之截然不同。預(yù)測(cè)模型本身只負(fù)責(zé)從博大精深的科學(xué)實(shí)踐中截取冰山一角。
“要知道,科研實(shí)踐的復(fù)雜性常常來(lái)自制度層面、方法論層面和歷史層面,科研甚至還受限于不公正、歧視等問(wèn)題——這些問(wèn)題往往決定誰(shuí)能從事科研、誰(shuí)被拒之門(mén)外、科學(xué)為誰(shuí)服務(wù)、哪些領(lǐng)域長(zhǎng)期徘徊不前……”
有些專(zhuān)家認(rèn)為,AI科學(xué)家不會(huì)成為替代者,而是科研人員的輔助工具,幫助人類(lèi)收獲洞見(jiàn),就像顯微鏡、望遠(yuǎn)鏡一樣。
Sakana AI推出初代AI科學(xué)家時(shí)曾發(fā)文稱(chēng):“我們認(rèn)為,人類(lèi)科學(xué)家的作用不會(huì)被削弱,反倒會(huì)跟隨技術(shù)新趨勢(shì)而調(diào)整角色定位,向科研價(jià)值鏈的更高處邁進(jìn)。”
實(shí)際上,如今有許多科研人員都已開(kāi)始思考自己未來(lái)會(huì)如何與AI攜手相伴。不過(guò),其中有一項(xiàng)關(guān)鍵話(huà)題一直被關(guān)注,即“如何審查與驗(yàn)證人工智能產(chǎn)出的研究成果”。
沙阿提議,未來(lái)的學(xué)術(shù)期刊和會(huì)議應(yīng)核查科研過(guò)程的日志記錄以及生成的代碼,以此審查AI成果,驗(yàn)證其真實(shí)性,并找出其中的方法學(xué)漏洞。
考恩表示,Autoscience Institute等機(jī)構(gòu)正嘗試設(shè)計(jì)嚴(yán)守倫理準(zhǔn)則的AI系統(tǒng),希望人工智能遵循“學(xué)術(shù)機(jī)構(gòu)的科研人員開(kāi)展實(shí)驗(yàn)時(shí)所需遵循的標(biāo)準(zhǔn)”。
值得一提的是,前文介紹的卡爾被設(shè)計(jì)者置入了多項(xiàng)準(zhǔn)則,包括杜絕虛假署名和剽竊、保證結(jié)果的可復(fù)現(xiàn)性、不涉及人類(lèi)受試者或采用敏感數(shù)據(jù)等。
資料來(lái)源:
![]()
《世界科學(xué)》雜志版在售中 歡迎訂閱
月刊定價(jià)
15元/期
全年訂閱價(jià)
180元
點(diǎn)擊左側(cè)圖片或以下方訂閱方式選購(gòu)
方式一:
掃描二維碼,“雜志鋪”(第三方平臺(tái))訂閱有折扣~
方式二:
全國(guó)各地郵局訂閱 郵發(fā)代號(hào):4-263
方式三:
機(jī)構(gòu)訂閱,請(qǐng)撥打
021-53300839;
021-53300838
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.