![]()
機(jī)器之心報(bào)道
機(jī)器之心編輯部
AI 能否被學(xué)術(shù)會(huì)議、期刊的審稿人用于論文評(píng)審?
目前,即使是在 AI 領(lǐng)域也尚未形成統(tǒng)一規(guī)范。目前全球的幾大頂級(jí)會(huì)議里,ICLR 的規(guī)則是使用大模型必須進(jìn)行披露,CVPR 則規(guī)定大模型在任何階段都不能用于撰寫審稿意見。
不過(guò),面對(duì)日益膨脹的論文投稿數(shù)量,很多時(shí)候這件事由不得人類決定。在已經(jīng)出臺(tái)了「最嚴(yán)管控規(guī)則」的 ICLR 2026 上,有人統(tǒng)計(jì)仍有高達(dá)五分之一的審稿意見是由大模型一鍵生成的
盡管如此,各大會(huì)議的審稿周期仍然十分冗長(zhǎng)。
斯坦福大學(xué)教授,人工智能著名學(xué)者吳恩達(dá)已經(jīng)對(duì)日益拉長(zhǎng)的審稿反饋周期感到疲憊。
他的一位學(xué)生的論文更是「命途多舛」——三年被拒六次,每一次都要等待約六個(gè)月的審稿結(jié)果。
如此緩慢的反饋循環(huán),不僅影響研究成果發(fā)布的進(jìn)程,更與現(xiàn)在飛速迭代的技術(shù)發(fā)展周期下對(duì)研究效率的要求背道而馳。
既然無(wú)法改變論文評(píng)審的周期,那么我們能否借助 AI 的強(qiáng)大能力構(gòu)建一個(gè)高效的「論文反饋工作流」,讓研究人員在正式投稿前就能獲得高質(zhì)量審稿意見,更快、更有方向地迭代論文內(nèi)容,從而減少在重大會(huì)議和期刊上反復(fù)被拒的成本與時(shí)間?
![]()
為此,吳恩達(dá)教授發(fā)布了一個(gè)全新的面向研究論文的「Agentic Reviewer(智能體審稿人)」
這個(gè)項(xiàng)目最初只是他周末寫著玩的一個(gè)小工具,后來(lái)在博士生 Yixing Jiang 的幫助下,被大幅加強(qiáng)了。
我們?cè)?ICLR 2025 的審稿數(shù)據(jù)上訓(xùn)練系統(tǒng),并在測(cè)試集上測(cè)了 Spearman 相關(guān)系數(shù)(越高越好):
- 兩位人工審稿人之間的相關(guān)性:0.41
- AI 與人工審稿人的相關(guān)性:0.42
這表明,智能體審稿正在逐步接近人類水平。
現(xiàn)階段,這個(gè)智能體會(huì)通過(guò)檢索 arXiv 的數(shù)據(jù)來(lái)生成有依據(jù)的反饋,因此在 人工智能等主要公開發(fā)表在 arXiv 上的研究領(lǐng)域上的表現(xiàn)最好。
![]()
- 智能體審稿系統(tǒng)鏈接:https://paperreview.ai/
不過(guò),這個(gè)智能體仍處于實(shí)驗(yàn)階段。網(wǎng)友們對(duì)這類工具大多抱有積極的態(tài)度,希望能夠成為真正實(shí)用的研究工具。
有網(wǎng)友希望智能體審稿人能夠具備針對(duì)特定會(huì)議或期刊場(chǎng)景的評(píng)審,甚至給出預(yù)估的分?jǐn)?shù):
![]()
AI 智能體能夠給科研加速,給人才培養(yǎng)周期加速,是一個(gè)推動(dòng)學(xué)術(shù)進(jìn)步的引擎:
![]()
不過(guò),也有網(wǎng)友表示擔(dān)憂,研究者們?cè)诎l(fā)表成果之前先過(guò)一遍 AI 的評(píng)審,會(huì)不會(huì)導(dǎo)致學(xué)術(shù)多樣性的下降?
![]()
研究學(xué)者有了趁手的 AI 評(píng)審參考工具,審稿人也用 AI 生成審閱意見,學(xué)術(shù)成果的評(píng)審體系是否已經(jīng)到了產(chǎn)生變革的時(shí)間?
未來(lái),AI 作為輔助工具,將會(huì)以怎樣的方式推動(dòng)學(xué)術(shù)研究發(fā)展,我們?nèi)圆坏枚?/p>
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.