網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

你的論文有novelty嗎？復(fù)旦搞了個(gè)頂會(huì)論文查新系統(tǒng)

2026-01-19 12:03:11　來(lái)源: 機(jī)器之心Pro

北京舉報(bào)

分享至

ICLR 2026 的 Rebuttal 結(jié)束了。當(dāng) OpenReview 上的喧囂散去，我們發(fā)現(xiàn)，作者與審稿人之間漫長(zhǎng)的拉鋸戰(zhàn)，最終往往只剩下一個(gè)核心分歧：「這個(gè)想法，以前真的沒(méi)人做過(guò)嗎？」

Novelty（創(chuàng)新性）是學(xué)術(shù)評(píng)審中被高度關(guān)注的指標(biāo)之一，但其評(píng)估在實(shí)踐中仍高度依賴評(píng)審者的經(jīng)驗(yàn)判斷與檢索覆蓋。隨 arXiv 文獻(xiàn)數(shù)量的快速增長(zhǎng)，僅靠人工檢索與記憶來(lái)追溯相關(guān)研究工作，已難以滿足高效的評(píng)審需求。

針對(duì)這一挑戰(zhàn)，復(fù)旦大學(xué) NLP 研究團(tuán)隊(duì)與其此前孵化的學(xué)術(shù)搜索平臺(tái) WisPaper 展開(kāi)合作，共同研發(fā)了 OpenNovelty——一個(gè)基于大語(yǔ)言模型、強(qiáng)調(diào)證據(jù)與可驗(yàn)證性的自動(dòng)化新穎性分析系統(tǒng)。

論文標(biāo)題：OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment
論文鏈接：https://arxiv.org/abs/2601.01576
Github 鏈接：https://github.com/january-blue/OpenNovelty
HuggingFace：https://huggingface.co/papers/2601.01576

核心設(shè)計(jì)

OpenNovelty 的根本原則很簡(jiǎn)單：任何關(guān)于「該論文創(chuàng)新性不足」的判斷，都必須附帶可追溯的真實(shí)證據(jù)，這些證據(jù)必須來(lái)自于已發(fā)表的文獻(xiàn)，并且能精確定位到原文具體段落。若系統(tǒng)未能找到相關(guān)證據(jù)，則如實(shí)說(shuō)明「未發(fā)現(xiàn)支持該判斷的證據(jù)」。

與傳統(tǒng)查重僅關(guān)注文字表層重疊不同，OpenNovelty 試圖解決語(yǔ)義層面的重復(fù)。系統(tǒng)會(huì)對(duì)投稿進(jìn)行結(jié)構(gòu)化抽取，將作者表述轉(zhuǎn)寫為更便于檢索與對(duì)比的學(xué)術(shù)概念短句，自動(dòng)提取出論文的一個(gè)核心任務(wù)（Core Task）和若干具體貢獻(xiàn)（Contributions）。

此外，系統(tǒng)還采用了「查詢擴(kuò)展（Query Expansion）」機(jī)制，針對(duì)提取出的每條信息，生成多個(gè)語(yǔ)義等價(jià)的變體，在 WisPaper 的索引庫(kù)中進(jìn)行地毯式檢索，防止單一表述帶來(lái)的檢索遺漏。

四步分析流程：

從論文提交到生成

可驗(yàn)證的新穎性評(píng)估報(bào)告

第一步：核心信息提取

系統(tǒng)從論文的標(biāo)題、摘要和引言，精準(zhǔn)地提取出兩類信息：

核心任務(wù)：論文擬解決的核心學(xué)術(shù)問(wèn)題（例如：「基于多輪強(qiáng)化學(xué)習(xí)的 LLM 智能體長(zhǎng)周期決策訓(xùn)練」）；
貢獻(xiàn)聲明：作者明確宣稱的創(chuàng)新點(diǎn)，如新方法、框架、算法或理論形式化（例如：「一個(gè)支持多種強(qiáng)化學(xué)習(xí)算法的統(tǒng)一訓(xùn)練框架」）。

第二步：相關(guān)文獻(xiàn)檢索與篩選

基于提取的信息，系統(tǒng)自動(dòng)生成一組學(xué)術(shù)搜索語(yǔ)句（包括同義詞及變體表達(dá)，避免因措辭差異而遺漏相關(guān)文獻(xiàn)），然后利用 WisPaper 學(xué)術(shù)引擎展開(kāi)地毯式搜索。

初步檢索可能召回?cái)?shù)百至上千篇潛在相關(guān)論文，隨后通過(guò)去重、時(shí)間過(guò)濾與篩除弱相關(guān)性文獻(xiàn)等步驟，最終形成約 60–80 篇用于后續(xù)分析的候選論文集合。

第三步：層次化分析與證據(jù)比對(duì)

這是系統(tǒng)的核心分析環(huán)節(jié)。系統(tǒng)會(huì)基于核心任務(wù)召回的候選論文構(gòu)建層次化 taxonomy（樹(shù)狀分類體系），以呈現(xiàn)目標(biāo)論文在相關(guān)研究脈絡(luò)中的位置。提供目標(biāo)論文在候選研究脈絡(luò)中的相對(duì)定位，供評(píng)審者快速瀏覽。

針對(duì)每條貢獻(xiàn)聲明，系統(tǒng)會(huì)在貢獻(xiàn)召回的候選論文集合中進(jìn)行逐篇對(duì)比，并嘗試給出可核驗(yàn)的對(duì)應(yīng)證據(jù)片段。比對(duì)的結(jié)果有如下三種：

能反駁（can_refute）：找到已發(fā)表的論文具有相似貢獻(xiàn)，必須附帶雙方論文的原文摘錄作為證據(jù)。

無(wú)法反駁（cannot_refute）：在當(dāng)前檢索范圍內(nèi)，未發(fā)現(xiàn)可質(zhì)疑該創(chuàng)新貢獻(xiàn)的文獻(xiàn)。
存疑（unclear）：信息不足，無(wú)法判斷。

關(guān)鍵在于：如果系統(tǒng)做出「能反駁」的判斷，但其提供的證據(jù)（即摘錄段落）無(wú)法在原論文中找到或匹配度過(guò)低，該判斷會(huì)自動(dòng)降級(jí)為「無(wú)法反駁」。

第四步：「新穎性調(diào)查報(bào)告」生成

系統(tǒng)整合前三階段結(jié)果，生成包含以下模塊的評(píng)估報(bào)告：

論文的核心任務(wù)
研究領(lǐng)域的分類體系
每條創(chuàng)新聲明的比對(duì)結(jié)果和證據(jù)
綜合的「新穎性評(píng)估」敘述

對(duì)于系統(tǒng)給出的關(guān)鍵判斷，報(bào)告會(huì)盡量提供可追溯的候選文獻(xiàn)與可核驗(yàn)的原文證據(jù)位置，便于評(píng)審者快速定位與人工復(fù)查。

系統(tǒng)部署與公開(kāi)驗(yàn)證

截止到 1 月 16 日，團(tuán)隊(duì)已經(jīng)在系統(tǒng)上分析了 1360 篇投稿，并且把所有生成的新穎性報(bào)告公開(kāi)發(fā)布在其官方網(wǎng)站。任何人都可以查閱系統(tǒng)對(duì)某篇投稿的分析結(jié)果、檢索到的相關(guān)文獻(xiàn)以及判斷依據(jù)。

團(tuán)隊(duì)計(jì)劃進(jìn)一步將分析規(guī)模擴(kuò)展至 2000+ 篇投稿，此外，還將持續(xù)優(yōu)化系統(tǒng)，計(jì)劃將其應(yīng)用于其他 AI 頂級(jí)會(huì)議，并對(duì)所收集的報(bào)告和評(píng)審證據(jù)進(jìn)行深入分析。

OpenNovelty 的影響

對(duì)審稿人而言：它是一個(gè)輔助工具而非替代。系統(tǒng)可以幫助評(píng)審者梳理文獻(xiàn)脈絡(luò)，快速掌握一篇論文在領(lǐng)域中的位置，從而將更多精力集中于更需要人類專業(yè)判斷的關(guān)鍵環(huán)節(jié)，如研究意義、方法嚴(yán)謹(jǐn)性等問(wèn)題。

對(duì)論文作者而言：它可作為投稿前的自查工具。如果研究具備實(shí)質(zhì)創(chuàng)新性，系統(tǒng)可以提供相關(guān)證據(jù)；如果漏引了重要文獻(xiàn)，系統(tǒng)亦能指出問(wèn)題。

對(duì)學(xué)術(shù)界而言：該系統(tǒng)提供了一種“可驗(yàn)證的新穎性評(píng)估”工程路徑——用檢索到的真實(shí)文獻(xiàn)與貢獻(xiàn)級(jí)證據(jù)對(duì)比來(lái)約束結(jié)論輸出，讓判斷能夠被追溯與復(fù)核，而不是停留在模型的無(wú)證據(jù)生成。推動(dòng) AI 成為負(fù)責(zé)人的知識(shí)引證者，而非不可靠的內(nèi)容生成器。

仍需人類判斷

團(tuán)隊(duì)在論文里也明確指出了系統(tǒng)的局限性：

難以理解復(fù)雜的數(shù)學(xué)公式和圖表——如果一篇論文的核心創(chuàng)新藏在一個(gè)復(fù)雜的方程式里，系統(tǒng)可能會(huì)錯(cuò)過(guò)；
只能搜到被索引過(guò)的論文，可能錯(cuò)過(guò)未被收錄的小眾期刊或非英語(yǔ)出版物；
「無(wú)法反駁」僅表示在「檢索范圍內(nèi)未找到」，并不等于「確實(shí)不存在」。

因此，團(tuán)隊(duì)一再?gòu)?qiáng)調(diào)：這是輔助工具，而非決策主體。最終的學(xué)術(shù)判斷，仍然要由人類審稿人完成。

結(jié)語(yǔ)

OpenNovelty 的出現(xiàn)帶有某種實(shí)驗(yàn)性的克制。它并非試圖取代現(xiàn)有的同行評(píng)審體系，而是作為一套第三方審計(jì)系統(tǒng)介入。在 Rebuttal 結(jié)束后的最終決策階段，它負(fù)責(zé)清洗迷霧，向 AC 展示那些被淹沒(méi)的證據(jù)，而將最終的價(jià)值判斷權(quán)留給人類。

目前，ICLR 2026 的部分論文查新報(bào)告已在 OpenNovelty 官網(wǎng)開(kāi)放查閱。對(duì)于即將在明年繼續(xù)沖擊頂會(huì)的科研人員來(lái)說(shuō)，這或許是一個(gè)審視自己工作的新鮮視角。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.