506個審稿人偷偷用了大語言模型,結果他們審的論文全被 desk reject( desk 拒稿,即未經完整評審直接拒稿)。這是頂會 ICML 2026 剛公布的數(shù)字。
但更有趣的是規(guī)則本身:ICML 今年搞了個"雙軌制"——有的審稿人可以用大語言模型(大模型),有的堅決不能。作者投稿時可以選擇自己愿意被哪種政策審。結果 497 篇論文的作者,恰好抽到了"堅決不能"的審稿人,而那個人違規(guī)用了 AI。
這不像簡單的作弊抓包。更像一場關于"學術信任怎么重建"的大型實驗。
雙軌制是怎么運行的
ICML 2026 的程序主席團隊在公告里解釋了設計邏輯。
政策 A:審稿人承諾完全不用大模型寫評審意見。
政策 B:審稿人可以用,但要明確披露。
「社區(qū)在這個問題上存在分歧」,公告里寫道。有人擔心作者沒同意就不該用 AI 審自己的論文;有人覺得大模型已經是工作流的一部分,強行禁止不現(xiàn)實。
所以 ICML 讓雙方各選各的。審稿人先選自己愿意遵守哪條規(guī)則,作者再選愿意被哪條規(guī)則審。最終,只有明確選"A"或"AB 都行"的審稿人,才會被分配到政策 A 的論文。
換句話說,那 506 個違規(guī)者,是自愿走進"無 AI 考場"的。
檢測方法:不用通用探測器,全程人工復核
795 篇評審被標記為疑似使用大模型,涉及 506 個獨立審稿人。ICML 強調,他們沒有用市面上那些"AI 文本檢測器"——這類工具誤報率高,在學術場景里尤其危險。
具體方法沒有完全公開,但流程是:系統(tǒng)標記 → 人工逐條核實 → 確認違規(guī)才執(zhí)行懲罰。所有被標記的案例都經過了人工復核,避免冤枉。
懲罰力度很直接:
? 如果某篇論文的"互審審稿人"(reciprocal reviewer,即該作者自己也要審的那批人里的對應者)違規(guī),這篇論文直接 desk reject——497 篇就是這么沒的
? 如果某個政策 A 審稿人超過一半的評審被確認用了大模型,ta 的所有評審被刪除,本人被踢出審稿人池
51 個人觸發(fā)了第二條,占 506 個違規(guī)者的 10%。
正方:規(guī)則必須硬,信任是學術的底層代碼
支持嚴罰的觀點很直接:你選了政策 A,就是簽了合同。用沒用大模型不是質量問題,是契約問題。
ICML 的公告特意澄清:「我們不是對評審質量或審稿人意圖做判斷」。哪怕你用大模型寫出了諾貝爾獎級別的評審,只要承諾了不用,用了就是違規(guī)。
這個邏輯背后是學術評審的特殊性。雙盲評審能運轉,靠的是一套"所有人都在同一套約束下"的默契。如果審稿人偷偷用大模型潤色、擴寫、甚至生成核心觀點,作者卻以為自己在和"純人類"對話,這種信息不對稱會腐蝕整個系統(tǒng)的合法性。
更現(xiàn)實的考量是:如果這次不罰,明年誰還選政策 A?雙軌制會崩潰成"所有人都被迫選 B"的單軌制,那部分作者的選擇權就被剝奪了。
反方:2% 的拒稿率,代價是不是太高?
質疑的聲音集中在"連帶責任"上。497 篇論文的作者做錯了什么?他們只是隨機分配到了一個違規(guī)審稿人。
ICML 的解釋是"互審機制"——這些作者自己也是審稿人,他們的審稿對象恰好抽到了他們。但這種連帶在情感上很難接受:我投的稿被斃了,是因為我審的那個人作弊?
另一個爭議點是檢測的邊界。ICML 說"用了大模型"就包括"在寫作的某個環(huán)節(jié)使用",哪怕只是潤色語法。這在政策 A 里是明確禁止的,但現(xiàn)實中很多研究者已經把大模型當成了高級版 Grammarly。一刀切地禁止,和一刀切地懲罰,是不是過于粗暴?
還有技術層面的疑問:795 篇標記、506 人、平均每人 1.57 篇——這個分布意味著大量人是"偶爾使用"而非系統(tǒng)性作弊。10% 的人超過半數(shù)評審用 AI,剩下 90% 是"用了但不多"。對后者執(zhí)行 desk reject,比例原則是否成立?
我的判斷:這不是終點,是壓力測試
ICML 這次的操作,本質上是在用真實數(shù)據(jù)回答一個問題:學術共同體能不能在"允許 AI"和"禁止 AI"之間劃出清晰的邊界?
2% 的 desk reject 率、1% 的評審標記率、10% 的違規(guī)者屬于"重度使用"——這些數(shù)字說明,完全禁止大模型在現(xiàn)階段是不現(xiàn)實的。哪怕在自愿選擇、明確告知、有懲罰威懾的情況下,仍有 506 個人沒忍住。
但雙軌制本身是有價值的。它至少保護了"不想被 AI 審"的作者的選擇權,也給了社區(qū)一個觀察窗口:到底有多少人、在什么場景下、愿意遵守完全無 AI 的承諾?
接下來值得關注的,是政策 B 的披露質量。如果"允許使用"變成了"懶得披露",那雙軌制就退化成單軌的遮羞布。以及,那 51 個被踢出審稿池的人,明年會不會換個身份回來?
學術出版正在經歷一場緩慢的地震。ICML 這次的動作,是少數(shù)幾個愿意公開數(shù)據(jù)、承認矛盾、嘗試制度的頂會之一。它的不完美恰恰說明:這個問題沒有 clean 的答案,只有持續(xù)的協(xié)商。
明年,當 NeurIPS、ICLR 跟進時,他們是會復制 ICML 的雙軌制,還是走向更嚴格的全面禁止,又或者徹底放開?這 497 篇論文的命運,會不會成為學術史上的一個腳注——關于人類如何與 AI 共處,我們曾經認真地劃過一次線?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.