深扒ICLR「泄露門」：AI學(xué)術(shù)歷史上最魔幻的61分鐘，或許沒有之一

2025-12-04 13:25:14　來源: 新智元

北京舉報

分享至

新智元報道

編輯：定慧

【新智元導(dǎo)讀】21%的審稿意見竟全是AI生成的！「AI寫，AI審」，ICLR裸奔事故從人肉搜索、金錢賄賂到全網(wǎng)吃瓜，這場鬧劇撕開了學(xué)術(shù)圈最后的遮羞布。深度復(fù)盤這瘋狂的61分鐘，見證AI頂會史上最荒誕的一夜。

2025年11月27日，感恩節(jié)。

但對于全球AI學(xué)術(shù)圈，特別是那些向頂級會議ICLR 2026提交了論文的數(shù)萬名研究者來說：

這一天，天塌了啊！

一場史無前例的、堪稱災(zāi)難級的「裸奔」正在上演，這不是比喻，就是字面意義上的「裸奔」！

只要把投稿ID填入特定的API鏈接，就能瞬間拉出這篇論文的所有作者、審稿人、AC的完整信息：

姓名、郵箱、機構(gòu)、個人履歷、甚至還沒來得及發(fā)出的「拒稿」理由。

這可能是，AI頂會時代最荒誕的一夜！

剛剛，ICLR 2026針對這次安全事件的最新聲明來了：有超過1萬篇論文評審信息被泄露！

這一事件不僅重創(chuàng)了本屆評審流程，也引發(fā)了社區(qū)對學(xué)術(shù)評審系統(tǒng)安全性的深切擔(dān)憂。

傳播數(shù)據(jù)的始作俑者已被識別并被ICLR和OpenReview永久封殺；任何試圖串通的投稿將被直接拒稿！

這還不是最魔幻的

OpenReview，因為一個低級到不可思議的API漏洞，直接把「雙盲評審」這塊學(xué)術(shù)界最后的遮羞布給扯了下來。

要知道，OpenReview承載著ICLR、NeurIPS、ICML等幾乎所有AI頂會論文評審！

但這還不是最魔幻的。

就在大家還在忙著「人肉」審稿人、忙著吃瓜、甚至忙著發(fā)郵件去「公關(guān)」的時候，一家名為Pangram Labs的AI檢測公司，利用這次泄露的數(shù)據(jù)，反手給學(xué)術(shù)圈來了一記更響亮的耳光：

在他們分析的ICLR 2026審稿意見中，有21%完全是由AI生成的。

超過一半的審稿意見，都有AI潤色或參與的痕跡。

甚至出現(xiàn)了「AI寫論文，AI審論文，由于AI幻覺互相吹捧」的賽博朋克閉環(huán)。

這不僅僅是一次技術(shù)事故，更是學(xué)術(shù)界最大的一場信任危機。

復(fù)盤這場鬧劇，看看那個被奉為神圣的「同行評審」制度，在2025年的今天，究竟已經(jīng)腐爛到了什么程度。

那個價值連城的「低級錯誤」

事情的起因，簡單得讓人發(fā)指。

先來聊聊OpenReview。

在AI學(xué)術(shù)圈，它的地位相當(dāng)于高。它的初衷是極好的：透明、公開。它希望讓評審過程不僅僅是一個黑箱，而是成為社區(qū)討論的一部分。

但誰也沒想到，這種「開放」，在11月27日這天，變成了「門戶大開」。

漏洞出在一個名為profiles/search的API接口上。

在正常的軟件工程邏輯里，這種涉及用戶身份信息的接口，應(yīng)該有最嚴格的權(quán)限驗證。

比如，我是作者張三，我登錄后，只能看到我自己的投稿信息。

我是審稿人李四，我只能看到我負責(zé)評審的那幾篇論文，而且在盲審階段，我絕對不能看到作者是誰。

但是，OpenReview的后端似乎忘了這一茬。

技術(shù)上講，這叫BOLA（BrokenObjectLevelAuthorization，對象級授權(quán)失效）。

這是OWASP API安全列表里排名第一的漏洞類型，也是最「低級」的錯誤之一。

攻擊者只需要構(gòu)造一個特定的URL請求，將group參數(shù)修改一下：

想看某篇論文的作者是誰？把參數(shù)改成Submission{paper_id}/Authors。

想看某篇論文的審稿人是誰？把參數(shù)改成Submission{paper_id}/Reviewer_{k}。

想看是誰在做領(lǐng)域主席（AC）？改成Submission{paper_id}/Area_Chair_{k}。

不需要黑客技術(shù)。

不需要復(fù)雜的滲透工具。

不需要拿到數(shù)據(jù)庫的管理員密碼。

就像是你去住酒店，發(fā)現(xiàn)只要把房卡上的房間號「101」用記號筆涂改成「102」，就能刷開隔壁的門一樣。

黃金61分鐘：從泄露到瘋傳

讓我們把時間撥回到那個瘋狂的早晨。

根據(jù)ICLR官方后續(xù)發(fā)布的報告，可以還原出這驚心動魄的61分鐘：

看起來很快對吧？從發(fā)現(xiàn)到修復(fù)，只用了一個小時。

但在互聯(lián)網(wǎng)時代，一個小時，足夠把整個ICLR 2026扒得連底褲都不剩。

就在這短短的60多分鐘里，有人（不管是出于惡意還是好奇，或者是為了炫技）寫了腳本，瘋狂爬取數(shù)據(jù)。

很快，一個包含了超過10,000篇ICLR投稿論文（占總投稿量的45%）的詳細數(shù)據(jù)集，開始在互聯(lián)網(wǎng)的隱秘角落、Telegram群組、甚至公開的社交媒體上瘋狂傳播。

這不僅僅是一個Excel表格。

這是一張巨大的、錯綜復(fù)雜的「關(guān)系網(wǎng)」。

誰是哪篇論文的作者？

誰給了這篇論文3分（滿分10分）？

誰在評論里陰陽怪氣？

誰又是那個「鐵面無私」的AC？

一切都藏不住了。

「ICLR=I Can Locate Reviewer」

學(xué)術(shù)圈的反應(yīng)是兩極分化的。

有人第一反應(yīng)是恐慌。

想象一下，你是一個剛?cè)肼毜哪贻p教職人員（AP），為了展現(xiàn)你的學(xué)術(shù)嚴謹性，你在審稿時給某位業(yè)內(nèi)大佬的論文寫了非常犀利的批評意見，甚至給了拒稿（Rejection）。

你當(dāng)時心里想的是：「反正雙盲，他不知道是我，我是為了科學(xué)的純潔性把關(guān)。」

結(jié)果現(xiàn)在，大佬知道了你是誰。

你明年的基金申請誰來審？

你以后還想在這個圈子里混嗎？

一位教授在Reddit上痛苦地反思：「許多我們只能在匿名保護下才能說出的誠實、批評性的意見，現(xiàn)在成了懸在頭頂?shù)倪_摩克利斯之劍。」

有人第二反應(yīng)是狂歡。

對于那些長期被「不負責(zé)任的審稿人」折磨的作者來說，這簡直是天降正義。

「終于知道是誰在胡說八道了！」

「原來那個說我缺乏創(chuàng)新的審稿人，自己連一篇頂會都沒發(fā)過！」

「這就是現(xiàn)世報！」

在小紅書、Twitter、Reddit上，一個新的梗迅速誕生了：

ICLR不再是International Conferenceon Learning Representations。

它現(xiàn)在的名字叫：I Can Locate Reviewer（我能定位審稿人）。

這句玩笑話背后，是學(xué)術(shù)圈對現(xiàn)有評審機制積壓已久的憤怒與無奈。

以下是網(wǎng)絡(luò)上大量的梗圖，充分說明了，憤怒和無奈是這次事件背后主情緒。

人肉、賄賂與恐嚇

如果事情只停留在「大家知道了彼此是誰」，那頂多也就是尷尬一陣子。

但人性是經(jīng)不起考驗的。

尤其是在涉及到頂會論文這種關(guān)乎畢業(yè)、找工作、拿綠卡、升職加薪的巨大利益面前。

泄露事件發(fā)生后的24小時內(nèi)，學(xué)術(shù)界的「黑暗森林」法則開始生效。

ICLR博客中披露的細節(jié)，讀起來讓人不寒而栗，有深感無奈。

「我可以給你錢，只要你改分」

ICLR官方的聲明里，他們發(fā)現(xiàn)隨著名單的泄露，大量的串通行為開始浮出水面。

怎么串通？手段極其直接，甚至粗暴。

直接聯(lián)系：作者不再裝了，直接給審稿人發(fā)郵件。「王教授/李博士，看到您是我的審稿人，能不能高抬貴手？」

利益交換：「如果你這次放我一馬，下次你的論文落在我手里，我也給你打滿分。」這是一種默契的「互保」。

金錢賄賂：ICLR的調(diào)查顯示，甚至有第三方（既不是作者也不是審稿人）介入。這些人像禿鷲一樣嗅到了腐肉的味道，充當(dāng)起「學(xué)術(shù)掮客」。他們聯(lián)系審稿人，直接提供賄賂，只為換取一個高分。

這已經(jīng)不是簡單的學(xué)術(shù)不端了。

這是腐敗。這是犯罪。

報復(fù)與威脅：學(xué)術(shù)圈的「開盒」

比賄賂更可怕的，是報復(fù)。

有作者利用泄露的數(shù)據(jù)發(fā)現(xiàn)，給自己的論文打低分的審稿人，竟然是競爭對手實驗室的成員。

而且，這位審稿人自己也投了一篇類似的論文。

為了讓自己的論文更容易中，這位審稿人故意給競爭對手打低分，壓低對方的評分。

這種「惡意差評」在匿名狀態(tài)下很難被證實，只能靠猜。

但現(xiàn)在，證據(jù)確鑿，IP、名字、機構(gòu)，全都在表里。

更極端的情況出現(xiàn)了。

ICLR官方發(fā)現(xiàn)，有一個惡意的評論者，利用自動化腳本，在600多篇論文的評論區(qū)里，公開點名審稿人的身份。

「Reviewer1是某某大學(xué)的某某。」、「Reviewer2是某某公司的某某。」

這種行為無異于網(wǎng)絡(luò)暴力。

一位審稿人可能因為給了一篇熱門論文差評，而被狂熱的粉絲或者利益相關(guān)者「開盒」，個人信息被掛在網(wǎng)上，遭受各種騷擾和恐嚇。

ICLR的「核按鈕」

面對這種失控的局面，ICLR組委會不得不按下了「核按鈕」。

為了止損，他們做出了一系列在學(xué)術(shù)界極其罕見的、甚至可以說是「壯士斷腕」的決定：

凍結(jié)討論：立即停止審稿人與作者之間的互動。因為現(xiàn)在的每一句話，都可能帶有場外的威脅或利誘。

全部重置：將所有論文重新分配給新的領(lǐng)域主席（AC）。這意味著之前的AC可能會因為身份暴露而無法公正裁決，必須換人。

分數(shù)回滾：將所有審稿意見和分數(shù)回滾到Bug爆發(fā)前的狀態(tài)。任何在泄露期間修改的分數(shù)（無論是被收買后改高的，還是惡意改低的）全部作廢。

極刑伺候：對于那些利用泄露數(shù)據(jù)進行聯(lián)系、串通或騷擾的人，ICLR祭出了最嚴厲的懲罰——直接拒稿，并對涉事人員進行多學(xué)年的封殺，禁止投稿和參會。

這一套組合拳下來，雖然暫時穩(wěn)住了局面，但也造成了巨大的混亂。

很多AC抱怨，新的分配讓他們需要在極短的時間內(nèi)重新閱讀幾十篇論文，工作量劇增。

而且，由于無法看到之前的討論，很多有價值的學(xué)術(shù)辯論也被迫中斷了。

但ICLR別無選擇。

如果不這么做，整個會議公信力將蕩然無存。

比泄密更可怕的真相

21%的「僵尸」評審

如果說身份泄露是「外憂」，那么Pangram Labs隨后的報告，則查出了ICLR的「內(nèi)患」。

Pangram Labs是一家做AI文本檢測的公司。

在ICLR數(shù)據(jù)泄露的混亂中，他們的CEO Max Spero做了一個大膽的決定：

既然數(shù)據(jù)都在外面飄著，不如我們拿來分析一下？

他們花了一晚上的時間，掃描了ICLR 2026的75,800條同行評審意見。

結(jié)果讓人頭皮發(fā)麻。這可能是AI歷史上最諷刺的一幕。

根據(jù)Pangram Labs發(fā)布的分析報告，他們發(fā)現(xiàn)了以下驚人的事實：

ICLR 2026數(shù)據(jù)泄露事件發(fā)生后，該公司CEOMaxSpero利用泄露的數(shù)據(jù)，在12小時內(nèi)掃描了所有的19,490篇投稿論文和75,800條同行評審意見，并得出了你提到的這些具體統(tǒng)計數(shù)據(jù)。

這份報告的核心發(fā)現(xiàn)如下：

21%的審稿意見為全AI生成
超過50%的審稿意見有AI痕跡
1%(199篇)的投稿論文為全AI生成（離譜）
9%的投稿論文含大量AI內(nèi)容

文章地址：https://www.pangram.com/blog/pangram-predicts-21-of-iclr-reviews-are-ai-generated?utm_source=chatgpt.com

這意味著，在ICLR這個代表著人類AI研究最高水平的殿堂里，有五分之一的裁判，根本就不是人。

這是一場AI審閱AI的荒誕劇。

作者用ChatGPT寫論文。

審稿人用ChatGPT寫評審意見。

最后由OpenReview的算法來分發(fā)。

人類在這個過程中，仿佛成了一個多余的「中間商」，只負責(zé)復(fù)制粘貼。

那些「一眼假」的審稿意見

怎么發(fā)現(xiàn)你的審稿人是AI的？

其實不用檢測工具，很多人類作者早就感覺不對勁了。

Pangram Labs的報告指出，這些AI生成的評審意見通常有以下幾個特征，大家可以對照一下自己收到的意見：

毫無意義的漂亮話：充滿了「本文結(jié)構(gòu)清晰」、「極具創(chuàng)新性」、「雖然但是」等萬金油式的夸贊，但就是說不出具體哪里好。這通常被稱為「Flattery」（阿諛奉承），是LLM的通病。

幻覺引用：AI會一本正經(jīng)地讓你去引用某篇論文，給出了作者、年份甚至頁碼。但你去Google Scholar一搜，查無此文。這純粹是AI在一本正經(jīng)地胡說八道。

車轱轆話：將摘要里的內(nèi)容換個說法重復(fù)一遍，沒有任何深度的洞察。

奇怪的詳細程度：比如對某個無關(guān)緊要的標點符號錯誤進行長篇大論的批評，卻對核心算法的邏輯漏洞視而不見。

離譜的建議：有時候AI會建議你去比較一些風(fēng)馬牛不相及的算法，僅僅是因為它在訓(xùn)練數(shù)據(jù)里見過這兩個詞同時出現(xiàn)。

一位來自哥本哈根大學(xué)的教授Desmond Elliott分享了他的經(jīng)歷：他的學(xué)生收到了一條評審意見，內(nèi)容完全離題，甚至充滿了事實性錯誤。

學(xué)生懷疑是AI寫的，結(jié)果一查，果然是全AI生成。

最諷刺的是，這條AI生成的評論，給了一個「Borderline」（模棱兩可）的分數(shù)。

這種分數(shù)最惡心人，因為它既不拒絕也不接受，卻極大地消耗了AC的注意力。

為什么審稿人要用AI？

難道這些審稿人沒有職業(yè)道德嗎？

不僅是道德問題，更是系統(tǒng)性崩潰的結(jié)果。

看一組數(shù)據(jù)：

ICLR2024收到了約7,000篇投稿。

ICLR2025收到了11,000篇。

而到了ICLR 2026，這個數(shù)字飆升到了19,490篇。

接近于指數(shù)級的增長！

但是，合格的審稿人（通常是博士高年級學(xué)生、博后、教授）的數(shù)量并沒有指數(shù)級增長。

如果你是一個博士生，你自己要寫論文，要做實驗，還要面臨畢業(yè)壓力。突然，導(dǎo)師扔給你5篇ICLR的論文讓你幫忙審（這在學(xué)術(shù)界是公開的秘密，雖然違規(guī)）。或者系統(tǒng)給你分配了8篇論文，要求你在兩周內(nèi)看完。

你會怎么辦？

在「Publish or Perish」（不發(fā)表就出局）的高壓下，審稿變成了一種沒有任何報酬、還要耗費大量精力的「苦差事」。

這時候，ChatGPT就像一個魔鬼的誘惑。

把PDF丟進去，輸入Prompt：「請幫我寫一段不少于500字的評審意見，語氣要專業(yè)，指出3個缺點。」

幾秒鐘，任務(wù)完成。

這就是為什么21%的數(shù)字如此真實。

它反映的不是個體的懶惰，而是整個同行評審系統(tǒng)在AI論文爆炸時代的產(chǎn)能過剩與算力不足。

我們生產(chǎn)論文的速度，已經(jīng)遠遠超過了我們閱讀和評估論文的速度。

這次泄密事件，不僅暴露了AI替考，還順藤摸瓜地證實了另一個一直存在的陰暗面：學(xué)術(shù)圈子文化與共謀網(wǎng)絡(luò)。

在ICLR這次事件中，人們發(fā)現(xiàn)了不少相互打高分的小圈子。

這在學(xué)術(shù)界被稱為「Reviewer Rings」（審稿人圈子）或「Citation Cartels」（引文卡特爾）。

簡單說，就是一群人結(jié)成同盟。

「我是審稿人A，你是審稿人B。只要看到咱們?nèi)ψ永锏恼撐模还軐懙迷趺礃樱宦山oHigh Confidence的高分。如果看到競爭對手的，一律找茬拒掉。」

甚至更為隱蔽的操作是：

「我給你過稿，但在意見里要求你引用我寫的這5篇論文。」

這直接導(dǎo)致了學(xué)術(shù)評價體系的崩壞。因為論文的引用量（Citation）和發(fā)表量是衡量學(xué)者水平的核心指標。

通過這種手段，一群平庸的研究者可以人為地制造出「學(xué)術(shù)明星」。

他們不需要做出一流的研究，他們只需要一流的「盟友」。

這并不是AI圈獨有的問題，也不是第一次爆發(fā)。學(xué)術(shù)界對于這種「抱團」行為的斗爭，從未停止過。

SIGARCH事件：在計算機體系結(jié)構(gòu)領(lǐng)域，曾爆發(fā)過著名的「引文卡特爾」丑聞。調(diào)查發(fā)現(xiàn)，某些大牛教授利用自己的影響力，要求所有審稿人必須引用他們的文章，否則就拒稿。這導(dǎo)致某些特定小圈子的引用數(shù)呈現(xiàn)非自然的爆炸式增長。ACM（美國計算機協(xié)會）后來對此進行了徹查，并處理了一批涉事人員。
CVPR抱團：計算機視覺頂會CVPR也曾爆出過「Collusion Rings」。一些研究者通過互相告知論文特征（因為是雙盲，不能直接寫名字，但可以說「我的論文里有一個圖是用藍色標注的，題目大概是...」），或者在投稿前就交換論文摘要，來確保在分配審稿人時能夠「精準匹配」到自己人。

CVPR甚至為此不得不改變了審稿人匹配機制，不再允許作者「競標」自己想審的論文，或者嚴格限制競標的權(quán)重。

但ICLR 2026的這次泄露，之所以影響巨大，是因為它提供了鐵證。

以前大家只能懷疑：「這篇論文寫得這么爛，為什么全是滿分？」

現(xiàn)在大家看到了：「哦，原來給滿分的這三個人，和作者都是同一個‘師門’出來的。」或者，「原來這幾個人都是同一個國家的某個小圈子。」

OpenReview的漏洞，無意間充當(dāng)了那個揭穿皇帝新衣的小孩。

它讓我們看到，在所謂「公平、公正、雙盲」的學(xué)術(shù)游戲規(guī)則下，潛藏著多少利益交換和人情世故。

這次泄露也不禁讓所有人都面對一個更加尖銳的問題：

評審論文，究竟審的是論文，還是人？

彩蛋

在今年8月的NeurIPS審稿期間，也發(fā)生過一件趣事。

一位審稿人在意見里竟然忘記刪除自己的Prompt（提示詞），直接留下了「Who is Adam?」（亞當(dāng)是誰？）這樣一句莫名其妙的話。

這顯然是他在問AI某個問題，結(jié)果不僅AI把答案生成了，他還把問題也復(fù)制進了評審意見里。

當(dāng)時大家只是當(dāng)笑話看。

現(xiàn)在，隨著ICLR數(shù)據(jù)的泄露，很多人開始去翻舊賬：

「那個問亞當(dāng)是誰的審稿人，到底是誰？」

「那個給我打1分的家伙，到底發(fā)過幾篇論文？」

這種獵奇、八卦又充滿憤怒和無奈的心態(tài)，正在讓學(xué)術(shù)圈變成一個充滿猜忌的角斗場。

參考資料：

https://www.reddit.com/r/MachineLearning/comments/1p85vs0/d_openreview_all_information_leaks/

https://news.slashdot.org/story/25/11/28/139247/major-ai-conference-flooded-with-peer-reviews-written-fully-by-ai

https://forum.cspaper.org/topic/191/iclr-i-can-locate-reviewer-how-an-api-bug-turned-blind-review-into-a-data-apocalypse

https://www.chosun.com/english/industry-en/2025/11/28/GF5ZVDQ7Z5DYDL2XOD4TFDCDMI/

秒追ASI

?點贊、轉(zhuǎn)發(fā)、在看一鍵三連?

點亮星標，鎖定新智元極速推送！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.