<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      ICML拒了497篇論文:AI審稿的灰色地帶

      0
      分享至

      506個審稿人偷偷用了大語言模型,結果他們審的論文全被 desk reject( desk 拒稿,即未經完整評審直接拒稿)。這是頂會 ICML 2026 剛公布的數(shù)字。

      但更有趣的是規(guī)則本身:ICML 今年搞了個"雙軌制"——有的審稿人可以用大語言模型(大模型),有的堅決不能。作者投稿時可以選擇自己愿意被哪種政策審。結果 497 篇論文的作者,恰好抽到了"堅決不能"的審稿人,而那個人違規(guī)用了 AI。

      這不像簡單的作弊抓包。更像一場關于"學術信任怎么重建"的大型實驗。

      雙軌制是怎么運行的

      ICML 2026 的程序主席團隊在公告里解釋了設計邏輯。

      政策 A:審稿人承諾完全不用大模型寫評審意見。
      政策 B:審稿人可以用,但要明確披露。

      「社區(qū)在這個問題上存在分歧」,公告里寫道。有人擔心作者沒同意就不該用 AI 審自己的論文;有人覺得大模型已經是工作流的一部分,強行禁止不現(xiàn)實。

      所以 ICML 讓雙方各選各的。審稿人先選自己愿意遵守哪條規(guī)則,作者再選愿意被哪條規(guī)則審。最終,只有明確選"A"或"AB 都行"的審稿人,才會被分配到政策 A 的論文。

      換句話說,那 506 個違規(guī)者,是自愿走進"無 AI 考場"的。

      檢測方法:不用通用探測器,全程人工復核

      795 篇評審被標記為疑似使用大模型,涉及 506 個獨立審稿人。ICML 強調,他們沒有用市面上那些"AI 文本檢測器"——這類工具誤報率高,在學術場景里尤其危險。

      具體方法沒有完全公開,但流程是:系統(tǒng)標記 → 人工逐條核實 → 確認違規(guī)才執(zhí)行懲罰。所有被標記的案例都經過了人工復核,避免冤枉。

      懲罰力度很直接:

      ? 如果某篇論文的"互審審稿人"(reciprocal reviewer,即該作者自己也要審的那批人里的對應者)違規(guī),這篇論文直接 desk reject——497 篇就是這么沒的
      ? 如果某個政策 A 審稿人超過一半的評審被確認用了大模型,ta 的所有評審被刪除,本人被踢出審稿人池

      51 個人觸發(fā)了第二條,占 506 個違規(guī)者的 10%。

      正方:規(guī)則必須硬,信任是學術的底層代碼

      支持嚴罰的觀點很直接:你選了政策 A,就是簽了合同。用沒用大模型不是質量問題,是契約問題。

      ICML 的公告特意澄清:「我們不是對評審質量或審稿人意圖做判斷」。哪怕你用大模型寫出了諾貝爾獎級別的評審,只要承諾了不用,用了就是違規(guī)。

      這個邏輯背后是學術評審的特殊性。雙盲評審能運轉,靠的是一套"所有人都在同一套約束下"的默契。如果審稿人偷偷用大模型潤色、擴寫、甚至生成核心觀點,作者卻以為自己在和"純人類"對話,這種信息不對稱會腐蝕整個系統(tǒng)的合法性。

      更現(xiàn)實的考量是:如果這次不罰,明年誰還選政策 A?雙軌制會崩潰成"所有人都被迫選 B"的單軌制,那部分作者的選擇權就被剝奪了。

      反方:2% 的拒稿率,代價是不是太高?

      質疑的聲音集中在"連帶責任"上。497 篇論文的作者做錯了什么?他們只是隨機分配到了一個違規(guī)審稿人。

      ICML 的解釋是"互審機制"——這些作者自己也是審稿人,他們的審稿對象恰好抽到了他們。但這種連帶在情感上很難接受:我投的稿被斃了,是因為我審的那個人作弊?

      另一個爭議點是檢測的邊界。ICML 說"用了大模型"就包括"在寫作的某個環(huán)節(jié)使用",哪怕只是潤色語法。這在政策 A 里是明確禁止的,但現(xiàn)實中很多研究者已經把大模型當成了高級版 Grammarly。一刀切地禁止,和一刀切地懲罰,是不是過于粗暴?

      還有技術層面的疑問:795 篇標記、506 人、平均每人 1.57 篇——這個分布意味著大量人是"偶爾使用"而非系統(tǒng)性作弊。10% 的人超過半數(shù)評審用 AI,剩下 90% 是"用了但不多"。對后者執(zhí)行 desk reject,比例原則是否成立?

      我的判斷:這不是終點,是壓力測試

      ICML 這次的操作,本質上是在用真實數(shù)據(jù)回答一個問題:學術共同體能不能在"允許 AI"和"禁止 AI"之間劃出清晰的邊界?

      2% 的 desk reject 率、1% 的評審標記率、10% 的違規(guī)者屬于"重度使用"——這些數(shù)字說明,完全禁止大模型在現(xiàn)階段是不現(xiàn)實的。哪怕在自愿選擇、明確告知、有懲罰威懾的情況下,仍有 506 個人沒忍住。

      但雙軌制本身是有價值的。它至少保護了"不想被 AI 審"的作者的選擇權,也給了社區(qū)一個觀察窗口:到底有多少人、在什么場景下、愿意遵守完全無 AI 的承諾?

      接下來值得關注的,是政策 B 的披露質量。如果"允許使用"變成了"懶得披露",那雙軌制就退化成單軌的遮羞布。以及,那 51 個被踢出審稿池的人,明年會不會換個身份回來?

      學術出版正在經歷一場緩慢的地震。ICML 這次的動作,是少數(shù)幾個愿意公開數(shù)據(jù)、承認矛盾、嘗試制度的頂會之一。它的不完美恰恰說明:這個問題沒有 clean 的答案,只有持續(xù)的協(xié)商。

      明年,當 NeurIPS、ICLR 跟進時,他們是會復制 ICML 的雙軌制,還是走向更嚴格的全面禁止,又或者徹底放開?這 497 篇論文的命運,會不會成為學術史上的一個腳注——關于人類如何與 AI 共處,我們曾經認真地劃過一次線?

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      巨虧850億!百年光學巨頭走下神壇?從巔峰到隕落只用了二十年

      巨虧850億!百年光學巨頭走下神壇?從巔峰到隕落只用了二十年

      涵豆說娛
      2026-03-20 19:54:18
      門口放三樣東西,再窮也能翻身!不是迷信,是老祖宗傳下的理兒

      門口放三樣東西,再窮也能翻身!不是迷信,是老祖宗傳下的理兒

      千秋文化
      2026-03-19 21:08:53
      “被摧毀”的伊朗防空體系如何擊中F-35?專家分析

      “被摧毀”的伊朗防空體系如何擊中F-35?專家分析

      新京報
      2026-03-21 11:41:21
      黃和院士再獲提拔重用,或將成江蘇省屬高校首位院士校長

      黃和院士再獲提拔重用,或將成江蘇省屬高校首位院士校長

      百家論大學
      2026-03-21 09:05:07
      美國防官員已為向伊朗部署地面部隊制定詳盡方案

      美國防官員已為向伊朗部署地面部隊制定詳盡方案

      大象新聞
      2026-03-21 06:57:04
      一圖看懂|為何美軍害怕伊朗布設水雷?

      一圖看懂|為何美軍害怕伊朗布設水雷?

      澎湃新聞
      2026-03-14 07:32:27
      中俄印徹底崩盤!普京緊急推動新三角,中方攤牌:不解決死穴免談

      中俄印徹底崩盤!普京緊急推動新三角,中方攤牌:不解決死穴免談

      一家說
      2026-03-20 13:12:03
      擊落3架美軍F-15E的科威特飛行員,因多項罪名已被逮捕

      擊落3架美軍F-15E的科威特飛行員,因多項罪名已被逮捕

      碳基生物關懷組織
      2026-03-17 22:35:07
      已明確!2026年養(yǎng)老金確定上漲,漲幅控制在3.2%——3.8%,看看有你嗎?

      已明確!2026年養(yǎng)老金確定上漲,漲幅控制在3.2%——3.8%,看看有你嗎?

      CG說科技
      2026-03-20 12:28:24
      根本打不完,搞半天原來伊朗前面發(fā)射的700枚導彈都是去庫存!

      根本打不完,搞半天原來伊朗前面發(fā)射的700枚導彈都是去庫存!

      阿龍聊軍事
      2026-03-18 06:10:58
      比白發(fā)更可怕的是“中國式大爺發(fā)型”,自以為時髦,實際油膩土氣

      比白發(fā)更可怕的是“中國式大爺發(fā)型”,自以為時髦,實際油膩土氣

      淡淡稻花香s
      2026-03-19 03:53:49
      賈國龍新品牌現(xiàn)場搟面燜面 工序透明可圍觀 店員稱菜品均為現(xiàn)做

      賈國龍新品牌現(xiàn)場搟面燜面 工序透明可圍觀 店員稱菜品均為現(xiàn)做

      快科技
      2026-03-20 19:13:50
      汪家反擊了!張?zhí)m律師曝攻擊汪家幕后黑手是許雅鈞 S媽一直在賣慘

      汪家反擊了!張?zhí)m律師曝攻擊汪家幕后黑手是許雅鈞 S媽一直在賣慘

      漫婷侃娛樂
      2026-03-21 08:47:34
      綿陽一母親帶1歲兒子看病 途中如廁時交人照看后兒子失蹤 36年后終團聚

      綿陽一母親帶1歲兒子看病 途中如廁時交人照看后兒子失蹤 36年后終團聚

      紅星新聞
      2026-03-20 15:21:56
      我的山與海大結局:方婉之收養(yǎng)妙妙,倩倩培養(yǎng)大虎成才,李娟意外

      我的山與海大結局:方婉之收養(yǎng)妙妙,倩倩培養(yǎng)大虎成才,李娟意外

      東方不敗然多多
      2026-03-21 10:25:21
      香港老字號被網紅轟炮,怒斥其“飲食界之恥”,網友:一物降一物

      香港老字號被網紅轟炮,怒斥其“飲食界之恥”,網友:一物降一物

      探源歷史
      2026-03-21 06:25:13
      放進去就是做了,不放進去就是沒做

      放進去就是做了,不放進去就是沒做

      桉予
      2026-03-20 13:54:20
      張康陽現(xiàn)狀證明,不怕富二代躺平就怕有野心,僅5年千億身價歸零

      張康陽現(xiàn)狀證明,不怕富二代躺平就怕有野心,僅5年千億身價歸零

      青杉依舊啊啊
      2026-03-19 22:10:26
      中國真正的“最高權力機構”竟然不是國務院?99%的人都搞錯了!

      中國真正的“最高權力機構”竟然不是國務院?99%的人都搞錯了!

      興史興談
      2026-03-19 20:14:58
      廣東被絕殺僅一夜,杜鋒獨自返粵參加活動!留助教帶隊備戰(zhàn)引熱議

      廣東被絕殺僅一夜,杜鋒獨自返粵參加活動!留助教帶隊備戰(zhàn)引熱議

      多特體育說
      2026-03-21 11:17:34
      2026-03-21 12:07:00
      字節(jié)漫游指南
      字節(jié)漫游指南
      有態(tài)度網友ytd
      181文章數(shù) 3關注度
      往期回顧 全部

      科技要聞

      宇樹招股書拆解,人形機器人出貨量第一!

      頭條要聞

      環(huán)球:對華關系上 高市欲表現(xiàn)"弱勢"形象博取美國同情

      頭條要聞

      環(huán)球:對華關系上 高市欲表現(xiàn)"弱勢"形象博取美國同情

      體育要聞

      誰在決定字母哥未來?

      娛樂要聞

      總臺首屆電影盛典,“沈馬”CP再合體

      財經要聞

      通脹警報拉響,加息潮要來了?

      汽車要聞

      小鵬汽車2025年Q4盈利凈賺3.8億 全年營收767億

      態(tài)度原創(chuàng)

      健康
      數(shù)碼
      親子
      旅游
      游戲

      轉頭就暈的耳石癥,能開車上班嗎?

      數(shù)碼要聞

      2025全球手持相機出貨量達1665萬臺 大疆份額62.4%

      親子要聞

      這孩子

      旅游要聞

      文商體旅福利加碼,泰州推出春假專屬套餐

      《殺戮尖塔2》大改平衡性引熱議 玩家集體破防

      無障礙瀏覽 進入關懷版