![]()
新智元報道
編輯:傾傾
【新智元導讀】ICML祭出一套瘋狂的評審機制,竟成了學術界的救命稻草。連AI教父Bengio都站臺支持:在信息過載的時代,我們必須學會利用「偏見」來降噪。
2025年,NeurIPS的投稿洪峰沖破3萬大關——這比一年前直接翻了近乎一倍。
這3萬篇論文構成的認知過載,足以讓現存的任何人類評審系統當場宕機。
學術界的「同行評審」系統,名存實亡。
![]()
面對這場審稿危機,ICML 2026終于坐不住了。他們推出了一項極具顛覆性、甚至帶有博弈論色彩的新政——作者自評級。
![]()
我們審不動了。你們自己招吧:手里這幾張牌,哪張是湊數的廢紙,哪張是真正的王炸?
這聽起來像是「讓嫌疑人給自己判案」。如此瘋狂的政策為什么能落地?因為它背后站著一位真正的神——Yoshua Bengio。
機制突變:從「貓鼠游戲」到「帶槍投案」
ICML2026的這波操作,表面上是在向作者索要權力,實際上是給了一塊「免死金牌」。
在過去,同行評審是一場「貓鼠游戲」。
作者是「嫌疑人」,竭盡全力把垃圾包裝成金子;評審員是「偵探」,拿著顯微鏡找破綻。大家互不信任,且互相傷害。
但現在,ICML攤牌了:「偵探不夠用了,請嫌疑人協助破案。」
你可能會問:
讓作者自評?那還不全員滿分?誰會承認自己寫的是垃圾?
這正是博弈論最精彩的殺招:保序回歸。系統不看你打的分數,它只看你的出牌順序。
你不需要告訴系統這篇論文是9分還是3分,你只需要告訴系統:在我投的這3篇里,A>B>C
以前,你可以把3篇平庸的5分論文全吹成9分神作,賭評審員眼瞎放水。
現在,如果你為了撈3分的爛文,硬把它排在9分神作之前,結果爛文沒救成,神作的分數還被強行拉低。
為什么ICML敢這么做?因為他們手里有數據。
ICML 2023的秘密實驗結果顯示,作者對自己論文的排序,更能精準預測論文未來的生死。
![]()
ICML2023實驗數據分析:在不同投稿數量下,藍色柱狀圖(自評級校準分)的誤差顯著低于紅色柱狀圖(評審員原始分)
![]()
數據顯示,作者自評排在第一位的論文,其16個月后的引用量,是末位論文的200%。
很多時候,評審員因為看不懂,把真正的神作殺掉了;而作者心里門兒清——「這篇是灌水的,那篇才是改變世界的」。
這不只是一次規則調整,這是對「同行評審神圣性」的祛魅。
官方終于承認:在這個信息過載的時代,與其相信一個只讀了你論文20分鐘的陌生人,不如利用作者想「贏」的野心,引導他說出真話。
圖靈獎得主「叛變」:客觀已死,偏見萬歲
這張牌之所以能打出來,是因為桌子對面坐著一位真正的「神」——Yoshua Bengio
![]()
在JASA的官方討論稿中,Bengio并沒有把這看作一次簡單的規則修補,他將其定義為:
機器學習與統計學的一次強力協同(PowerfulSynergy)。
![]()
不同博弈策略下的誤差縮減。通過「保序機制」,均方誤差的改善幅度最高達23.48%。
為什么連AI教父都「叛變」了?
在傳統的科學理想國里,我們迷信「客觀」。我們認為評審員是公正的法官,作者是狡猾的辯護人。
但在Bengio看來,這種潔癖在30000篇投稿的噪音面前,不僅幼稚,而且低效。
Bengio及其合作者DinghuaiZhang在評論中指出了一個極其深刻的哲學轉變:
承認「噪音」統治:當評審系統因過載已退化為「隨機數生成器」,盲目追求絕對客觀,本質上是一種由于傲慢導致的低效。
擁抱「主觀」信號:既然作者是最了解論文的人,為什么要把這個「信噪比」最高的信息源屏蔽掉?
因此,所謂的「偏見」,只要經過統計學修正,就是最珍貴的「特征」。這不僅僅是分數的博弈,更是「慢科學」的回歸。
![]()
你以為Bengio只是支持一種打分算法嗎?不。
作為長期呼吁抵制「PublishorPerish(不發表就出局)」的領軍人物,Bengio看重的是這個機制背后的「自省」功能。
他甚至在評論中提出了更激進的「多維降維」構想:
未來的作者不應該只排「好壞」,而應該被要求在多個維度上自首:
這篇論文是新穎但粗糙的嗎?
還是嚴謹但老套的?
這是一種對學術浮躁風氣的技術性矯正。
當作者被迫對自己的三篇論文進行排序時,他必須在深夜里捫心自問:「難道我真的在灌水?」
這種「強制性內省」,或許才是Bengio眼中,比篩選論文更重要的價值。
算法折疊:豪門瘋狂套利,散戶只配「裸奔」
如果你看到這里覺得:「太好了,終于有人來整治亂打分的評審了!」
先別急著慶祝。請先看一眼你手中的籌碼。
這項看似完美的「博弈論神技」,其實隱藏著一個被默許的「貧富準入門檻」。
「自評級機制」生效的前提,是你必須至少投兩篇論文。
你得先有PaperA和PaperB,系統才能通過A>B的邏輯來校準分數。
如果你只投了一篇呢?對不起,系統救不了你。
你依然只能在那個充滿了AI垃圾評論、隨機打分的舊系統里裸奔。
這是一場針對「學術散戶」的精準降維打擊。
![]()
根據ICML2023的官方統計數據顯示,75.5%的作者,只投了一篇論文。
這意味著那25%的「大戶」,手里的多篇論文不再只是成果,而是變成了可以相互對沖、用來校準分數的「套利籌碼」。
他們可以通過精妙的排序,利用統計學算法為自己的神作穿上「防彈衣」,擋住瞎眼評審的子彈。
![]()
MSE縮減的置信區間。在99%的置信水平下,誤差縮減依然保持在極高區間,
而75%的「普通玩家」面對的,依然是「俄羅斯輪盤」。
如果遇到一個心情不好的評審員給了你3分,你沒有任何數學工具可以反抗。
![]()
籌碼越多,護甲越厚。觀察紅藍柱對比可見,作者投出的論文越多(橫軸),利用自評級機制縮減誤差(藍色柱狀圖下降幅度)的空間往往越穩定。
香港大學的WeichenWang和LSE的ChengchunShi認為,這種機制實際上是在獎勵「灌水」。
為了獲得「被校準」的資格,為了獲得那層算法保護殼,實驗室會被迫把一項成果拆成三項(SalamiSlicing),湊足「自評級」的入場券。
以前的強者靠質量通吃;以后的強者,恐將靠「堆量」和「排序策略」進行收割。
ICML2026的新政,或許確實解決了「評審準確度」的問題,但它解決的方式是——優先保護那些擁有更多資源的人。
這是一次赤裸裸的「算法折疊」。
ICML2026砸碎的不僅是評審規則,還有我們對「學術烏托邦」的最后一點幻想。
當人類評審員在30000篇論文的洪流中徹底窒息,機器和算法接管裁判權,已是歷史的必然。
這不再是一個比拼誰更「客觀」的時代,這是一個比拼誰更懂「博弈」。
ICML已經用算法告訴我們,在算力爆炸的今天,「誠實」不再是一種高尚的道德自律,而是一條被博弈論強制執行的、冷冰冰的「生存策略」。
醒醒吧,舊世界已經塌了。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.