AI 正在讓“想法”變得廉價(jià),甚至毫無(wú)價(jià)值。真正的瓶頸,從來都不是“靈光一現(xiàn)”。
數(shù)學(xué)家陶哲軒最近和 Dwarkesh Patel 的訪談中,討論了 AI 在科學(xué)發(fā)現(xiàn)中的作用。我們總在問 AI 何時(shí)能產(chǎn)生偉大的想法,但陶哲軒的觀察揭示了更深層的問題:當(dāng)想法的生產(chǎn)成本趨近于零時(shí),我們?cè)撊绾螒?yīng)對(duì)?
![]()
陶哲軒認(rèn)為,AI 正在成為一個(gè)無(wú)與倫比的“廣度”工具,但人類“深度”核心價(jià)值,不僅沒有被取代,反而因?yàn)?AI 的存在而變得更加關(guān)鍵。
這不僅僅是關(guān)于數(shù)學(xué),更是關(guān)于科研范式,甚至是知識(shí)工作本身的未來。
我們先從一個(gè)有趣的故事開始:開普勒如何發(fā)現(xiàn)行星運(yùn)動(dòng)定律。
通常聽到的版本是,開普勒是個(gè)天才,靈光一現(xiàn),提出了三大定律。但真實(shí)的歷史要“丑陋”得多。開普勒最初的理論,是一個(gè)他自認(rèn)為完美無(wú)比的“神圣幾何”模型。他相信,當(dāng)時(shí)已知的六大行星軌道之間,可以完美地嵌套五個(gè)正多面體(柏拉圖立體)。
![]()
然后,悲劇發(fā)生了。他那個(gè)“完美”的理論,跟第谷的精確數(shù)據(jù)對(duì)不上,有大約10%的誤差。但開普勒沒有放棄。他在接下來近二十年的時(shí)間里,把自己泡在這些數(shù)據(jù)里,嘗試了無(wú)數(shù)種可能——包括各種占星術(shù)、世界和諧論等在我們今天看來純屬胡說八道的理論。在他的著作《世界的和諧》中,他甚至寫道,地球的音符是“mi-fa-mi”,象征著苦難與饑荒。
就在這堆看似“垃圾”的想法中,他偶然發(fā)現(xiàn)了一條經(jīng)驗(yàn)規(guī)律:行星公轉(zhuǎn)周期的平方與軌道半長(zhǎng)軸的立方成正比。這就是后來舉世聞名的開普勒第三定律。
![]()
訪談的主持人 Dwarkesh 提出了一個(gè)絕妙的比喻:開普勒就像一個(gè)“高溫”(high temperature)狀態(tài)下的大語(yǔ)言模型。
所謂“高溫”,在 LLM 的語(yǔ)境里,意味著更高的隨機(jī)性和創(chuàng)造性,模型會(huì)生成更多樣、更不尋常的輸出,但準(zhǔn)確性會(huì)下降。開普勒就是這樣,他瘋狂地生成各種假設(shè),從正多面體到音樂和聲,其中絕大多數(shù)都是錯(cuò)的。但最終,只要有一個(gè)假設(shè)能夠通過第谷那“黃金數(shù)據(jù)集”的驗(yàn)證,它就能留存下來,成為推動(dòng)科學(xué)進(jìn)步的基石。
這個(gè)比喻說明:科學(xué)進(jìn)步的鏈條中有兩個(gè)關(guān)鍵環(huán)節(jié)——假設(shè)生成和假設(shè)驗(yàn)證。
在過去,我們總是推崇“尤里卡”式的頓悟時(shí)刻,認(rèn)為“想法”是科學(xué)中最寶貴、最稀缺的資源。但現(xiàn)在,情況變了。
陶哲軒指出,AI 已經(jīng)將“想法生成”的成本幾乎降到了零。就像互聯(lián)網(wǎng)將信息傳播的成本降到零一樣。
這是一個(gè)巨大的變革。對(duì)于任何一個(gè)科學(xué)問題,我們現(xiàn)在理論上可以讓 AI 在短時(shí)間內(nèi)生成成千上萬(wàn)個(gè)可能的假設(shè)或理論。這聽起來是科學(xué)的天堂,但它正在迅速變成科學(xué)的地獄。
瓶頸被轉(zhuǎn)移了。當(dāng)想法不再稀缺,如何驗(yàn)證、評(píng)估、篩選這些想法,就成了新的、也是更嚴(yán)峻的瓶頸。
許多學(xué)術(shù)期刊現(xiàn)在正被 AI 生成的投稿淹沒,審稿人已經(jīng)不堪重負(fù)。過去,我們有同行評(píng)審、學(xué)術(shù)會(huì)議等一系列機(jī)制,來過濾掉那些價(jià)值不高的“民科”理論,從而讓科學(xué)共同體能集中精力去檢驗(yàn)?zāi)切案咝盘?hào)”的想法。但現(xiàn)在,當(dāng)機(jī)器可以大規(guī)模生產(chǎn)看似合理、實(shí)則空洞的“AI slop”(AI垃圾)時(shí),這套舊系統(tǒng)正在失靈。
后人慶祝開普勒時(shí),但常常忽略,開普勒的成功離不開第谷。第谷花費(fèi)數(shù)十年時(shí)間,用肉眼觀測(cè)積累的數(shù)據(jù),其精度比前人高出十倍。正是這“多出來的一位小數(shù)”,才讓開普勒能夠證偽自己那個(gè)漂亮的柏拉圖立體模型,并最終發(fā)現(xiàn)橢圓軌道。
沒有高質(zhì)量、高精度的驗(yàn)證閉環(huán),再多的“想法”也只是噪音。
這些判斷充滿了我們甚至無(wú)法清晰表達(dá)的直覺、品味和啟發(fā)式判斷。這恰恰是目前我們不知道如何教給機(jī)器,更不用說塞進(jìn)一個(gè)強(qiáng)化學(xué)習(xí)循環(huán)里的東西。
所以,AI 帶來的不是一個(gè)更簡(jiǎn)單的世界,而是一個(gè)對(duì)人類判斷力要求更高的世界。
那么,AI 在數(shù)學(xué)研究中的實(shí)際表現(xiàn)如何?
陶哲軒提到,在過去幾個(gè)月里,AI 系統(tǒng)解決了大約50個(gè)國(guó)際數(shù)學(xué)奧林匹克(IMO)競(jìng)賽級(jí)別的問題。這聽起來非常驚人。但隨后,進(jìn)展就停滯了。陶哲軒的解釋是:AI 采摘了所有“低垂的果實(shí)”。
他打了個(gè)比方:想象數(shù)學(xué)研究是一片有無(wú)數(shù)懸崖峭壁的山脈,有的墻高一米,有的三米,有的幾十米。我們并不知道哪面墻矮。AI 就像一個(gè)彈跳力驚人的“跳躍機(jī)器人”,它可以跳得比任何人都高,比如兩米。于是,我們把它放到這片山脈里,讓它到處亂跳。很快,所有兩米以下的墻壁都被它征服了。這是一個(gè)激動(dòng)人心的時(shí)期。但之后呢?它就停下了,因?yàn)槭O碌膲Ρ诙几哂谒奶S極限。
這揭示了 AI 目前在科研中的模式:它擅長(zhǎng)廣度,而人類擅長(zhǎng)深度。
AI 的“廣度”體現(xiàn)在,它可以將所有已知的技術(shù)、方法、定理,系統(tǒng)性地應(yīng)用到成千上萬(wàn)個(gè)不同的問題上。只要一個(gè)問題的解決方案,是現(xiàn)有知識(shí)庫(kù)中幾種工具的巧妙組合,AI 就有很大概率找到它。這是一種規(guī)模化的、暴力的搜索。那50個(gè)被解決的數(shù)學(xué)問題,大多屬于此類。它們之前沒人解決,不是因?yàn)樗鼈冃枰碌睦碚摚赡軆H僅是因?yàn)闆]有足夠多的人類專家去關(guān)注它們,去嘗試所有可能的組合。
人類專家的“深度”則完全不同。當(dāng)一個(gè)問題無(wú)法用現(xiàn)有工具解決時(shí),人類需要做的不是嘗試更多的組合,而是發(fā)明一個(gè)全新的工具。這個(gè)過程不是跳躍,而是“攀爬”。你可能需要先找到一個(gè)中間立足點(diǎn),建立一個(gè)引理,即便這個(gè)引理本身并不能解決最終問題,但它為你下一步的攀登提供了基礎(chǔ)。
陶哲軒觀察到,AI 在這方面表現(xiàn)極差。它們要么直接成功,要么徹底失敗,幾乎無(wú)法產(chǎn)生有意義的“部分進(jìn)展”。AI 無(wú)法理解“我雖然沒解決這個(gè)問題,但我找到了一個(gè)很有意思的中間步驟,這個(gè)步驟本身可能比原問題更有價(jià)值”。這種對(duì)“部分進(jìn)展”的評(píng)估和積累,正是建立深刻理解和新理論的核心。
這直接反映在陶哲軒自己的工作流上。他說 AI 極大地改變了他的工作方式,但不是我們想象的那樣。
![]()
一個(gè)常見的擔(dān)憂是,如果未來 AI 解決了黎曼猜想,但給出了一個(gè)長(zhǎng)達(dá)數(shù)百萬(wàn)行的、人類無(wú)法理解的形式化證明(比如用 Lean 語(yǔ)言寫的代碼),那這算科學(xué)進(jìn)步嗎?我們能從中獲得任何“理解”嗎?
陶哲軒對(duì)此非常樂觀。他認(rèn)為,我們不必?fù)?dān)心“無(wú)法理解的證明”。
一個(gè)形式化的證明,就像一個(gè)可以被精確解剖的數(shù)字構(gòu)件。我們可以原子化地研究其中的每一步。人類數(shù)學(xué)家(或者其他 AI 工具)可以對(duì)這個(gè)龐大的證明進(jìn)行“代碼重構(gòu)”,做“消融實(shí)驗(yàn)”,移除某些部分看看證明是否依然成立,從而找出哪些是關(guān)鍵步驟。
AI 負(fù)責(zé)找到“存在性”的證明,而人類(或人機(jī)協(xié)作)負(fù)責(zé)從中提煉出“理解”和“智慧”。
獲取證明的這個(gè)過程,本身就是一種數(shù)據(jù)分析。我們從一個(gè)“解決方案”的巨大數(shù)據(jù)集中,去挖掘其背后的深刻結(jié)構(gòu)。
這引出了他另一個(gè)更具前瞻性的思考:我們現(xiàn)在有了像 Lean 這樣描述“數(shù)學(xué)證明”的形式化語(yǔ)言,這使得 AI 可以被訓(xùn)練來生成和驗(yàn)證證明。但我們還缺少一種描述“數(shù)學(xué)策略”的半形式化語(yǔ)言。
也就是說,我們不僅需要一種語(yǔ)言來描述“A 推導(dǎo)出 B”這個(gè)邏輯事實(shí),更需要一種語(yǔ)言來描述“‘先證明 C,再用 C 去證明 B’是一個(gè)很有前途的策略”這種啟發(fā)式思考。這關(guān)乎合理性的評(píng)估,關(guān)乎科學(xué)家之間交流的那些微妙的直覺、敘事和信念。高斯當(dāng)年僅僅通過計(jì)算大量素?cái)?shù),就“猜”出了素?cái)?shù)定理的雛形。這種基于數(shù)據(jù)、直覺和統(tǒng)計(jì)規(guī)律的猜想能力,正是目前 AI 難以企及的。
如果能將這種“策略層”的思考也進(jìn)行某種程度的形式化,那將是 AI 輔助科學(xué)發(fā)現(xiàn)的又一次巨大飛躍。
陶哲軒沒有給出任何關(guān)于 AGI 何時(shí)到來的預(yù)測(cè),但他清晰地描繪了在可預(yù)見的未來,AI 將如何重塑科學(xué)研究的圖景。
我的理解是,我們正處在一個(gè)價(jià)值重估的時(shí)代。
第一,“想法”的價(jià)值正在被稀釋。純粹的、未經(jīng)檢驗(yàn)的想法生成,會(huì)變得越來越廉價(jià)。評(píng)價(jià)一個(gè)人的能力,將不再是看他能提出多少點(diǎn)子,而是看他驗(yàn)證和實(shí)現(xiàn)想法的能力。
第二,“廣度”和“深度”的價(jià)值將出現(xiàn)分化。依賴廣博知識(shí)、信息檢索和組合創(chuàng)新的工作,其價(jià)值會(huì)被 AI 大大拉低。而那些需要建立深刻的、第一性的理解,需要發(fā)明全新概念和工具的“深度”工作,其價(jià)值將空前凸顯。
最后,陶哲軒給年輕數(shù)學(xué)家的建議同樣適用于我們所有人:擁抱變化,保持適應(yīng)性。過去幾百年行之有效的方法論和職業(yè)路徑,未來可能不再適用。需要有一種更靈活的心態(tài),愿意去探索那些非線性的、甚至尚未存在的機(jī)會(huì)。
AI 不是來取代頂尖科學(xué)家的,它是來“外包”掉科學(xué)家工作中那些重復(fù)的、可被規(guī)模化的部分,從而迫使我們將精力聚焦于那些真正無(wú)法被替代的核心智力活動(dòng)上。
從這個(gè)角度看,這確實(shí)是一個(gè)激動(dòng)人心,但也充滿挑戰(zhàn)的時(shí)代。我們都需要重新思考,自己的價(jià)值究竟在哪里。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.