網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

陶哲軒：AI解50題停滯，人類深度思考成新護(hù)城河

2026-03-26 05:39:01　來源: 別讓往昔的悲傷和對(duì)未來的恐懼

四川舉報(bào)

分享至

AI 正在讓“想法”變得廉價(jià)，甚至毫無(wú)價(jià)值。真正的瓶頸，從來都不是“靈光一現(xiàn)”。

數(shù)學(xué)家陶哲軒最近和 Dwarkesh Patel 的訪談中，討論了 AI 在科學(xué)發(fā)現(xiàn)中的作用。我們總在問 AI 何時(shí)能產(chǎn)生偉大的想法，但陶哲軒的觀察揭示了更深層的問題：當(dāng)想法的生產(chǎn)成本趨近于零時(shí)，我們?cè)撊绾螒?yīng)對(duì)？

陶哲軒認(rèn)為，AI 正在成為一個(gè)無(wú)與倫比的“廣度”工具，但人類“深度”核心價(jià)值，不僅沒有被取代，反而因?yàn)?AI 的存在而變得更加關(guān)鍵。

這不僅僅是關(guān)于數(shù)學(xué)，更是關(guān)于科研范式，甚至是知識(shí)工作本身的未來。

我們先從一個(gè)有趣的故事開始：開普勒如何發(fā)現(xiàn)行星運(yùn)動(dòng)定律。

通常聽到的版本是，開普勒是個(gè)天才，靈光一現(xiàn)，提出了三大定律。但真實(shí)的歷史要“丑陋”得多。開普勒最初的理論，是一個(gè)他自認(rèn)為完美無(wú)比的“神圣幾何”模型。他相信，當(dāng)時(shí)已知的六大行星軌道之間，可以完美地嵌套五個(gè)正多面體（柏拉圖立體）。

然后，悲劇發(fā)生了。他那個(gè)“完美”的理論，跟第谷的精確數(shù)據(jù)對(duì)不上，有大約10%的誤差。但開普勒沒有放棄。他在接下來近二十年的時(shí)間里，把自己泡在這些數(shù)據(jù)里，嘗試了無(wú)數(shù)種可能——包括各種占星術(shù)、世界和諧論等在我們今天看來純屬胡說八道的理論。在他的著作《世界的和諧》中，他甚至寫道，地球的音符是“mi-fa-mi”，象征著苦難與饑荒。

就在這堆看似“垃圾”的想法中，他偶然發(fā)現(xiàn)了一條經(jīng)驗(yàn)規(guī)律：行星公轉(zhuǎn)周期的平方與軌道半長(zhǎng)軸的立方成正比。這就是后來舉世聞名的開普勒第三定律。

訪談的主持人 Dwarkesh 提出了一個(gè)絕妙的比喻：開普勒就像一個(gè)“高溫”（high temperature）狀態(tài)下的大語(yǔ)言模型。

所謂“高溫”，在 LLM 的語(yǔ)境里，意味著更高的隨機(jī)性和創(chuàng)造性，模型會(huì)生成更多樣、更不尋常的輸出，但準(zhǔn)確性會(huì)下降。開普勒就是這樣，他瘋狂地生成各種假設(shè)，從正多面體到音樂和聲，其中絕大多數(shù)都是錯(cuò)的。但最終，只要有一個(gè)假設(shè)能夠通過第谷那“黃金數(shù)據(jù)集”的驗(yàn)證，它就能留存下來，成為推動(dòng)科學(xué)進(jìn)步的基石。

這個(gè)比喻說明：科學(xué)進(jìn)步的鏈條中有兩個(gè)關(guān)鍵環(huán)節(jié)——假設(shè)生成和假設(shè)驗(yàn)證。

在過去，我們總是推崇“尤里卡”式的頓悟時(shí)刻，認(rèn)為“想法”是科學(xué)中最寶貴、最稀缺的資源。但現(xiàn)在，情況變了。

陶哲軒指出，AI 已經(jīng)將“想法生成”的成本幾乎降到了零。就像互聯(lián)網(wǎng)將信息傳播的成本降到零一樣。

這是一個(gè)巨大的變革。對(duì)于任何一個(gè)科學(xué)問題，我們現(xiàn)在理論上可以讓 AI 在短時(shí)間內(nèi)生成成千上萬(wàn)個(gè)可能的假設(shè)或理論。這聽起來是科學(xué)的天堂，但它正在迅速變成科學(xué)的地獄。

瓶頸被轉(zhuǎn)移了。當(dāng)想法不再稀缺，如何驗(yàn)證、評(píng)估、篩選這些想法，就成了新的、也是更嚴(yán)峻的瓶頸。

許多學(xué)術(shù)期刊現(xiàn)在正被 AI 生成的投稿淹沒，審稿人已經(jīng)不堪重負(fù)。過去，我們有同行評(píng)審、學(xué)術(shù)會(huì)議等一系列機(jī)制，來過濾掉那些價(jià)值不高的“民科”理論，從而讓科學(xué)共同體能集中精力去檢驗(yàn)?zāi)切案咝盘?hào)”的想法。但現(xiàn)在，當(dāng)機(jī)器可以大規(guī)模生產(chǎn)看似合理、實(shí)則空洞的“AI slop”（AI垃圾）時(shí)，這套舊系統(tǒng)正在失靈。

后人慶祝開普勒時(shí)，但常常忽略，開普勒的成功離不開第谷。第谷花費(fèi)數(shù)十年時(shí)間，用肉眼觀測(cè)積累的數(shù)據(jù)，其精度比前人高出十倍。正是這“多出來的一位小數(shù)”，才讓開普勒能夠證偽自己那個(gè)漂亮的柏拉圖立體模型，并最終發(fā)現(xiàn)橢圓軌道。

沒有高質(zhì)量、高精度的驗(yàn)證閉環(huán)，再多的“想法”也只是噪音。

這些判斷充滿了我們甚至無(wú)法清晰表達(dá)的直覺、品味和啟發(fā)式判斷。這恰恰是目前我們不知道如何教給機(jī)器，更不用說塞進(jìn)一個(gè)強(qiáng)化學(xué)習(xí)循環(huán)里的東西。

所以，AI 帶來的不是一個(gè)更簡(jiǎn)單的世界，而是一個(gè)對(duì)人類判斷力要求更高的世界。

那么，AI 在數(shù)學(xué)研究中的實(shí)際表現(xiàn)如何？

陶哲軒提到，在過去幾個(gè)月里，AI 系統(tǒng)解決了大約50個(gè)國(guó)際數(shù)學(xué)奧林匹克（IMO）競(jìng)賽級(jí)別的問題。這聽起來非常驚人。但隨后，進(jìn)展就停滯了。陶哲軒的解釋是：AI 采摘了所有“低垂的果實(shí)”。

他打了個(gè)比方：想象數(shù)學(xué)研究是一片有無(wú)數(shù)懸崖峭壁的山脈，有的墻高一米，有的三米，有的幾十米。我們并不知道哪面墻矮。AI 就像一個(gè)彈跳力驚人的“跳躍機(jī)器人”，它可以跳得比任何人都高，比如兩米。于是，我們把它放到這片山脈里，讓它到處亂跳。很快，所有兩米以下的墻壁都被它征服了。這是一個(gè)激動(dòng)人心的時(shí)期。但之后呢？它就停下了，因?yàn)槭Ｏ碌膲Ρ诙几哂谒奶S極限。

這揭示了 AI 目前在科研中的模式：它擅長(zhǎng)廣度，而人類擅長(zhǎng)深度。

AI 的“廣度”體現(xiàn)在，它可以將所有已知的技術(shù)、方法、定理，系統(tǒng)性地應(yīng)用到成千上萬(wàn)個(gè)不同的問題上。只要一個(gè)問題的解決方案，是現(xiàn)有知識(shí)庫(kù)中幾種工具的巧妙組合，AI 就有很大概率找到它。這是一種規(guī)模化的、暴力的搜索。那50個(gè)被解決的數(shù)學(xué)問題，大多屬于此類。它們之前沒人解決，不是因?yàn)樗鼈冃枰碌睦碚摚赡軆H僅是因?yàn)闆]有足夠多的人類專家去關(guān)注它們，去嘗試所有可能的組合。

人類專家的“深度”則完全不同。當(dāng)一個(gè)問題無(wú)法用現(xiàn)有工具解決時(shí)，人類需要做的不是嘗試更多的組合，而是發(fā)明一個(gè)全新的工具。這個(gè)過程不是跳躍，而是“攀爬”。你可能需要先找到一個(gè)中間立足點(diǎn)，建立一個(gè)引理，即便這個(gè)引理本身并不能解決最終問題，但它為你下一步的攀登提供了基礎(chǔ)。

陶哲軒觀察到，AI 在這方面表現(xiàn)極差。它們要么直接成功，要么徹底失敗，幾乎無(wú)法產(chǎn)生有意義的“部分進(jìn)展”。AI 無(wú)法理解“我雖然沒解決這個(gè)問題，但我找到了一個(gè)很有意思的中間步驟，這個(gè)步驟本身可能比原問題更有價(jià)值”。這種對(duì)“部分進(jìn)展”的評(píng)估和積累，正是建立深刻理解和新理論的核心。

這直接反映在陶哲軒自己的工作流上。他說 AI 極大地改變了他的工作方式，但不是我們想象的那樣。

一個(gè)常見的擔(dān)憂是，如果未來 AI 解決了黎曼猜想，但給出了一個(gè)長(zhǎng)達(dá)數(shù)百萬(wàn)行的、人類無(wú)法理解的形式化證明（比如用 Lean 語(yǔ)言寫的代碼），那這算科學(xué)進(jìn)步嗎？我們能從中獲得任何“理解”嗎？

陶哲軒對(duì)此非常樂觀。他認(rèn)為，我們不必?fù)?dān)心“無(wú)法理解的證明”。

一個(gè)形式化的證明，就像一個(gè)可以被精確解剖的數(shù)字構(gòu)件。我們可以原子化地研究其中的每一步。人類數(shù)學(xué)家（或者其他 AI 工具）可以對(duì)這個(gè)龐大的證明進(jìn)行“代碼重構(gòu)”，做“消融實(shí)驗(yàn)”，移除某些部分看看證明是否依然成立，從而找出哪些是關(guān)鍵步驟。

AI 負(fù)責(zé)找到“存在性”的證明，而人類（或人機(jī)協(xié)作）負(fù)責(zé)從中提煉出“理解”和“智慧”。

獲取證明的這個(gè)過程，本身就是一種數(shù)據(jù)分析。我們從一個(gè)“解決方案”的巨大數(shù)據(jù)集中，去挖掘其背后的深刻結(jié)構(gòu)。

這引出了他另一個(gè)更具前瞻性的思考：我們現(xiàn)在有了像 Lean 這樣描述“數(shù)學(xué)證明”的形式化語(yǔ)言，這使得 AI 可以被訓(xùn)練來生成和驗(yàn)證證明。但我們還缺少一種描述“數(shù)學(xué)策略”的半形式化語(yǔ)言。

也就是說，我們不僅需要一種語(yǔ)言來描述“A 推導(dǎo)出 B”這個(gè)邏輯事實(shí)，更需要一種語(yǔ)言來描述“‘先證明 C，再用 C 去證明 B’是一個(gè)很有前途的策略”這種啟發(fā)式思考。這關(guān)乎合理性的評(píng)估，關(guān)乎科學(xué)家之間交流的那些微妙的直覺、敘事和信念。高斯當(dāng)年僅僅通過計(jì)算大量素?cái)?shù)，就“猜”出了素?cái)?shù)定理的雛形。這種基于數(shù)據(jù)、直覺和統(tǒng)計(jì)規(guī)律的猜想能力，正是目前 AI 難以企及的。

如果能將這種“策略層”的思考也進(jìn)行某種程度的形式化，那將是 AI 輔助科學(xué)發(fā)現(xiàn)的又一次巨大飛躍。

陶哲軒沒有給出任何關(guān)于 AGI 何時(shí)到來的預(yù)測(cè)，但他清晰地描繪了在可預(yù)見的未來，AI 將如何重塑科學(xué)研究的圖景。

我的理解是，我們正處在一個(gè)價(jià)值重估的時(shí)代。

第一，“想法”的價(jià)值正在被稀釋。純粹的、未經(jīng)檢驗(yàn)的想法生成，會(huì)變得越來越廉價(jià)。評(píng)價(jià)一個(gè)人的能力，將不再是看他能提出多少點(diǎn)子，而是看他驗(yàn)證和實(shí)現(xiàn)想法的能力。

第二，“廣度”和“深度”的價(jià)值將出現(xiàn)分化。依賴廣博知識(shí)、信息檢索和組合創(chuàng)新的工作，其價(jià)值會(huì)被 AI 大大拉低。而那些需要建立深刻的、第一性的理解，需要發(fā)明全新概念和工具的“深度”工作，其價(jià)值將空前凸顯。

最后，陶哲軒給年輕數(shù)學(xué)家的建議同樣適用于我們所有人：擁抱變化，保持適應(yīng)性。過去幾百年行之有效的方法論和職業(yè)路徑，未來可能不再適用。需要有一種更靈活的心態(tài)，愿意去探索那些非線性的、甚至尚未存在的機(jī)會(huì)。

AI 不是來取代頂尖科學(xué)家的，它是來“外包”掉科學(xué)家工作中那些重復(fù)的、可被規(guī)模化的部分，從而迫使我們將精力聚焦于那些真正無(wú)法被替代的核心智力活動(dòng)上。

從這個(gè)角度看，這確實(shí)是一個(gè)激動(dòng)人心，但也充滿挑戰(zhàn)的時(shí)代。我們都需要重新思考，自己的價(jià)值究竟在哪里。

聲明：個(gè)人原創(chuàng)，僅供參考

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.