![]()
新智元報道
編輯:Aeneas
【新智元導讀】就在剛剛,陶哲軒po文揭秘:當前的AI無法實現真正的AGI,不過,他們倒是擁有一些有用的小聰明,或者可以說「通用狡猾」。而就在同時,又一多年數學難題被GPT-5.2 Pro攻克了。
就在今天,即將離職Meta的LeCun再次給當前AI判死刑——這條路行不通,而且永遠不會成功。
前不久,谷歌DeepMind首席科學家Shane Legg給出預測:最小AGI有50%的可能性在2028年實現。
業界都在討論的AGI之爭,陶哲軒是如何看待的?
就在剛剛,陶哲軒po文明確了自己的態度——還不行。
![]()
他認為,目前還無法實現AGI。
我懷疑目前工具還無法實現真正意義上的「人工通用智能」。然而,我認為一種較弱但仍然非常有價值的「人工通用才智」,正在以各種方式成為現實。
而他的觀點,立馬在網上引起了廣泛討論。
![]()
網友們表示,陶哲軒這樣聰明的人,都認為AGI并未實現,這樣太令人絕望了——希望他是錯的吧。
陶哲軒:不是AGI,只是魔術師
什么叫通用才智?
陶哲軒是這樣解釋的。
「通用才智」是指通過某種臨時手段解決廣泛復雜問題的能力。
這些手段可能是隨機的,也可能是暴力計算的成果;它們可能缺乏根基或容易出錯;它們可能難以解釋,也可能能追溯到AI訓練數據中類似的技巧。
因此,它們不能被視為任何真正「智能」的結果。
然而,它們在實現日益廣泛的任務時,可以擁有非同尋常的成功率,尤其是在結合嚴格的驗證程序以過濾掉錯誤或不具前景的方法時,其規模已超出了單個人類所能達到的范圍。
可以理解為,這是一種「通用狡猾」AI。
![]()
而這種「通用狡猾」AI,就會讓人感覺非常匪夷所思。
比如在有時候,這些技術非常實用,令人印象深刻,然而從根本上說,它卻令人不滿和失望。
AI是「最強大腦」魔術師?
想象這樣一個場景:一位魔術師上臺,憑空變出鴿子、猜中你選的牌、把水杯變成金魚。全場掌聲雷動,觀眾目瞪口呆。
結果他平靜自曝:「其實我袖子藏了十八個機關,桌下有暗格,牌是特制的,金魚是提前藏好的。」掌聲戛然而止。
如今的AI,就像這位魔術師一樣。
![]()
它能寫詩、編程、解數學題——但如果你問它:「你是怎么想到這個答案的?」
它可能會誠實坦白:「我在訓練數據里見過類似題目,概率上這個回答匹配度最高。」
所以,這其實不是智能,而是基于海量數據的「聰明把戲」。
「通用狡猾AI」,反而起了大作用
對于這種「通用狡猾AI」,陶哲軒是怎么解釋的。
雖然聰明才智和智力在人類身上是某種程度上相關的特質,但對于AI工具(這些工具通常被優化以追求聰明才智)來說,它們卻更加解耦,將當前一代這樣的工具主要視為一個隨機生成有時聰明,且往往有用的思想和輸出的生成器,在嘗試使用它們解決難題時,可能是一種更具生產性的視角。
也就是說,智能≠聰明。
對人來說,二者是同時存在的;但對于AI而言,所謂的「聰明」,也就是快速解決復雜問題,可以獨立存在。
當前AI的「聰明」,是隨機的,暴力的,可錯的,難解釋的。
最終,它并不是靠智慧取勝,而是靠「大規模試錯與匹配」,就像用超級望遠鏡,在答案星海里撈最亮的幾顆。
當今的AI,并不是全知全能,然而這個「不夠智能但足夠聰明」的工具,卻已經悄悄改變知識工作的每一個環節。
對于陶哲軒的說法,網友們表示的確如此。
對于目前的AI來說,看似便利但難以預測的思想,似乎是一種主要應用場景。
![]()
可以說,陶哲軒所說的,就是目前AI能力「參差不齊的邊界」。
![]()
甚至評論區還出現了中文留言,認為目前的AI底層架構就決定了,即使投入無限多的算力,產出的東西也依然有邊際。
![]()
而在Reddit的帖子中,網友們也對此展開熱議。
有人對表示,自己非常尊重陶哲軒,但對他的部分觀點表示反駁。
![]()
有人說,他用「狡猾」或「巧妙」一詞,來針對現代LLM缺乏系統性思維的缺點。
目前,他或許是對的。不過,ChatGPT還只有3歲,如果要宣布所有LLM都有此局限,至少還應該再等待十年。
![]()
又一數學難題被AI破解
巧的是,就在陶哲軒發出這個論點不久,又有一道數學難題被AI破解了!
滑鐵盧大學計算機系的助理教授Kimon Fountoulakis激動發帖稱,GPT-5.2剛剛解決了COLT 2022開放問題——
使用標準加速梯度算法和互補性邊界假設,證明加速L1正則化PageRank的運行時間復雜度。
其中,所有證明都由GPT-5.2 Pro生成。算法總工作量的關鍵界限,則是使用 GPT-5.2 Pro、Aristotle和Antigravity上的Gemini 3 Pro (High) 組合完成了自動的形式化。
![]()
多倫多大學的教授Daniel Litt也出來表示,GPT-5.2 Pro的確很強,它對于自己的代數幾何和數論研究,都產生了巨大飛躍。
![]()
懸賞8年難題,GPT-5.2用數學證明封神
這道難題,已經困擾了教授8年。
![]()
自2024年以來,每次OpenAI或谷歌發布一個新模型,他都會拿過來嘗試一下。
令人沒想到的是,這一次,GPT-5.2竟然成功了!
![]()
教授這樣回憶道:這個開放性問題,我們嘗試了三年,失敗了;找博士生做,也失敗了;問了多位頂尖學者,都說太難了。
2022年,這道關于「加速L1正則化PageRank算法時間復雜度」的難題,被正式列為COLT國際頂級會議的開放問題之一,懸賞求解。
誰也沒想到,兩年后,這道難倒無數學者的題目,竟被GPT-5.2悄然攻克。
懸賞
故事要從2016年說起。當時,教授在優化PageRank算法時發現,經典迭代軟閾值算法在求解帶L1正則的PageRank問題時,其運行時間竟然只與最終解的非零節點數有關,出奇地高
一個很自然的追問隨之而來:如果用上加速算法,比如在優化領域聲名顯赫的FISTA,會不會更快?
理論上應該如此。但現實卻潑了一盆冷水:FISTA在迭代過程中會「激活」大量本應為零的節點,雖然最終能收斂到正確的稀疏解,但中間過程卻很鋪張浪費。
開始,教授嘗試了三個月,想從理論上界定FISTA的總計算量,失敗了。后來斷斷續續又試了幾次,直到2021年,無論是教授最杰出的學生,還是幾位大牛研究者,都對這個問題束手無策。
![]()
團隊決定,將這個難題公之于眾。
2022年,它被正式列為COLT的開放問題,向全球機器學習社區發起挑戰。
![]()
破局
第一個成功的解法,出現在2023年。David Martínez-Rubio等人提出了一種新穎的加速算法,從完全不同的角度給出解答。
然而,這個算法為了達到加速效果,需要在每一步求解一個昂貴的子問題,在實際應用中效率很低。
直到GPT-5.2發布后,真正的轉折點來了。
這一次,GPT-5.2給出了完整的證明。
![]()
而且令人震驚的是,它給出的恰恰是針對經典FISTA算法的證明。
它揭示了在一種被稱為「互補性邊界」的合理假設下,FISTA的總計算量可以被優雅地界定,并且在特定的圖結構上,能展現出明確優于經典算法的加速效果。
更關鍵的是,這個證明解釋了長期困擾學界的現象:盡管FISTA在迭代中會激活更多節點,但這些「多余激活」是可控的、暫時的。一旦迭代進入最優解的一個鄰域,算法就會迅速收斂。
![]()
怎么證明?三重驗證
GPT-5.2的證明能令人信服嗎?為此,團隊搭建了一個三重驗證體系。
首先,GPT-5.2 Pro生成了完整的證明初稿。
接著,團隊借助@HarmonicMath的Aristotle系統,結合Gemini 3 Pro模型,將證明中的關鍵不等式和復雜度上界,逐行轉化成了形式化的Lean代碼。
而且除了形式化驗證之外,教授自己也把證明從頭到尾證明了兩遍。目前看來,證明是沒問題的。
![]()
陶哲軒會被說服嗎
又一數學難題被GPT-5.2 Pro攻克,這不由得引起網友討論——
它會成為AGI嗎?陶哲軒會看到希望嗎?
至少,目前GPT-5.2再一次證明了LLM在深度數學推理上的驚人潛力。
而且,它也彌合了理論分析與實際算法之間的鴻溝。它的證明,為最經典的加速算法提供了缺失的理論基石。
當然,這并不意味著AI能取代理論科學家。
可以說,它更像是一個擁有驚人直覺和不知疲倦的協作者。
人類提出關鍵問題、界定框架、判斷價值,AI則能在龐大的數學空間里,幫我們找到那條通往答案的隱秘小徑。
參考資料:
https://mathstodon.xyz/@tao/115722360006034040
https://x.com/kfountou/status/2000957773584974298
秒追ASI
?點贊、轉發、在看一鍵三連?
點亮星標,鎖定新智元極速推送!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.