![]()
人工智能幫助解決以前無法解決的數(shù)學(xué)問題的案例越來越多。
據(jù)報道,OpenAI 的 GPT-5.2 解決了 Erd?s 問題 #728,這似乎是一個重要的里程碑,標志著人工智能首次在任何人類數(shù)學(xué)家之前自主解決了一個未解的數(shù)學(xué)猜想。
![]()
劍橋大學(xué)數(shù)學(xué)系學(xué)生 AcerFur 在 X 平臺上宣布了這項突破性進展,此前他曾與他人合作進行驗證。該問題旨在探究是否存在無窮多個整數(shù) a、b、n,滿足特定的整除性和涉及階乘的不等式條件。自提出以來,該問題一直未得到解決。具體而言,該問題是:“設(shè) C>0 且 ?>0 足夠小。是否存在無窮多個整數(shù) a、b、n,滿足 a≥?n 且 b≥?n,使得 a!b!∣n!(a+b?n)! 且 a+b>n+Clogn?”
根據(jù) AcerFur 的描述,GPT-5.2 生成了初始解決方案和證明,隨后 Harmonic 的 Aristotle 系統(tǒng)使用 Lean 中的形式化驗證對其進行了驗證。Lean 是一款證明輔助工具,可提供機器可驗證的正確性保證。Aristotle 最初解決了一個稍弱的變體,但能夠自主修復(fù)其證明,最終無需人工干預(yù)即可獲得完整的結(jié)果。
重要注意事項
AcerFur強調(diào)了這項成就的三個關(guān)鍵缺陷。首先,原始問題描述含糊不清,該模型求解的是一種數(shù)學(xué)界普遍認為最有可能產(chǎn)生非平凡解的解釋。其次,該解決方案似乎深受數(shù)學(xué)家Carl Pomerance先前工作的啟發(fā),這引發(fā)了人們對人工智能貢獻究竟有多新穎的質(zhì)疑。第三,目前尚不清楚有多少尚未發(fā)表的文獻探討了如何解決此類問題的特殊情況。
該解決方案源于 AcerFur 和 X 用戶 Liam06972452 的合作。Liam06972452 首先收到了 GPT-5.2 的響應(yīng)并請求驗證。AcerFur 解釋說,GPT-5.2 完成了繁重的數(shù)學(xué)運算,而 GPT-5.2 Pro 則隨后將證明結(jié)果格式化為完整的 LaTeX 論文格式,并在格式化過程中可能進行了驗證并填補了其中的空白。
人工智能數(shù)學(xué)領(lǐng)域的發(fā)展勢頭
這項成就緊隨Harmonic公司近期另一項成果之后。Harmonic是一家數(shù)學(xué)人工智能初創(chuàng)公司,由Robinhood首席執(zhí)行官Vlad Tenev創(chuàng)立。去年11月,Harmonic宣布其亞里士多德系統(tǒng)解決了埃爾德什問題124,該問題自1995年發(fā)表以來,已懸而未決近30年。
然而,數(shù)學(xué)界對這一說法反應(yīng)較為謹慎。維護埃爾德什問題網(wǎng)站的托馬斯·布魯姆承認這一成就令人印象深刻,但他指出,所解決的版本只是埃爾德什提出的兩個變體中較簡單的一個,而且事后看來,解決方案相對簡單直接,難度與人工智能已展現(xiàn)出強大實力的數(shù)學(xué)競賽題目相當(dāng)。
埃爾德什問題指的是保羅·埃爾德什提出的數(shù)學(xué)猜想。埃爾德什是20世紀最多產(chǎn)的數(shù)學(xué)家之一,一生發(fā)表了1500多篇論文。解決埃爾德什問題被認為是數(shù)學(xué)界的一項重大成就,埃爾德什本人也根據(jù)他對問題難度的評估,為解答者提供獎金。
形式化驗證的優(yōu)勢
這兩項成果都凸顯了形式化驗證在驗證人工智能生成的數(shù)學(xué)運算結(jié)果方面的重要性。Harmonic 的方法以 Lean 為核心,Lean 是一種形式化語言,它允許對每個解決方案進行驗證,直至其基本公理,從而無需人工數(shù)學(xué)家手動檢查輸出結(jié)果的準確性。
2025年初,Harmonic宣布其模型Aristotle在2025年國際數(shù)學(xué)奧林匹克競賽中取得了金牌級別的成績,在六道題目中給出了五道可驗證的正確答案。這使得Harmonic與谷歌DeepMind和OpenAI等科技巨頭并駕齊驅(qū),這兩家公司也分別憑借各自的模型取得了類似的成績。
啟示與問題
如果這些論斷得到更廣泛的數(shù)學(xué)界的驗證,它們可能標志著人工智能系統(tǒng)發(fā)展的一個轉(zhuǎn)折點,人工智能系統(tǒng)將不再僅僅滿足于掌握現(xiàn)有的問題集,而是開始貢獻原創(chuàng)性的數(shù)學(xué)發(fā)現(xiàn)。然而,關(guān)于這些解決方案的真正創(chuàng)新性、它們在多大程度上受到訓(xùn)練數(shù)據(jù)的影響,以及它們究竟代表了真正的數(shù)學(xué)洞察力還是復(fù)雜的模式匹配,仍然存在諸多疑問。
第 728 題最初表述的模糊性,以及 GPT-5.2 的解決方案大量借鑒了前人研究成果這一事實,凸顯了評估人工智能對數(shù)學(xué)貢獻的復(fù)雜性。盡管這些系統(tǒng)展現(xiàn)出了令人矚目的能力,但它們究竟是在進行全新的研究,還是僅僅以新的方式重組了現(xiàn)有知識,仍然是一個值得探討的問題。可以肯定的是,人工智能系統(tǒng)正在迅速接近,甚至可能已經(jīng)達到了對數(shù)學(xué)研究做出有意義貢獻的門檻。這是否標志著人工智能與人類在數(shù)學(xué)領(lǐng)域合作的新時代——或者更具變革性——還有待觀察。
閱讀最新前沿科技趨勢報告,請訪問歐米伽研究所的“未來知識庫”
https://wx.zsxq.com/group/454854145828
![]()
未來知識庫是“ 歐米伽 未來研究所”建立的在線知識庫平臺,收藏的資料范圍包括人工智能、腦科學(xué)、互聯(lián)網(wǎng)、超級智能,數(shù)智大腦、能源、軍事、經(jīng)濟、人類風(fēng)險等等領(lǐng)域的前沿進展與未來趨勢。目前擁有超過8000篇重要資料。每周更新不少于100篇世界范圍最新研究資料。 歡迎掃描二維碼或訪問https://wx.zsxq.com/group/454854145828進入。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.