網易首頁 > 網易號 > 正文申請入駐

GPT-5.4在2011年預印本研究幫助下解決此前無解數學難題

2026-03-10 18:06:07　來源: 至頂頭條

北京舉報

分享至

GPT在數學問題解決能力方面持續提升，越來越能夠攻克最棘手的難題。

今年1月，AI測試公司Epoch AI發現，AI模型的前一個版本GPT-5.2 Pro已經解決了31%的數學挑戰，相比之前19%的最佳成績有了顯著提升。

最新版本延續了這一進步趨勢，成功應對了學者們設置的一系列數學問題。

根據Epoch AI博客文章，GPT-5.4更進一步：該博客提到，"GPT-5.4 Pro解決了一個此前沒有任何模型能夠解決的4級難題。在初步分析中，它似乎找到了一篇2011年的預印本，這讓它繞過了大部分預期的工作量。問題作者并不知道這篇預印本的存在。"這里提到的預印本是指尚未經過同行評議的學術論文。

雖然"解決"了這個問題，但這也說明了GPT-5.4（實際上所有AI模型都是如此）本質上是精密的搜索引擎，其有效性取決于對信息的獲取和快速整合能力。

GPT-5.4 Pro還提供了其他幾項創新功能。OpenAI聲稱這是第一個能夠在計算機上執行操作的版本，而不僅僅是說明如何操作。例如，GPT-5.4 Pro可以點擊鼠標——更準確地說，它可以向智能體發出"點擊鼠標"的命令。

該模型還具有改進的電子表格處理能力，能夠使用更少的Token來解決問題，并且會在處理復雜任務前制定計劃，讓用戶有機會調整結果并引導其朝正確方向發展。

Q&A

Q1：GPT-5.4 Pro在數學能力上有什么突破？

A：GPT-5.4 Pro解決了一個此前沒有任何AI模型能夠解決的4級數學難題。該模型找到了一篇2011年的預印本研究，利用其中的方法繞過了大部分預期的計算工作。相比之前版本31%的數學挑戰解決率，最新版本繼續保持進步趨勢。

Q2：GPT-5.4 Pro除了數學能力外還有哪些新功能？

A：GPT-5.4 Pro是首個能在計算機上直接執行操作的版本，比如可以向智能體發出"點擊鼠標"命令。它還具有改進的電子表格處理技能，能用更少Token解決問題，并會在處理復雜任務前先制定計劃供用戶調整。

Q3：GPT-5.4解決數學問題說明了什么？

A：這次解題過程說明GPT-5.4和所有AI模型本質上都是精密的搜索引擎，其有效性主要依賴于對信息的快速獲取和整合能力。雖然"解決"了問題，但實際上是通過找到相關研究資料來實現的。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

手機 / 數碼

房產 / 家居

GPT-5.4在2011年預印本研究幫助下解決此前無解數學難題

蔚來今年要少虧150億，沖擊年度盈利

"一對老夫妻雙雙129歲相戀100年"視頻引熱議 當地回應

"一對老夫妻雙雙129歲相戀100年"視頻引熱議 當地回應

加蘭沒那么差，但鱸魚會用嗎？

《逐玉》注水風波升級！315評論區淪陷

“龍蝦補貼”密集出爐 最高1000萬！

MG4有SUV衍生 上汽乘用車多款新車規劃曝光

態度原創

初中競賽題，化簡，說難的建議多學學

信號！千億巨頭入局，三亞開啟新一輪大征拆！

這組剪紙太美了！

剛說完戰爭很快結束 特朗普改口

"一對老夫妻雙雙129歲相戀100年"視頻引熱議當地回應

"一對老夫妻雙雙129歲相戀100年"視頻引熱議當地回應

“龍蝦補貼”密集出爐最高1000萬！

MG4有SUV衍生上汽乘用車多款新車規劃曝光

剛說完戰爭很快結束特朗普改口