![]()
GPT在數學問題解決能力方面持續提升,越來越能夠攻克最棘手的難題。
今年1月,AI測試公司Epoch AI發現,AI模型的前一個版本GPT-5.2 Pro已經解決了31%的數學挑戰,相比之前19%的最佳成績有了顯著提升。
最新版本延續了這一進步趨勢,成功應對了學者們設置的一系列數學問題。
根據Epoch AI博客文章,GPT-5.4更進一步:該博客提到,"GPT-5.4 Pro解決了一個此前沒有任何模型能夠解決的4級難題。在初步分析中,它似乎找到了一篇2011年的預印本,這讓它繞過了大部分預期的工作量。問題作者并不知道這篇預印本的存在。"這里提到的預印本是指尚未經過同行評議的學術論文。
雖然"解決"了這個問題,但這也說明了GPT-5.4(實際上所有AI模型都是如此)本質上是精密的搜索引擎,其有效性取決于對信息的獲取和快速整合能力。
GPT-5.4 Pro還提供了其他幾項創新功能。OpenAI聲稱這是第一個能夠在計算機上執行操作的版本,而不僅僅是說明如何操作。例如,GPT-5.4 Pro可以點擊鼠標——更準確地說,它可以向智能體發出"點擊鼠標"的命令。
該模型還具有改進的電子表格處理能力,能夠使用更少的Token來解決問題,并且會在處理復雜任務前制定計劃,讓用戶有機會調整結果并引導其朝正確方向發展。
Q&A
Q1:GPT-5.4 Pro在數學能力上有什么突破?
A:GPT-5.4 Pro解決了一個此前沒有任何AI模型能夠解決的4級數學難題。該模型找到了一篇2011年的預印本研究,利用其中的方法繞過了大部分預期的計算工作。相比之前版本31%的數學挑戰解決率,最新版本繼續保持進步趨勢。
Q2:GPT-5.4 Pro除了數學能力外還有哪些新功能?
A:GPT-5.4 Pro是首個能在計算機上直接執行操作的版本,比如可以向智能體發出"點擊鼠標"命令。它還具有改進的電子表格處理技能,能用更少Token解決問題,并會在處理復雜任務前先制定計劃供用戶調整。
Q3:GPT-5.4解決數學問題說明了什么?
A:這次解題過程說明GPT-5.4和所有AI模型本質上都是精密的搜索引擎,其有效性主要依賴于對信息的快速獲取和整合能力。雖然"解決"了問題,但實際上是通過找到相關研究資料來實現的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.