財聯(lián)社12月12日訊(編輯 史正丞)被谷歌逼到拉響“紅色警報”后,OpenAI周四終于端出了最新前沿模型GPT-5.2系列。
![]()
(來源:OpenAI官網(wǎng))
OpenAI介紹稱,GPT?5.2是迄今為止在“專業(yè)知識工作方面”表現(xiàn)最好的模型系列,在制作電子表格、制作演示文稿、圖像感知、編寫代碼以及理解長上下文等方面都優(yōu)于前代產(chǎn)品。
GPT?5.2有三種不同的版本:Instant是針對常規(guī)查詢(如互聯(lián)網(wǎng)檢索、翻譯和寫作)進(jìn)行速度優(yōu)化的模型;Thinking擅長編程、數(shù)學(xué)、長文檔分析等復(fù)雜結(jié)構(gòu)化工作;頂級型號Pro,旨在為棘手問題提供最大程度的準(zhǔn)確性和可靠性。
OpenAI特別強(qiáng)調(diào),GPT?5.2 Thinking是迄今為止最適合現(xiàn)實(shí)世界專業(yè)用途的模型。在評估涵蓋44個職業(yè)的知識型工作任務(wù)的GDPval測試中,有70.9%的對比結(jié)果優(yōu)于或持平于頂尖行業(yè)專業(yè)人士,這些任務(wù)包括制作銷售演示文稿、會計電子表格、制造流程圖或短視頻等。
![]()
另外在金融AI領(lǐng)域,GPT?5.2Thinking的產(chǎn)出成果也明顯好于GPT-5.1。
OpenAI給出的示例顯示,GPT?5.2 Thinking在制作人力資源規(guī)劃模型、股權(quán)結(jié)構(gòu)表和項目管理表格的任務(wù)中,產(chǎn)出成果較GPT?5.1 Thinking有肉眼可見的進(jìn)步。
![]()
![]()
![]()
(來源:OpenAI)
除了做PPT和Excel表格外,OpenAI也表示,GPT-5.2在編碼、數(shù)學(xué)、科學(xué)、視覺、長文本推理以及工具使用等方面均刷新了基準(zhǔn)成績。公司稱,這些能力的提升將有望帶來“更可靠的代理式工作流程、可用于生產(chǎn)環(huán)境的代碼,以及能夠在大規(guī)模上下文和真實(shí)世界數(shù)據(jù)中運(yùn)行的復(fù)雜系統(tǒng)”。
橫向比較方面,GPT-5.2 Thinking在幾乎所有列出的推理測試中都略勝于Gemini 3和Anthropic的Claude Opus 4.5,涵蓋現(xiàn)實(shí)世界的軟件工程任務(wù)(SWE-Bench Pro)和博士級別的科學(xué)知識(GPQA Diamond),到抽象推理和模式發(fā)現(xiàn)(ARC-AGI套件)。
![]()
(來源:OpenAI)
OpenAI產(chǎn)品負(fù)責(zé)人Max Schwarzer也在周四通報稱,GPT-5.2 Thinking的回復(fù)較前代減少了38%的錯誤,使該模型在日常決策、研究和寫作中更為可靠。
從周四開始,GPT?5.2將向所有ChatGPT付費(fèi)用戶和API用戶推送。所以這個新模型到底有多么適合“打工”,很快就能見分曉。
作為OpenAI對谷歌的反擊,GPT?5.2僅僅是打出的“第一拳”。
公司CEO奧爾特曼在周四宣布,下周會給用戶們帶來一些“小小的圣誕禮物”。他也在周四表示,Gemini 3對公司各項指標(biāo)的影響比原本擔(dān)心得要小。他還說,預(yù)計OpenAI將在明年1月“以非常強(qiáng)勁的姿態(tài)”退出目前的紅色警報狀態(tài)。
![]()
OpenAI首席產(chǎn)品官Fidji Simo也在周四透露,現(xiàn)在已經(jīng)開始在部分地區(qū)推出年齡估算系統(tǒng),此舉旨在控制ChatGPT對18歲以下用戶回復(fù)的內(nèi)容。Simo也表示,公司希望在明年一季度推出“成人模式”前先引入這一功能。
略有遺憾的是,周四的新品發(fā)布似乎聚焦于新模型的推理能力,沒有推出新的圖像生成器。而今年以來,為數(shù)不多的幾次現(xiàn)象級新品發(fā)布都與圖像、視頻生成產(chǎn)品有關(guān)。奧爾特曼的“紅色警報”備忘錄中,也提及要改善圖像生成能力。
此前有報道稱,OpenAI計劃在明年1月再發(fā)布一款新模型,具有更好的圖像能力和更完善的個性化特點(diǎn),但公司周四未對這一傳言予以確認(rèn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.