<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      OpenAI紅色警報下的反擊:發(fā)布GPT-5.2迎戰(zhàn)Gemini 3

      0
      分享至

      當(dāng)谷歌的 Gemini 在各大 AI 排行榜上風(fēng)頭正勁時,OpenAI 終于打出了新的王牌。

      周四,這家 AI 巨頭發(fā)布了 GPT-5.2,稱其是迄今為止“最強(qiáng)大的模型”,專為開發(fā)者和職場人士打造。


      (來源:OpenAI)

      這場發(fā)布會的時機(jī)頗為微妙。

      一個月前,OpenAI CEO 山姆·奧特曼(Sam Altman)向內(nèi)部發(fā)出“紅色警報”,承認(rèn) ChatGPT 面臨巨大競爭壓力,正在輸?shù)粝M市場份額。今天的 GPT-5.2 正是 OpenAI 試圖奪回領(lǐng)導(dǎo)地位的關(guān)鍵一步。

      同時,今天也是 OpenAI 官宣成立十周年的日子。

      GPT-5.2 模型家族包括三個不同版本:Instant、Thinking 和 Pro。

      Instant 是速度優(yōu)化版本,專門處理日常查詢,比如信息檢索、寫作和翻譯這類常規(guī)任務(wù)。

      Thinking 則擅長復(fù)雜的結(jié)構(gòu)化工作,在編程、分析長文檔、數(shù)學(xué)計算和項目規(guī)劃方面表現(xiàn)突出。

      Pro 則是頂級版本,旨在為最棘手的問題提供最高精度和可靠性。它的運(yùn)行速度顯著慢于其他版本,且成本極其高昂,專為那些準(zhǔn)確性高于一切、成本退居其次的重要任務(wù)設(shè)計。

      測試數(shù)據(jù)表明,Pro 版本是唯一在 ARC-AGI-1 推理基準(zhǔn)測試中突破 90% 大關(guān),并在 AIME 2025 數(shù)學(xué)競賽中不使用工具就達(dá)到 100% 滿分的模型。

      在 ChatGPT 中,GPT-5.2 的三個版本已經(jīng)上線,首先面向付費用戶開放。OpenAI 表示將在未來幾天逐步部署 GPT-5.2,以保持 ChatGPT 盡可能流暢和可靠。

      “我們設(shè)計 GPT-5.2 就是為了給人們創(chuàng)造更多經(jīng)濟(jì)價值。”O(jiān)penAI 應(yīng)用業(yè)務(wù) CEO 菲吉·西莫(Fidji Simo)在發(fā)布會上表示。她強(qiáng)調(diào),新模型在創(chuàng)建電子表格、制作演示文稿、編寫代碼、圖像識別、理解長文本、使用工具以及處理復(fù)雜多步驟項目方面都有顯著提升。


      (來源:OpenAI)

      據(jù)其介紹,ChatGPT 企業(yè)版的普通用戶表示“AI 每天為他們節(jié)省 40-60 分鐘”,而重度用戶每周節(jié)省時間“超過十小時”。GPT-5.2 的目標(biāo)就是進(jìn)一步擴(kuò)大這種價值。

      OpenAI 表示,GPT-5.2 在多項行業(yè)基準(zhǔn)測試中創(chuàng)下新紀(jì)錄。


      圖 | 多項基準(zhǔn)測試成績(來源:OpenAI)

      在涵蓋 40 多種職業(yè)專業(yè)知識的 GDPval 測試中,GPT-5.2 Thinking 的表現(xiàn)達(dá)到了專家級水平。根據(jù)專業(yè)評審的判斷,在 70.9% 的情況下,GPT-5.2 Thinking 擊敗或打平了頂級行業(yè)專業(yè)人士。這些任務(wù)包括制作演示文稿、電子表格和其他各類工作成果。

      更重要的是,GPT-5.2 完成這些任務(wù)的速度是專業(yè)人士的 11 倍以上,成本卻不到 1%,不過 OpenAI 并未公布模型 VS 人類的成本是如何計算的。


      (來源:OpenAI)

      在軟件工程領(lǐng)域,GPT-5.2 Thinking 在 SWE-Bench Pro 測試中達(dá)到了 55.6% 的新高分。這個成績也是超過了 Claude 4.5 Sonnet 和 Gemini 3 Pro。在更基礎(chǔ)的 SWE-bench Verified 測試中,GPT-5.2 的得分更是達(dá)到了 80%。


      (來源:資料圖)

      OpenAI 研究主管艾丹·克拉克(Aidan Clark)解釋說,更強(qiáng)的數(shù)學(xué)能力不僅僅是解方程那么簡單。數(shù)學(xué)推理能力是衡量模型能否遵循多步驟邏輯、保持?jǐn)?shù)字長期一致性、避免可能隨時間累積的細(xì)微錯誤的代理指標(biāo)。

      在科學(xué)問題方面,GPT-5.2 Pro 在 GPQA Diamond 測試中取得了 93.2% 成績。GPT-5.2 Thinking 也有 92.4% 的高分。雙雙打破了 Gemini 3 Pro 保持的紀(jì)錄。




      圖 | GPQA Diamond 榜單(來源:OpenAI)

      克拉克在發(fā)布會上分享了一個案例:團(tuán)隊讓一位資深免疫學(xué)研究員使用 GPT-5.2 Pro,當(dāng)研究員要求模型生成關(guān)于免疫系統(tǒng)最重要的未解問題時,模型產(chǎn)生了“更敏銳的問題和更有力的解釋”,用于說明這些問題為何重要。該研究員認(rèn)為其表現(xiàn)超過了“所有其他前沿模型”。

      在可靠性方面,GPT-5.2 也取得了重要進(jìn)展。OpenAI 后訓(xùn)練負(fù)責(zé)人馬克斯·施瓦策(Max Schwarzer)指出,在衡量對事實性問題回答的基準(zhǔn)測試中,GPT-5.2 Thinking 的幻覺出現(xiàn)率比 GPT-5.1 降低了 38%。


      (來源:OpenAI)

      長文本理解方面,GPT-5.2 Thinking 同樣創(chuàng)下了新紀(jì)錄。OpenAI 采用 MRCRv2 評估來衡量模型整合分散在長文檔中信息的能力。

      處理需要跨越數(shù)十萬 token 相關(guān)信息的真實任務(wù)時,GPT-5.2 Thinking 的準(zhǔn)確性遠(yuǎn)超 GPT-5.1 Thinking。它是第一個在四針 MRCRv2 測試中(最多 256k token)實現(xiàn)接近 100% 準(zhǔn)確率的模型。


      (來源:OpenAI)

      這意味著專業(yè)人士可以更放心地使用 GPT-5.2 處理長文檔,如報告、合同、研究論文、記錄和多文件項目,同時在數(shù)十萬 token 范圍內(nèi)保持連貫性和準(zhǔn)確性。

      在視覺能力方面,GPT-5.2 Thinking 在圖表推理和軟件界面理解方面的準(zhǔn)確率提升近 50%。這意味著模型可以更準(zhǔn)確地解讀儀表板、產(chǎn)品截圖、技術(shù)圖表和可視化報告,支持更加依賴視覺信息的工作流。

      相比之前的模型,GPT-5.2 Thinking 對圖像中元素位置的把握更強(qiáng)。例如,在識別主板圖像中的組件并返回大致邊界框的任務(wù)中,即使在低質(zhì)量圖像上,GPT-5.2 也能識別主要區(qū)域并放置與每個組件真實位置有時匹配的框,而 GPT-5.1 只能標(biāo)記少數(shù)部分,對空間排列的理解要弱得多。


      (來源:OpenAI)

      值得一提的是,OpenAI 的新圖像生成工具仍然缺位。據(jù)報道,奧特曼曾在內(nèi)部紅色警報備忘錄中表示,圖像生成將是未來的重點,特別是在谷歌的新版 Nano Banana 發(fā)布之后。

      據(jù)報道,OpenAI 計劃在明年一月發(fā)布另一款新模型,具有更好的圖像效果、更快的速度和更好的個性,但尚未得到官方確認(rèn)。

      最后在發(fā)布會上,OpenAI 承認(rèn)在某些方面還有改進(jìn)空間。比如在 ChatGPT 中,公司正在努力解決過度拒絕等已知問題,同時繼續(xù)提高回復(fù)的可靠性。此外,OpenAI 據(jù)傳正在考慮開放模型成人內(nèi)容限制。

      對于 OpenAI 來說,GPT-5.2 能否幫助它重新奪回失去的領(lǐng)地,還需要時間來證明。

      參考資料:

      https://openai.com/index/introducing-gpt-5-2/

      https://www.theverge.com/ai-artificial-intelligence/842529/openai-gpt-5-2-new-model-chatgpt

      https://techcrunch.com/2025/12/11/openai-fires-back-at-google-with-gpt-5-2-after-code-red-memo/

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      78歲老奶被送養(yǎng)老院,她笑著整理東西,5天后兒子接電話愣了

      78歲老奶被送養(yǎng)老院,她笑著整理東西,5天后兒子接電話愣了

      蘭姐說故事
      2025-08-06 17:00:09
      1970年,謝富治阻撓少將升官,主席掐滅煙頭問了一句,全場沒人敢接茬

      1970年,謝富治阻撓少將升官,主席掐滅煙頭問了一句,全場沒人敢接茬

      史海殘云
      2025-12-11 16:19:09
      總司令沒“兵權(quán)”?建國后朱老總為何從不主持軍委工作?這原因太真實了

      總司令沒“兵權(quán)”?建國后朱老總為何從不主持軍委工作?這原因太真實了

      史海孤雁
      2025-12-11 15:56:04
      祁同偉吞彈前一刻,沙瑞金接到京都99道命令后慌了:讓他進(jìn)省委!

      祁同偉吞彈前一刻,沙瑞金接到京都99道命令后慌了:讓他進(jìn)省委!

      瑾瑜聊情感
      2025-10-24 08:57:50
      中國高校第一城,大學(xué)生逼近170萬人

      中國高校第一城,大學(xué)生逼近170萬人

      21世紀(jì)經(jīng)濟(jì)報道
      2025-12-11 20:37:18
      美軍丟人丟大發(fā)了!剛從南海撈出戰(zhàn)機(jī)卻遭全網(wǎng)嘲諷,理由出奇一致

      美軍丟人丟大發(fā)了!剛從南海撈出戰(zhàn)機(jī)卻遭全網(wǎng)嘲諷,理由出奇一致

      云上烏托邦
      2025-12-11 00:20:04
      柬埔寨為什么不使用中國戰(zhàn)斗機(jī)去應(yīng)戰(zhàn)泰國的美制戰(zhàn)斗機(jī)?不自信?

      柬埔寨為什么不使用中國戰(zhàn)斗機(jī)去應(yīng)戰(zhàn)泰國的美制戰(zhàn)斗機(jī)?不自信?

      我心縱橫天地間
      2025-12-11 23:39:31
      連續(xù)2周超越蘋果,華為手機(jī)重奪國內(nèi)市場份額第一!

      連續(xù)2周超越蘋果,華為手機(jī)重奪國內(nèi)市場份額第一!

      每日經(jīng)濟(jì)新聞
      2025-12-11 14:38:24
      楊子直播曝猛料,即將和黃圣依復(fù)合,除了我,她看不上別的男人!

      楊子直播曝猛料,即將和黃圣依復(fù)合,除了我,她看不上別的男人!

      心靜物娛
      2025-12-12 14:18:14
      美國人的疑問:本拉登對多國發(fā)起襲擊,為何唯獨放過中國?

      美國人的疑問:本拉登對多國發(fā)起襲擊,為何唯獨放過中國?

      珺瑤婉史
      2025-11-19 19:20:06
      無妻無子,身價過億,年過50的老好人何炅,迎來自己“人生結(jié)局”

      無妻無子,身價過億,年過50的老好人何炅,迎來自己“人生結(jié)局”

      小莜讀史
      2025-12-11 15:08:14
      不是,英國怎么就成了比亞迪海外最大市場?

      不是,英國怎么就成了比亞迪海外最大市場?

      差評XPIN
      2025-12-11 00:08:02
      訂1600元一晚的別墅套餐,還沒住進(jìn)去,妻子摔骨折了

      訂1600元一晚的別墅套餐,還沒住進(jìn)去,妻子摔骨折了

      瀟湘晨報
      2025-12-11 19:47:43
      性與命和壽的關(guān)系:好命長壽的男人,往往身上有這幾種特征

      性與命和壽的關(guān)系:好命長壽的男人,往往身上有這幾種特征

      鬼菜生活
      2025-12-11 03:56:01
      快船113-115火箭!無奈的不是輸球,是哈登身邊已經(jīng)發(fā)生兩大變化

      快船113-115火箭!無奈的不是輸球,是哈登身邊已經(jīng)發(fā)生兩大變化

      魚崖大話籃球
      2025-12-12 17:13:15
      丈夫負(fù)債30萬,妻子有45萬存款卻無動于衷,妻子坦言:想陪他吃苦

      丈夫負(fù)債30萬,妻子有45萬存款卻無動于衷,妻子坦言:想陪他吃苦

      烙任情感
      2025-12-11 17:10:53
      郭德綱被約談6天后,曲協(xié)18字表態(tài),難怪郭麒麟多次拒絕接班!

      郭德綱被約談6天后,曲協(xié)18字表態(tài),難怪郭麒麟多次拒絕接班!

      烏娛子醬
      2025-12-11 16:19:14
      賭贏賺翻了:1/10價格買下價值56萬服務(wù)器主機(jī)!960GB內(nèi)存就已回本

      賭贏賺翻了:1/10價格買下價值56萬服務(wù)器主機(jī)!960GB內(nèi)存就已回本

      快科技
      2025-12-12 15:06:06
      外交部:中央政府堅定支持香港特區(qū)依法懲治危害國家安全的犯罪行為

      外交部:中央政府堅定支持香港特區(qū)依法懲治危害國家安全的犯罪行為

      新快報新聞
      2025-12-12 17:31:06
      量化交易在交易所的設(shè)備傳將被清退,大跌后一字漲停,散戶又吃苦

      量化交易在交易所的設(shè)備傳將被清退,大跌后一字漲停,散戶又吃苦

      你食不食油餅
      2025-12-12 01:39:12
      2025-12-12 18:51:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15984文章數(shù) 514388關(guān)注度
      往期回顧 全部

      科技要聞

      凌晨突發(fā)!GPT-5.2上線,首批實測感受來了

      頭條要聞

      沈逸:美國用最強(qiáng)硬的方式 吹響戰(zhàn)略撤退號角

      頭條要聞

      沈逸:美國用最強(qiáng)硬的方式 吹響戰(zhàn)略撤退號角

      體育要聞

      15輪2分,他們怎么成了英超最爛球隊?

      娛樂要聞

      上海這一夜,33歲陳麗君秒了32歲吉娜?

      財經(jīng)要聞

      鎂信健康闖關(guān)港交所:被指竊取商業(yè)秘密

      汽車要聞

      插混四驅(qū)法拉利?849 Testarossa國內(nèi)發(fā)布516.8萬起

      態(tài)度原創(chuàng)

      時尚
      教育
      數(shù)碼
      藝術(shù)
      房產(chǎn)

      為何她們穿得很普通,卻很有氛圍感?

      教育要聞

      三維賦能育新苗 薪火相傳譜新篇——膠州一中多措并舉助力青年教師成長

      數(shù)碼要聞

      必看!2025燃?xì)鉄崴魇竺婆琶?瑞美第四實至名歸

      藝術(shù)要聞

      嶺南畫派畫雪

      房產(chǎn)要聞

      每日狂增1300+企業(yè)!封關(guān)在即,海南徹底爆發(fā)!

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 第一宅男AV导航| 亚洲国产精品特色大片观看完整版| 999久久欧美人妻一区二区| 久久这里只精品国产2| 99r久久| 中文丝袜在线| 人妻图区| 丁青县| 六十路熟妇乱子伦| 久久久噜噜噜久久中文字幕色伊伊| julia无码中文字幕一区| 97精品尹人久久大香线蕉| 一级国产在线观看高清| 精品少妇| 制服精品在线成人| 韩国日本三级在线观看| 国产91丝袜在线观看| www.18禁| 无码人妻精品一区二区三区夜夜嗨| 欲香欲色天天综合和网| 免费看婬乱a欧美大片| 97超碰资源总站| 中文人妻不卡| 亚洲2017天堂色无码| 欧美黑人性暴力猛交喷水黑人巨大| 国产午夜成人久久无码一区二区| 亚洲无码VS| 国产亚洲精品自在久久| 中国无码人妻丰满熟妇啪啪软件| 国产果冻豆传媒麻婆精东| 蜜臀99| 亚洲国产成人精品无码区在线观看| 亚洲性无码一区二区三区| 伊人99| 佛学| 狠狠cao日日穞夜夜穞av| 国产精品美女久久久久久久 | 五月天成人社区| ThePorn人妻白浆| 最新国产精品精品视频| 九九伊人|