<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      剛剛,GPT-5.2 正式發布!讓打工人每周少干 10 小時,成人模式明年見

      0
      分享至

      1106天,OpenAI 從掀桌子的人,變成了被掀桌子的人。

      伴隨著 Google Gemini 3的發布,OpenAI CEO 奧特曼上周罕見拉響了「Code Red」紅色警報,并宣布所有資源回流 ChatGPT 主線,其他業務一律靠邊站。

      這是 OpenAI 成立以來第一次進入「紅色警報」狀態,也是它第一次如此明確地承認:競爭壓力已經大到必須全力應對。


      而就在剛剛,OpenAI 發布了 GPT-5.2模型,打出了 一記力量感十足的重拳。GPT-5.2將向 ChatGPT 付費用戶開放,并通過 API 提供給開發者,分為三個版本:

      Instant:速度優化版,適用于信息查詢、寫作和翻譯等常規任務;

      Thinking:擅長處理復雜結構化任務,如編程、分析長文檔、數學和規劃;

      Pro:高端版,專注于在高難度任務中提供極致的準確性和可靠性。

      不聊天,真干活,GPT-5.2闖進打工人職場

      本以為 OpenAI 會專注提升 ChatGPT 的個性化和消費者體驗,結果 GPT-5.2的發布方向依舊是走職場實用主義的路數。

      用 OpenAI 應用 CEO Fidji Simo 的話來說:「我們設計 GPT-5.2是為了給用戶創造更多經濟價值。」

      什么叫經濟價值?

      就是讓 AI 真的能干活,做表格、寫 PPT、敲代碼、看圖、讀長文、調用工具、搞定復雜項目,這些都是 GPT-5.2的拿手好戲。

      數據也挺唬人。平均每個 ChatGPT 企業版用戶說,AI 每天能給他們省40到60分鐘,重度用戶更狠,每周能省10小時以上。


      GPT-5.2 Thinking 是這次發布的重頭戲。

      在評估44個職業知識型任務的 GDPval 測試中,它成為首個在總體表現上達到或超過人類專家水平的模型。具體來說,在與行業專家的對比中,GPT-5.2 Thinking 在70.9% 的任務中勝出或持平,由人類專家親自評判。


      這些任務可不是隨便出的題,涵蓋了美國 GDP 排名前9個行業,包括銷售演示文稿、會計報表、急診排班計劃、制造業圖紙、短視頻制作等等,都是真實工作場景里的硬活。

      編程方面的提升更明顯。

      SWE-Bench Pro 是個相當嚴格的測試,評估模型在真實世界軟件工程中的能力,涉及四種編程語言,比只測 Python 的版本難多了。GPT-5.2 Thinking 在這個測試里拿到了55.6% 的成績,創下業界新高。


      更夸張的是在 SWE-bench Verified 里直接干到80%,成為目前最高記錄。這意味著 GPT-5.2 Thinking 能更可靠地調試生產環境中的代碼、實現功能需求、重構大型代碼庫,端到端的修復工作做得更高效,減少人工介入。

      前端開發也有明顯提升。

      早期測試者說,它在處理復雜或非常規的前端 UI 任務時表現更出色,特別是涉及3D 元素的場景,妥妥的全棧工程師助手。

      OpenAI 還放出了幾個根據單一提示生成的示例:海浪模擬器、節日賀卡生成器、打字雨游戲。就一個提示詞,整個單頁應用就出來了,可調節的參數、逼真的動畫效果、平靜的 UI 風格,全都有。


      幻覺率降低30%,長文本能力接近完美

      事實準確性這塊,GPT-5.2 Thinking 相較于 GPT-5.1 Thinking 的「幻覺率」更低。

      在一組匿名化的 ChatGPT 查詢中,出現錯誤的回答減少了約30%。對于專業人士來說,這意味著在研究、寫作、分析與決策支持等任務中,出錯率更低,用起來更放心。


      不過 OpenAI 也提醒,就像所有模型一樣,GPT-5.2并不完美,關鍵性任務還是得自己核查。

      長文本推理能力也樹立了新標桿。

      在 OpenAI MRCRv2基準測試中,GPT-5.2表現領先。這個測試評估的是模型能不能正確整合分布在長文檔中的信息,對于深度文檔分析這類涉及數十萬 token 的跨文檔信息整合任務來說,GPT-5.2的準確率遠超 GPT-5.1。

      尤其在 MRCR 的4針測試(不同于 「大海撈針」,而是要求模型在海量文本里,區分并找出多個一模一樣的「針」中的特定一個 )中,最多256k token 的上下文,GPT-5.2是首個接近100% 準確率的模型。


      這意味著專業用戶可以用 GPT-5.2高效處理超長文檔,報告、合同、學術論文、訪談記錄、多文件項目,它都能在處理上百頁內容時保持邏輯一致和信息準確。

      視覺理解方面,GPT-5.2 Thinking 是目前 OpenAI 最強的視覺模型。在圖表推理和軟件界面理解方面,錯誤率下降了約一半。

      對日常專業使用來說,這意味著模型能更準確地解讀數據儀表盤、產品截圖、技術圖紙、可視化報告,適用于金融、運營、工程、設計、客服等以視覺為核心的工作場景。


      空間理解能力和工具調用能力也有所提升,在 Tau2-bench Telecom 測試中,GPT-5.2 Thinking 取得了98.7% 的新高成績,展現出在長、多輪任務中可靠使用工具的能力。

      即使將推理強度設置為最低檔,GPT-5.2的表現仍顯著優于 GPT-5.1和 GPT-4.1。

      這代表 GPT-5.2 Thinking 在執行端到端工作流方面更強,處理客戶服務案例、從多個系統中提取數據、執行分析任務,高效完成全流程輸出,中間環節更少出錯。

      數學和科學能力的提升,可能是這次發布里最硬核的部分。

      在 GPQA Diamond 這種研究生級別的科學問答測試里,覆蓋物理、化學、生物學等領域,GPT-5.2表現明顯更強。FrontierMath 那種評估專家級數學問題解決能力的基準測試,它也能啃下來。


      更牛的是,在 ARC-AGI-1測試中,GPT-5.2 Pro 是第一個突破90% 準確率的模型,相比去年 o3-preview 的87%,表現更強,成本卻降低了約390倍。


      ARC-AGI-2版本更難,專注于考察流動性推理能力,GPT-5.2 Thinking 得分為52.9%,創下「鏈式思維模型」新高,GPT-5.2 Pro 更進一步,達到54.2%。

      官方博客中提到一個令人印象深刻的案例:在統計學習理論的一個開放問題上,GPT-5.2 Pro 甚至直接給出了一個可行的證明方案。

      這個問題來自2019年學習理論大會 COLT 上提出的未解難題:如果模型設定完全正確,數據呈標準正態分布,在這種教科書式的「干凈」情況下,學習曲線是單調的嗎?


      研究人員沒有先設計算法或提供證明思路,也沒有輸入中間步驟或提示,而是直接請求 GPT-5.2 Pro 給出完整證明。結果,模型提出了一種可行的解法,并通過人工驗證、外部專家評審確認其正確性。

      這說明 GPT-5.2 Pro 在一些有明確公理基礎的領域,比如數學、理論計算機科學,已經可以發揮更實質性的科研輔助作用:探索證明路徑、驗證假設、發現隱藏的聯系。


      GPT-5.2 API 價格

      性能表現這么猛,代價自然也不小。

      Thinking 和 Deep Research 模式消耗的算力遠超普通聊天機器人,因為它們得「思考」得更深。由于 OpenAI 現在用于模型推理的開銷,大部分是直接掏真金白銀,而不是用微軟 Azure 的云服務積分抵扣。

      長期往里砸錢,這種玩法能撐多久,真不好說。

      總得來說,GPT-5.2更像是對前兩次模型升級的整合,而不是完全重構。

      8月的 GPT-5是架構重啟,引入了可以在快速響應和深度「Thinking」模式之間切換的路由機制。11月的 GPT-5.1讓系統變得更溫和、更具對話性,也更適合智能體和編碼任務。

      現在的 GPT-5.2,則是要在這些優勢的基礎上,打造出更可靠的生產級模型。而且有一個非常重要的細節:這次推出的三款 GPT-5.2模型,底層知識庫都已經完成了更新。


      GPT-5.2已經開始在 ChatGPT 中陸續上線,優先開放給付費用戶。GPT-5.1還會在「傳統模型」選項中保留三個月,之后就正式下線了。

      API 那邊也同步開放,開發者已經可以用上了。價格比 GPT-5.1貴一些,但 OpenAI 說因為 token 效率更高,實際總成本反而更低。

      一個壞消息,和一個好消息

      除了模型本身,OpenAI 的商業化上也有兩個極具反差感的消息。

      雖然這次發布并沒有推出新的圖像生成模型,但今天 OpenAI 跟迪士尼達成了三年授權協議。

      用戶可以生成包含迪士尼、漫威、皮克斯和星球大戰等200多個角色的社交視頻,部分生成視頻還能在 Disney+上播放。

      作為交換,迪士尼向 OpenAI 投資10億美元,還會成為重要客戶。內容 IP 加 AI 生成,這背后想象空間確實挺大。


      另一個值得關注的消息是,ChatGPT 的「成人模式」終于有了明確時間表。

      隨著越來越多 AI 聊天機器人涉足成人內容,OpenAI 也不打算當圣人了。根據彭博社報道,Fidji Simo 已經明確該功能預計2026年第一季度上線。

      在此之前,OpenAI 會繼續優化年齡識別功能,確保未成年人自動啟用內容保護機制。目前年齡預測模型正在部分國家進行早期測試,以評估識別青少年的能力,并確保不會誤判成年人。

      面對 Google Gemini 的步步緊逼,OpenAI 選擇用 GPT-5.2這套組合拳來回應。它更快、更強,也更像一個成熟的商業產品。

      與此同時,一邊擁抱迪士尼的米老鼠,一邊準備推出成人模式,OpenAI 既要保持技術領先,又要快速變現;既要占領企業市場,又不放過任何流量入口。

      幸運的是,迎來十周年節點的 OpenAI 最終還是演好了這出反擊大戲。


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      最新談判結束,澤連斯基向全世界表明態度:烏克蘭決不投降

      最新談判結束,澤連斯基向全世界表明態度:烏克蘭決不投降

      書中自有顏如玉
      2025-12-12 12:28:43
      釣魚佬的身份有多離譜?網友:我去釣魚碰到了市長,還請我吃楊梅

      釣魚佬的身份有多離譜?網友:我去釣魚碰到了市長,還請我吃楊梅

      另子維愛讀史
      2025-12-11 20:33:40
      遠不如國足!卡帥執教烏茲別克后大倒苦水:面臨3大困難

      遠不如國足!卡帥執教烏茲別克后大倒苦水:面臨3大困難

      邱澤云
      2025-12-11 17:38:55
      2026央視春晚主題官宣僅1天,三大惡心情況發生了,陳佩斯沒說錯

      2026央視春晚主題官宣僅1天,三大惡心情況發生了,陳佩斯沒說錯

      觀察鑒娛
      2025-12-11 08:55:39
      中國最大爛尾軍事工程6501,因湖南老農上山尋牛,意外被發現?

      中國最大爛尾軍事工程6501,因湖南老農上山尋牛,意外被發現?

      興趣知識
      2025-12-11 17:00:40
      神仙木有她美麗,黑絲哪有白襯衫性感

      神仙木有她美麗,黑絲哪有白襯衫性感

      貴圈真亂
      2025-12-12 12:12:10
      神21乘組立大功!空間站傳來好消息,大家最擔心的事已塵埃落地了

      神21乘組立大功!空間站傳來好消息,大家最擔心的事已塵埃落地了

      云上烏托邦
      2025-12-10 17:14:49
      國務院原參事、中國話劇協會原主席藺永鈞逝世

      國務院原參事、中國話劇協會原主席藺永鈞逝世

      澎湃新聞
      2025-12-12 11:26:29
      朗朗老婆31歲吉娜豐唇隆胸,F杯胸圍120cm,腰圍一尺五50cm

      朗朗老婆31歲吉娜豐唇隆胸,F杯胸圍120cm,腰圍一尺五50cm

      精彩背后
      2025-12-09 18:34:03
      新一線名單公布!成都穩居第一,佛山回歸,無錫出局!

      新一線名單公布!成都穩居第一,佛山回歸,無錫出局!

      愛看頭條
      2025-12-11 19:03:07
      魔獸目前最讓人震撼的房屋!中國玩家造出高達房,驚呆暴雪員工!

      魔獸目前最讓人震撼的房屋!中國玩家造出高達房,驚呆暴雪員工!

      魔獸世界研究所
      2025-12-11 18:58:58
      荒唐!特朗普擬組成C5取代G7,拉攏中俄印日共同取代歐洲

      荒唐!特朗普擬組成C5取代G7,拉攏中俄印日共同取代歐洲

      史政先鋒
      2025-12-12 13:02:25
      山東臨沂一高三男生墜亡,官方介入

      山東臨沂一高三男生墜亡,官方介入

      深圳晚報
      2025-12-11 23:18:58
      澳媒感嘆:中國過去試圖追趕西方,現在趕上了,但西方未來可能趕不上中國

      澳媒感嘆:中國過去試圖追趕西方,現在趕上了,但西方未來可能趕不上中國

      Thurman在昆明
      2025-12-12 00:32:49
      故事:康熙擒鰲拜后,問他:你手握重兵,為何不反?鰲拜慘然一笑

      故事:康熙擒鰲拜后,問他:你手握重兵,為何不反?鰲拜慘然一笑

      余們搞笑段子
      2025-12-12 00:19:59
      剛剛到了中美博弈的最后一步!游戲規則要變了!

      剛剛到了中美博弈的最后一步!游戲規則要變了!

      一個壞土豆
      2025-12-11 20:10:32
      中央最新定調!事關降準降息、股市樓市等新表述

      中央最新定調!事關降準降息、股市樓市等新表述

      南方都市報
      2025-12-11 20:06:05
      殲-35戰斗機在鞍山附近墜毀?”實際是美F-35,造謠究竟是何居心

      殲-35戰斗機在鞍山附近墜毀?”實際是美F-35,造謠究竟是何居心

      南權先生
      2025-12-11 16:12:32
      美國公開支持日本,正中中方下懷,高市緊急求見,川普發現上當了

      美國公開支持日本,正中中方下懷,高市緊急求見,川普發現上當了

      薦史
      2025-12-12 12:13:35
      錢再多也沒用!湖北26歲理財經理王小紅去世,開新奧迪,死因曝光

      錢再多也沒用!湖北26歲理財經理王小紅去世,開新奧迪,死因曝光

      紀中百大事
      2025-12-11 20:08:58
      2025-12-12 14:32:49
      AppSo incentive-icons
      AppSo
      讓智能手機更好用的秘密
      5917文章數 26724關注度
      往期回顧 全部

      科技要聞

      凌晨突發!GPT-5.2上線,首批實測感受來了

      頭條要聞

      曾因監獄疫情防控不力被免職 解維俊5年多后又被查

      頭條要聞

      曾因監獄疫情防控不力被免職 解維俊5年多后又被查

      體育要聞

      15輪2分,他們怎么成了英超最爛球隊?

      娛樂要聞

      濮存昕外孫女演短劇遭吐槽

      財經要聞

      美國要組建C5,全世界大吃一驚

      汽車要聞

      插混四驅法拉利?849 Testarossa國內發布516.8萬起

      態度原創

      房產
      數碼
      藝術
      健康
      旅游

      房產要聞

      封關倒數!單月狂銷80套,三亞這個全能盤,閉眼入!

      數碼要聞

      小米、美的、海信等企業聯手!禁止攻擊友商,攜手力推“鋁代銅”

      藝術要聞

      嶺南畫派畫雪

      甲狀腺結節到這個程度,該穿刺了!

      旅游要聞

      紅櫸燃冬韻 梧桐鋪街景 山城換上限定“彩妝”

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 成人无码av一区二区| 亚洲人妻系列| 99中文视频| 精品欧美h无遮挡在线看中文| 免费又黄又爽1000禁片| 3atv精品不卡视频| 欧美乱大交aaaa片if| 久久国模| 中文字幕精品人妻熟女| 8x国产精品视频| 久久久无码精品国产一区| 色天使AV| 夏河县| 久久精品高清一区二区三区| 亚洲色欲色欲www在线播放| 亚洲综合色婷婷中文字幕| 91探花在线| 久久成人电影| 欧美肥妇bwbwbwbxx| 亚洲一区二区三区在线播放无码 | 中文字幕日产乱码中| 甘德县| 大伊香蕉精品一区视频在线| 影音先锋女人aV鲁色资源网站| 无码少妇视频| 亚洲成人在线资源| 国产精品无码mv在线观看| 亚洲一区二区av| 扎兰屯市| 偷看少妇自慰xxxx| 狠狠色狠狠综合久久| 超碰人人擦| 色AV综合| av无码av天天av天天爽| 亚洲精品麻豆一二三区| 九一国产精品| AV色色色| 好紧好湿好黄的视频| 亚洲精品久久麻豆蜜桃| 云安县| 亚洲日韩av无码一区二区三区|