<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      GPT-5.2 凌晨發布:這一次,OpenAI 不想做題,只想幫你搞錢!

      0
      分享至

      ★ 設為星標 | 只講人話,帶你玩轉AIGC。

      GPT-5.2 終于發布了!

      雖然我已經以 Gemini 為主,但 GPT 的每次更新仍然受到極大的關注(包括我)。


      這次到底更新了些啥?

      簡單來說,各項指標超越 Gemini 3 Pro,讓 OpenAI 居然又重回了王座。


      但,并沒有形成那種“外星人降臨”的碾壓優勢。

      不過,細節里全是魔鬼。我們具體來扒一扒。

      OpenAI 官方開篇定調非常高,直接說 GPT-5.2 是迄今為止功能最強大的專業知識工作模型。

      啥叫專業知識工作模型?

      把官方那堆技術黑話翻譯一下,意思就是:它不再滿足于當你的陪聊對象,它現在想做你的“腦力合伙人”。

      這一次,OpenAI 顯然是急了,它甚至不屑于跟你談什么“通用智能”的夢想,而是把“搞錢”這三個字寫在了臉上。

      它這次的技能點,全點在了打工人的痛點上:做表(Excel)、畫餅(PPT)、寫代碼,以及那些讓人頭禿的長文檔。

      它就是為了創造“經濟價值”而生的 。

      到底有多強?聊聊 GDPval。

      為了證明自己“值錢”,OpenAI 甚至拋棄了那些傳統的 MMLU 考試分數。

      他們拋出了一個聽起來就充滿金錢味道的新指標:GDPval。 (這名字一聽就是奔著生產總值GDP去的)

      可能很多人沒聽說過這個評測集。 這是 OpenAI 專門為了衡量“真實世界打工能力”搞出來的。

      他們在 44 個核心職業(律師、市場經理、工程師等)里,找了一幫平均工齡 14 年的資深專家,出了 1320 道真實的“地獄級工作任務” 。

      注意,不是做選擇題。 是讓你真的去改合同、寫全案 PPT、優化生產線圖紙。這些任務,人類專家平均要花 7 個小時才能做完 。

      結果呢?經過雙盲測試,GPT-5.2 在 70.9% 的情況下,干得比這些人類專家更好,或者至少打個平手 。


      圖:在 GDPval 中,模型嘗試完成涵蓋美國 GDP 貢獻最大的九大行業中 44 個職業的特定知識工作

      這才是最恐怖的。

      它的參照系不是剛畢業的大學生,而是行業專家。 也就是說,在一個有著十幾年經驗的采購經理面前,GPT-5.2 干出來的活兒,有七成的時候,比他干得還好。

      甚至于說,GPT-5.2 Thinking 生成的電子表格和幻燈片在復雜程度和格式方面都有所提高。


      說白了: 以前的 GPT 是個學霸,現在的 GPT-5.2 是個熟手。

      那么,它是怎么做到這一點的?

      這背后其實是一場架構級的革命。

      OpenAI 官方直言不諱:這是自 GPT-5 以來,GPT 系列在智能體編程(Agentic Coding)領域跨度最大的一次飛躍。


      圖:在SWE-Bench Pro中(在新窗口中打開)? ? ?,給定一個代碼庫,模型必須生成一個補丁來解決一個實際的軟件工程任務。

      為了證明自己不是自嗨,他們這次直接拉來了 Windsurf 和 Devin 站臺。 這兩位可是現在 AI 編程界的頂流。

      官方直接宣布,GPT-5.2 將成為這兩個工具的默認核心模型 。

      這說明啥?說明這玩意兒已經經受住了最殘酷的生產環境考驗。

      但真正讓我覺得牛逼的,是背后的技術邏輯發生了質變。

      以前我們為了讓 AI 干點復雜的活,得搭建一套脆弱的“多智能體系統”。

      就像拉了一群各懷鬼胎的實習生在開會,一個負責想,一個負責寫,一個負責改,管理起來極其麻煩,還容易崩 。

      而 GPT-5.2 直接解鎖了一種全新的架構:單一超級智能體(Single Mega-agent)。

      這就好比把那一屋子實習生全裁了,換來了一個精通 20 多種工具的全能大神 。它不僅反應更快、腦子更靈光,而且維護起來簡單了 100 倍。

      除了腦子好,它的“手眼”也進化了。

      為了配得上“超級智能體”這個稱號,OpenAI 這次給 GPT-5.2 裝上了更強的配件:

      1. 手更快了

      以前的 AI 調用工具(比如聯網搜素、畫圖、跑代碼)總有種“卡頓感”。但官方這次特別強調:延遲大幅降低,而且工具調用能力變得極強。

      這意味著什么?

      意味著它在多個工具之間切換,絲滑得像是在切菜。

      它不再是一個個蹦字的聊天機器人,而是一個能瞬間調起計算器、瀏覽器、代碼解釋器的“快手”。嗯?

      2. 眼睛更尖了

      看一眼官方放出的演示圖: 它能直接看懂復雜的波浪模擬參數,甚至能精準識別電路板上的每一個元器件。


      圖:GPT 5.2 可以識別出元部件

      這說明它的視覺能力已經脫離了“認貓認狗”的初級階段,開始進入工業級的精細識別了。

      配合長上下文能力 ,不管是幾千行的代碼屎山,還是幾十頁的復雜電路圖,它都能一口吞下,并且過目不忘。

      實際上,這使得專業人士能夠使用 GPT-5.2 處理長篇文檔,例如報告、合同、研究論文、筆錄和多文件項目,同時在數十萬個詞元中保持一致性和準確性。


      圖:GPT 5.2 的長上下文處理

      所以,GPT-5.2 特別適合深度分析、綜合和復雜的多源工作流程。

      但真正的“重頭戲”,是這個:ARC-AGI 2

      如果說 GDPval 是測它能不能干活,那 ARC-AGI 2 就是測它到底有沒有腦子。

      老粉都知道,ARC 評測集是 AI 圈最難啃的骨頭,甚至沒有之一。

      它是由 Keras 之父 Fran?ois Chollet 搞出來的,專門用來反死記硬背的。

      比如這種題目:


      圖:ARC AGI2 題目


      圖:ARC AGI2 題目

      以前的模型,MMLU 這種考試能拿 90 分,一碰到 ARC 這種需要“舉一反三”的智力題,立馬現原形,得分低得可憐。

      大家猜猜上一代的 GPT-5.1 Thinking 拿了多少分?

      17.6%。

      但這次,GPT-5.2 干到了多少?52.9%。

      兄弟們,這是 3 倍的暴漲。這不是“擠牙膏”,這是直接把牙膏管踩爆了。

      為了讓大家有個概念,目前市面上最強的競品 Gemini 3 Pro 和 Claude,在這個榜單上的分數大約在 31% - 37% 之間(取決于版本)。


      也就是說,OpenAI 這一次在純智商層面,不僅甩開了對手,更是跨越了一個巨大的鴻溝。

      這意味著 GPT-5.2 終于突破了那層窗戶紙:它開始具備真正的通用推理能力了。

      它遇到沒見過的新問題,不再是去翻記憶庫里的答案(因為根本沒有),而是像人類一樣,現場觀察規律、現場推理、現場解決。

      順便提一嘴,在另一個數學競賽 AIME 2025 里,GPT-5.2 直接拿了 100% 的滿分。

      這可是全美高中數學聯賽。 以前我們還在討論 AI 能不能及格,現在它已經把卷子做穿了。

      相比于它能多寫兩行代碼,我覺得這一點,才是這次更新里最硬核、最不容忽視的里程碑。

      總結一下:

      GPT-5.2 Instant、思考版和 Pro 版本今日開始推送,首先面向 Plus、Pro、Business 和 Enterprise 套餐用戶。

      免費版和 Go 用戶將于明天獲得訪問權限。

      GPT-5.2 在我心中,是一個極其合格,甚至有點“過于務實”的迭代。

      它沒有像過去那樣,瘋狂去卷那些虛頭巴腦的考試分數,而是把所有的技能點,都死磕在了“怎么幫白領干活”這件事上。

      它不跟你談星辰大海,只跟你談降本增效;不跟你炫耀參數,只給你看GDPval。

      這個點,我覺得就很酷,非常的剛需。

      雖然從“好玩”或者“科幻感”的角度來說,GPT-5.2 可能沒有 Gemini 3 Pro 原生多模態帶來的那種絲滑震撼。

      (畢竟谷歌同步發行了 Nano Banana Pro,期待 GPT Image 早日發布)

      但如果你是為了工作,為了搞錢,為了早點下班去陪家人。那 GPT-5.2 可能是目前地表最強、也是最值得你掏錢的生產力工具 。

      好了,就扒到這里,如果覺得這篇文章對你有用,別忘點贊,??并轉發給你的朋友哦~

      我們下次再見。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      重磅!4冠主帥官宣辭職不愁下家,助教硬接爛攤子 球迷:走為上計

      重磅!4冠主帥官宣辭職不愁下家,助教硬接爛攤子 球迷:走為上計

      籃球看比賽
      2026-01-26 12:35:29
      女留學生回國就診“肛裂”!網友:公司現招聘海龜要體檢生殖系統

      女留學生回國就診“肛裂”!網友:公司現招聘海龜要體檢生殖系統

      火山詩話
      2026-01-24 07:32:05
      不跑不跳!一個被嚴重低估的“長壽動作”藏著6大好處,醫生都在推薦

      不跑不跳!一個被嚴重低估的“長壽動作”藏著6大好處,醫生都在推薦

      人民日報健康客戶端
      2026-01-26 07:34:49
      遼籃官宣:楊鳴身體原因辭職 充分溝通尊重個人意愿 烏戈接任

      遼籃官宣:楊鳴身體原因辭職 充分溝通尊重個人意愿 烏戈接任

      醉臥浮生
      2026-01-26 16:29:44
      清水梨紗:上次亞洲杯我們不敵中國,現在要以挑戰者心態迎戰

      清水梨紗:上次亞洲杯我們不敵中國,現在要以挑戰者心態迎戰

      懂球帝
      2026-01-26 17:30:12
      一個拿腔作勢一個雙目無神,兩人連累48集大劇,老戲骨再強也沒用

      一個拿腔作勢一個雙目無神,兩人連累48集大劇,老戲骨再強也沒用

      查爾菲的筆記
      2026-01-24 20:12:13
      閑魚不愧是全國最大的黑市,網民:只有你想不到,沒有你買不到

      閑魚不愧是全國最大的黑市,網民:只有你想不到,沒有你買不到

      小熊侃史
      2026-01-16 07:40:07
      “牢A”風波最倒霉的不是那幫留學生和陪讀媽媽!而是某品牌項鏈

      “牢A”風波最倒霉的不是那幫留學生和陪讀媽媽!而是某品牌項鏈

      火山詩話
      2026-01-27 06:17:38
      李思思現身邢臺主持,又矮又胖,1米7看著就像1米5,臉還變圓潤了

      李思思現身邢臺主持,又矮又胖,1米7看著就像1米5,臉還變圓潤了

      小娛樂悠悠
      2026-01-26 11:36:45
      大冷!雷霆惜敗猛龍無緣追平宇宙勇73勝 亞歷山大24+6奎克利23+11

      大冷!雷霆惜敗猛龍無緣追平宇宙勇73勝 亞歷山大24+6奎克利23+11

      醉臥浮生
      2026-01-26 10:34:52
      運價直逼5毛錢/公里,網約車司機發出靈魂拷問:這么低的價格究竟誰在跑?

      運價直逼5毛錢/公里,網約車司機發出靈魂拷問:這么低的價格究竟誰在跑?

      網約車觀察室
      2026-01-26 10:17:32
      央視曝光!致命游戲“夢回大唐”正通過學生社交群擴散!央媒發聲:別讓這些暗語藏匿在隱秘的角落

      央視曝光!致命游戲“夢回大唐”正通過學生社交群擴散!央媒發聲:別讓這些暗語藏匿在隱秘的角落

      每日經濟新聞
      2026-01-26 11:45:09
      炒股是世界上最好的工作,沒有之一!但不適合任何人!

      炒股是世界上最好的工作,沒有之一!但不適合任何人!

      一方聊市
      2026-01-26 20:20:18
      央視發聲后,新華社點評李亞鵬更“猛”,真正道出了老百姓的心聲

      央視發聲后,新華社點評李亞鵬更“猛”,真正道出了老百姓的心聲

      娛樂故事
      2026-01-26 17:22:02
      10億產業毀于貪婪?云南毒紅薯后續:無辜農戶畝虧數千

      10億產業毀于貪婪?云南毒紅薯后續:無辜農戶畝虧數千

      愛下廚的阿椅
      2026-01-26 06:45:40
      大學女老師出軌大二男生:身材曼妙,照片流出,大量骯臟細節披露

      大學女老師出軌大二男生:身材曼妙,照片流出,大量骯臟細節披露

      博士觀察
      2026-01-26 18:37:50
      曲阜會議上,饒漱石嚴肅告誡華野諸將:全軍要服從粟裕同志指揮

      曲阜會議上,饒漱石嚴肅告誡華野諸將:全軍要服從粟裕同志指揮

      大運河時空
      2026-01-26 07:10:03
      山東一周“擼”了13個官兒!

      山東一周“擼”了13個官兒!

      濟寧人
      2026-01-26 20:41:33
      羈絆!他9天前亞洲杯失點致隊被U23國足淘汰,今絕平國足找回面子

      羈絆!他9天前亞洲杯失點致隊被U23國足淘汰,今絕平國足找回面子

      我愛英超
      2026-01-26 23:47:10
      演員孫濤宣布告別春晚:18次登春晚,把舞臺讓給年輕人

      演員孫濤宣布告別春晚:18次登春晚,把舞臺讓給年輕人

      素素娛樂
      2026-01-26 20:35:38
      2026-01-27 08:19:00
      AI范兒 incentive-icons
      AI范兒
      AI范兒是一個專注于人工智能領域的資訊和學習平臺,提供最新的人工智能資訊
      649文章數 424關注度
      往期回顧 全部

      科技要聞

      理想開始關店“過冬”,否認“百家”規模

      頭條要聞

      上海一女子嫌風水不好 屢次掰歪小區兩塊反光鏡

      頭條要聞

      上海一女子嫌風水不好 屢次掰歪小區兩塊反光鏡

      體育要聞

      叛逆的大公子,要砸了貝克漢姆這塊招牌

      娛樂要聞

      張雨綺被抵制成功!遼視春晚已將她除名

      財經要聞

      從美式斬殺線看中國社會的制度韌性構建

      汽車要聞

      賓利第四臺Batur敞篷版發布 解鎖四項定制創新

      態度原創

      本地
      健康
      教育
      時尚
      公開課

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      耳石脫落為何讓人天旋地轉+惡心?

      教育要聞

      舟山嵊泗縣取消

      甜了10年,超多曖昧細節,全網求他倆原地結婚

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版