<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<meter id="lkuq3"></meter>

<tr id="lkuq3"><strike id="lkuq3"><strong id="lkuq3"></strong></strike></tr>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.2 凌晨發布：這一次，OpenAI 不想做題，只想幫你搞錢！

2025-12-12 08:47:58　來源: AI范兒

上海舉報

0

分享至

★ 設為星標 | 只講人話，帶你玩轉AIGC。

GPT-5.2 終于發布了！

雖然我已經以 Gemini 為主，但 GPT 的每次更新仍然受到極大的關注（包括我）。

這次到底更新了些啥？

簡單來說，各項指標超越 Gemini 3 Pro，讓 OpenAI 居然又重回了王座。

但，并沒有形成那種“外星人降臨”的碾壓優勢。

不過，細節里全是魔鬼。我們具體來扒一扒。

OpenAI 官方開篇定調非常高，直接說 GPT-5.2 是迄今為止功能最強大的專業知識工作模型。

啥叫專業知識工作模型？

把官方那堆技術黑話翻譯一下，意思就是：它不再滿足于當你的陪聊對象，它現在想做你的“腦力合伙人”。

這一次，OpenAI 顯然是急了，它甚至不屑于跟你談什么“通用智能”的夢想，而是把“搞錢”這三個字寫在了臉上。

它這次的技能點，全點在了打工人的痛點上：做表（Excel）、畫餅（PPT）、寫代碼，以及那些讓人頭禿的長文檔。

它就是為了創造“經濟價值”而生的。

到底有多強？聊聊 GDPval。

為了證明自己“值錢”，OpenAI 甚至拋棄了那些傳統的 MMLU 考試分數。

他們拋出了一個聽起來就充滿金錢味道的新指標：GDPval。（這名字一聽就是奔著生產總值GDP去的）

可能很多人沒聽說過這個評測集。這是 OpenAI 專門為了衡量“真實世界打工能力”搞出來的。

他們在 44 個核心職業（律師、市場經理、工程師等）里，找了一幫平均工齡 14 年的資深專家，出了 1320 道真實的“地獄級工作任務” 。

注意，不是做選擇題。是讓你真的去改合同、寫全案 PPT、優化生產線圖紙。這些任務，人類專家平均要花 7 個小時才能做完。

結果呢？經過雙盲測試，GPT-5.2 在 70.9% 的情況下，干得比這些人類專家更好，或者至少打個平手。

圖：在 GDPval 中，模型嘗試完成涵蓋美國 GDP 貢獻最大的九大行業中 44 個職業的特定知識工作

這才是最恐怖的。

它的參照系不是剛畢業的大學生，而是行業專家。也就是說，在一個有著十幾年經驗的采購經理面前，GPT-5.2 干出來的活兒，有七成的時候，比他干得還好。

甚至于說，GPT-5.2 Thinking 生成的電子表格和幻燈片在復雜程度和格式方面都有所提高。

說白了：以前的 GPT 是個學霸，現在的 GPT-5.2 是個熟手。

那么，它是怎么做到這一點的？

這背后其實是一場架構級的革命。

OpenAI 官方直言不諱：這是自 GPT-5 以來，GPT 系列在智能體編程（Agentic Coding）領域跨度最大的一次飛躍。

圖：在SWE-Bench Pro中（在新窗口中打開）? ? ?，給定一個代碼庫，模型必須生成一個補丁來解決一個實際的軟件工程任務。

為了證明自己不是自嗨，他們這次直接拉來了 Windsurf 和 Devin 站臺。這兩位可是現在 AI 編程界的頂流。

官方直接宣布，GPT-5.2 將成為這兩個工具的默認核心模型。

這說明啥？說明這玩意兒已經經受住了最殘酷的生產環境考驗。

但真正讓我覺得牛逼的，是背后的技術邏輯發生了質變。

以前我們為了讓 AI 干點復雜的活，得搭建一套脆弱的“多智能體系統”。

就像拉了一群各懷鬼胎的實習生在開會，一個負責想，一個負責寫，一個負責改，管理起來極其麻煩，還容易崩。

而 GPT-5.2 直接解鎖了一種全新的架構：單一超級智能體（Single Mega-agent）。

這就好比把那一屋子實習生全裁了，換來了一個精通 20 多種工具的全能大神。它不僅反應更快、腦子更靈光，而且維護起來簡單了 100 倍。

除了腦子好，它的“手眼”也進化了。

為了配得上“超級智能體”這個稱號，OpenAI 這次給 GPT-5.2 裝上了更強的配件：

1. 手更快了

以前的 AI 調用工具（比如聯網搜素、畫圖、跑代碼）總有種“卡頓感”。但官方這次特別強調：延遲大幅降低，而且工具調用能力變得極強。

這意味著什么？

意味著它在多個工具之間切換，絲滑得像是在切菜。

它不再是一個個蹦字的聊天機器人，而是一個能瞬間調起計算器、瀏覽器、代碼解釋器的“快手”。嗯？

2. 眼睛更尖了

看一眼官方放出的演示圖：它能直接看懂復雜的波浪模擬參數，甚至能精準識別電路板上的每一個元器件。

圖：GPT 5.2 可以識別出元部件

這說明它的視覺能力已經脫離了“認貓認狗”的初級階段，開始進入工業級的精細識別了。

配合長上下文能力，不管是幾千行的代碼屎山，還是幾十頁的復雜電路圖，它都能一口吞下，并且過目不忘。

實際上，這使得專業人士能夠使用 GPT-5.2 處理長篇文檔，例如報告、合同、研究論文、筆錄和多文件項目，同時在數十萬個詞元中保持一致性和準確性。

圖：GPT 5.2 的長上下文處理

所以，GPT-5.2 特別適合深度分析、綜合和復雜的多源工作流程。

但真正的“重頭戲”，是這個：ARC-AGI 2

如果說 GDPval 是測它能不能干活，那 ARC-AGI 2 就是測它到底有沒有腦子。

老粉都知道，ARC 評測集是 AI 圈最難啃的骨頭，甚至沒有之一。

它是由 Keras 之父 Fran?ois Chollet 搞出來的，專門用來反死記硬背的。

比如這種題目：

圖：ARC AGI2 題目

圖：ARC AGI2 題目

以前的模型，MMLU 這種考試能拿 90 分，一碰到 ARC 這種需要“舉一反三”的智力題，立馬現原形，得分低得可憐。

大家猜猜上一代的 GPT-5.1 Thinking 拿了多少分？

17.6%。

但這次，GPT-5.2 干到了多少？52.9%。

兄弟們，這是 3 倍的暴漲。這不是“擠牙膏”，這是直接把牙膏管踩爆了。

為了讓大家有個概念，目前市面上最強的競品 Gemini 3 Pro 和 Claude，在這個榜單上的分數大約在 31% - 37% 之間（取決于版本）。

也就是說，OpenAI 這一次在純智商層面，不僅甩開了對手，更是跨越了一個巨大的鴻溝。

這意味著 GPT-5.2 終于突破了那層窗戶紙：它開始具備真正的通用推理能力了。

它遇到沒見過的新問題，不再是去翻記憶庫里的答案（因為根本沒有），而是像人類一樣，現場觀察規律、現場推理、現場解決。

順便提一嘴，在另一個數學競賽 AIME 2025 里，GPT-5.2 直接拿了 100% 的滿分。

這可是全美高中數學聯賽。以前我們還在討論 AI 能不能及格，現在它已經把卷子做穿了。

相比于它能多寫兩行代碼，我覺得這一點，才是這次更新里最硬核、最不容忽視的里程碑。

總結一下：

GPT-5.2 Instant、思考版和 Pro 版本今日開始推送，首先面向 Plus、Pro、Business 和 Enterprise 套餐用戶。

免費版和 Go 用戶將于明天獲得訪問權限。

GPT-5.2 在我心中，是一個極其合格，甚至有點“過于務實”的迭代。

它沒有像過去那樣，瘋狂去卷那些虛頭巴腦的考試分數，而是把所有的技能點，都死磕在了“怎么幫白領干活”這件事上。

它不跟你談星辰大海，只跟你談降本增效；不跟你炫耀參數，只給你看GDPval。

這個點，我覺得就很酷，非常的剛需。

雖然從“好玩”或者“科幻感”的角度來說，GPT-5.2 可能沒有 Gemini 3 Pro 原生多模態帶來的那種絲滑震撼。

（畢竟谷歌同步發行了 Nano Banana Pro，期待 GPT Image 早日發布）

但如果你是為了工作，為了搞錢，為了早點下班去陪家人。那 GPT-5.2 可能是目前地表最強、也是最值得你掏錢的生產力工具。

好了，就扒到這里，如果覺得這篇文章對你有用，別忘點贊，??并轉發給你的朋友哦～

我們下次再見。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

氛圍編程將死！谷歌總監警告：只會寫Prompt的程序員，2026年將被淘汰

新智元 2026-01-25 13:03:55
330 跟貼 330
當AI開始“帶貨”，摩根大通詳解ChatGPT測試廣告背后的變現邏輯

華爾街見聞官方 2026-01-26 12:22:33
3 跟貼 3

Skills剛火，就有零Skill的Agent來了

量子位 2026-01-26 23:39:04
2 跟貼 2

Claude統治一切！吞下這顆紅藥丸，焊工也是頂尖程序員

新智元 2026-01-26 17:17:18
36 跟貼 36
OpenAI不Open！7年功勛老將投奔宿敵，實驗室淪為API代工廠

新智元 2026-01-26 13:09:56
3 跟貼 3

拳打亞馬遜、腳踢谷歌TPU 微軟發布新一代AI加速器Maia 200

財聯社 2026-01-27 01:12:56
0 跟貼 0

Transformer作者創辦日本最貴AI獨角獸，如今又被谷歌投資

DeepTech深科技 2026-01-26 16:48:19
10 跟貼 10
阿里發布千問最強推理模型Qwen3-Max-Thinking

華爾街見聞官方 2026-01-27 00:20:09
4 跟貼 4

微軟升級自研AI芯片，號稱吊打亞馬遜、超越谷歌

華爾街見聞官方 2026-01-27 06:41:42
0 跟貼 0
撒10億鋪路，“派”馬化騰推銷？

虎嗅APP 2026-01-27 04:52:05
0 跟貼 0
波士頓機器狗練成“輕功”！連續七個后空翻

量子位 2025-09-07 01:03:18
19 跟貼 19
LeCun創業公司官宣核心方向，掀起對Next-token范式的「叛變」

機器之心Pro 2026-01-26 14:30:50
1 跟貼 1
50億元“彈藥”就緒！印奇掛帥，為AI大模型注入“硬核肉身” 階躍星辰殺入終局

每日經濟新聞 2026-01-26 22:55:49
0 跟貼 0
吃瓜、開會、追熱點，我靠AI穩坐信息高地

36氪 2025-11-27 18:27:11
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
大模型也會賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
Clawdbot硅谷爆火！Mac mini因它一夜賣爆 Clawdbot硅谷爆火！這個堪稱“開源賈維

量子位 2026-01-26 21:07:35
0 跟貼 0
未來醫生摘得全球第一，臨床安全有效性評估新基準

量子位 2025-11-19 11:14:03
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
49條中日航線取消全部航班

財聯社 2026-01-26 17:10:34
42273 跟貼 42273
MP5沖鋒槍：從巔峰到淡出，不是失敗兒是迭代！

科技樹科普 2026-01-24 09:58:45
1 跟貼 1
那個用半成品刷爆SOTA的Qwen3超大杯推理版，現在正式上線

量子位 2026-01-26 23:45:47
0 跟貼 0
GPT-5編程成績有貓膩！自刪23道測試題，關鍵基準還是自己提的

量子位 2025-08-12 13:12:51
15 跟貼 15
劉強東臘八下單萬件年貨送老鄉，今年還將為光明村打造村晚

極目新聞 2026-01-26 13:27:18
65 跟貼 65
實力對等下的和平：中美軍事博弈的深層邏輯

青杍無夢 2026-01-26 11:48:03
0 跟貼 0
84%程序員用AI寫代碼，Node.js之父：手寫代碼已死 “人類編程時代已經結束了?！盢ode.j

量子位 2026-01-26 21:07:44
0 跟貼 0
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
0 跟貼 0
大哥網購集成灶，是有潔癖人的福音，設計師想法解決用戶難題！

老沾看生活 2026-01-23 15:09:25
0 跟貼 0
關于多模態大模型Token壓縮技術進展，看這一篇就夠了

機器之心Pro 2026-01-26 16:15:06
0 跟貼 0
丹麥網友"眾籌"1萬億美元收購加州美國網友熱烈回應

紅星新聞 2026-01-26 17:52:54
3779 跟貼 3779
女子和男友生氣，直接給自己氣成模型了，男友差點笑進ICU

籃球搞笑 2026-01-26 16:36:58
1 跟貼 1
一鍵生成PPT和科研繪圖，北大開源Paper2Any，全流程可編輯

機器之心Pro 2026-01-04 17:32:26
3 跟貼 3
海外求學數十載，歸來感嘆：我國現在是幾千年來，最輝煌的時刻！

樸樸實實的情 2026-01-26 03:43:18
0 跟貼 0
谷歌云高管：AI就是游戲開發者的“鋼鐵俠戰甲”

IT之家 2026-01-26 20:53:08
0 跟貼 0
【城事】上海華亭賓館改造收官，2月10日試運營

上觀新聞 2026-01-26 19:57:15
114 跟貼 114

重磅！4冠主帥官宣辭職不愁下家，助教硬接爛攤子球迷：走為上計

重磅！4冠主帥官宣辭職不愁下家，助教硬接爛攤子球迷：走為上計

籃球看比賽

2026-01-26 12:35:29

女留學生回國就診“肛裂”！網友：公司現招聘海龜要體檢生殖系統

女留學生回國就診“肛裂”！網友：公司現招聘海龜要體檢生殖系統

火山詩話

2026-01-24 07:32:05

不跑不跳！一個被嚴重低估的“長壽動作”藏著6大好處，醫生都在推薦

不跑不跳！一個被嚴重低估的“長壽動作”藏著6大好處，醫生都在推薦

人民日報健康客戶端

2026-01-26 07:34:49

遼籃官宣：楊鳴身體原因辭職充分溝通尊重個人意愿烏戈接任

遼籃官宣：楊鳴身體原因辭職充分溝通尊重個人意愿烏戈接任

醉臥浮生

2026-01-26 16:29:44

清水梨紗：上次亞洲杯我們不敵中國，現在要以挑戰者心態迎戰

清水梨紗：上次亞洲杯我們不敵中國，現在要以挑戰者心態迎戰

懂球帝

2026-01-26 17:30:12

一個拿腔作勢一個雙目無神，兩人連累48集大劇，老戲骨再強也沒用

一個拿腔作勢一個雙目無神，兩人連累48集大劇，老戲骨再強也沒用

查爾菲的筆記

2026-01-24 20:12:13

閑魚不愧是全國最大的黑市，網民：只有你想不到，沒有你買不到

閑魚不愧是全國最大的黑市，網民：只有你想不到，沒有你買不到

小熊侃史

2026-01-16 07:40:07

“牢A”風波最倒霉的不是那幫留學生和陪讀媽媽！而是某品牌項鏈

“牢A”風波最倒霉的不是那幫留學生和陪讀媽媽！而是某品牌項鏈

火山詩話

2026-01-27 06:17:38

李思思現身邢臺主持，又矮又胖，1米7看著就像1米5，臉還變圓潤了

李思思現身邢臺主持，又矮又胖，1米7看著就像1米5，臉還變圓潤了

小娛樂悠悠

2026-01-26 11:36:45

大冷！雷霆惜敗猛龍無緣追平宇宙勇73勝亞歷山大24+6奎克利23+11

大冷！雷霆惜敗猛龍無緣追平宇宙勇73勝亞歷山大24+6奎克利23+11

醉臥浮生

2026-01-26 10:34:52

運價直逼5毛錢/公里，網約車司機發出靈魂拷問：這么低的價格究竟誰在跑？

運價直逼5毛錢/公里，網約車司機發出靈魂拷問：這么低的價格究竟誰在跑？

網約車觀察室

2026-01-26 10:17:32

央視曝光！致命游戲“夢回大唐”正通過學生社交群擴散！央媒發聲：別讓這些暗語藏匿在隱秘的角落

央視曝光！致命游戲“夢回大唐”正通過學生社交群擴散！央媒發聲：別讓這些暗語藏匿在隱秘的角落

每日經濟新聞

2026-01-26 11:45:09

炒股是世界上最好的工作，沒有之一！但不適合任何人！

炒股是世界上最好的工作，沒有之一！但不適合任何人！

一方聊市

2026-01-26 20:20:18

央視發聲后，新華社點評李亞鵬更“猛”，真正道出了老百姓的心聲

央視發聲后，新華社點評李亞鵬更“猛”，真正道出了老百姓的心聲

娛樂故事

2026-01-26 17:22:02

10億產業毀于貪婪？云南毒紅薯后續：無辜農戶畝虧數千

10億產業毀于貪婪？云南毒紅薯后續：無辜農戶畝虧數千

愛下廚的阿椅

2026-01-26 06:45:40

大學女老師出軌大二男生：身材曼妙，照片流出，大量骯臟細節披露

大學女老師出軌大二男生：身材曼妙，照片流出，大量骯臟細節披露

博士觀察

2026-01-26 18:37:50

曲阜會議上，饒漱石嚴肅告誡華野諸將：全軍要服從粟裕同志指揮

曲阜會議上，饒漱石嚴肅告誡華野諸將：全軍要服從粟裕同志指揮

大運河時空

2026-01-26 07:10:03

山東一周“擼”了13個官兒！

濟寧人

2026-01-26 20:41:33

羈絆！他9天前亞洲杯失點致隊被U23國足淘汰，今絕平國足找回面子

羈絆！他9天前亞洲杯失點致隊被U23國足淘汰，今絕平國足找回面子

我愛英超

2026-01-26 23:47:10

演員孫濤宣布告別春晚：18次登春晚，把舞臺讓給年輕人

演員孫濤宣布告別春晚：18次登春晚，把舞臺讓給年輕人

素素娛樂

2026-01-26 20:35:38

AI范兒是一個專注于人工智能領域的資訊和學習平臺，提供最新的人工智能資訊

649文章數 424關注度

往期回顧全部

科技要聞

理想開始關店“過冬”，否認“百家”規模

頭條要聞

上海一女子嫌風水不好屢次掰歪小區兩塊反光鏡

頭條要聞

上海一女子嫌風水不好屢次掰歪小區兩塊反光鏡

體育要聞

叛逆的大公子，要砸了貝克漢姆這塊招牌

娛樂要聞

張雨綺被抵制成功！遼視春晚已將她除名

財經要聞

從美式斬殺線看中國社會的制度韌性構建

汽車要聞

賓利第四臺Batur敞篷版發布解鎖四項定制創新

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

健康

教育

時尚

公開課

本地新聞

云游中國｜格爾木的四季朋友圈，張張值得你點贊

耳石脫落為何讓人天旋地轉+惡心？

教育要聞

舟山嵊泗縣取消

甜了10年，超多曖昧細節，全網求他倆原地結婚

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
中國最正宗的紋飾是什么？
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<tt id="va3an"><option id="va3an"></option></tt>

<nobr id="va3an"></nobr>