<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>

色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3

<output id="4seyt"><blockquote id="4seyt"></blockquote></output>

<tfoot id="4seyt"></tfoot>

<nobr id="4seyt"></nobr>

網易首頁

網易新聞
網易公開課
網易紅彩
網易嚴選
郵箱大師
網易云課堂

注冊免費郵箱

注冊VIP郵箱（特權郵箱，付費）
免費下載網易官方手機郵箱應用

移動端
網易公開課
網易嚴選
支付
郵箱

網易首頁 > 網易號 > 正文申請入駐

GPT-5.2發布，能力超人類11倍！谷歌揭露一個致命弱點，這才是普通人的活路

2025-12-13 06:38:24　來源: 王煜全

北京舉報

0

分享至

昨天，OpenAI憋了這么久，終于扔出新的重磅產品：GPT-5.2

在谷歌和其他競爭對手的圍追堵截下，他們這次徹底盯上了打工人：

GPT-5.2官方文檔白紙黑字寫著：在涵蓋44個職業的專業知識工作測試中，GPT-5.2 Thinking完成任務的速度是人類專家的11倍以上，成本不到人類的1%。

更扎心的是：在這個名為GDPval的測試里，GPT-5.2 Thinking與頂級行業專家正面PK，70.9%的任務中，AI贏了或打平。

一位參與評測的評委看完AI的輸出后感嘆："這像是一家有專業團隊的公司做出來的……雖然還有些小錯要改，但布局和建議都出奇地專業。"

紅色警報，GPT5.2靠啥大幅改進？

就在上個月，谷歌放出了Gemini 3，在多項基準測試中全面領先，一度把OpenAI打得措手不及。

OpenAI的CEO山姆·奧特曼在內部發了一封"Code Red"（紅色警報）備忘錄，要求團隊暫停其他項目，全力沖刺ChatGPT的下一次迭代。

GPT-5.2這個代號就能看出來，OpenAI現在是提前亮劍。

這次發布的GPT-5.2有三個版本：

Instant：快、穩，適合日常查資料、寫郵件；

Thinking：深度推理，適合編程、數據分析、長文檔處理；

Pro：頂配，追求極致準確率，適合高風險決策。

在編程基準測試SWE-bench Verified上，GPT-5.2 Thinking拿下80%的成績。在數學競賽題AIME 2025上，得分100%。

光看數字嚇人沒用，咱們得搞明白：這玩意兒到底是怎么突然變這么強的？

周四的前哨特訓營直播中，王煜全和大家分享了預訓練放緩的真正原因，告訴大家底層芯片的算力和存儲沒有大更新的情況下，AI大模型接下來的進步主要都會依靠后訓練、強化學習和推理。

知名的ARC測試中，領先模型主要都靠延長推理提高成績

OpenAI這次發布驗證了這個判斷。GPT-5.2官方文檔里有兩個關鍵點：

第一，推理中糾錯。 文檔中提到"通過訓練，模型學會精煉自己的思考過程、嘗試不同策略、并識別自己的錯誤。"

這背后大概率就是通過強化學習，優化了模型的推理過程，讓它學會了在內部“打草稿”并在輸出前自我修正。

第二，通用推理反超垂直微調。 在模擬OpenAI內部代碼工作的測試中，靠"思考"的通用版GPT-5.2，竟然擊敗了上一代專門針對代碼優化的垂直模型（Codex Max）。

這證明了強化學習提升的邏輯推理能力，還能繼續提高模型在不同場景的泛用性，簡單說就是讓模型能像人類工程師一樣分析問題，而不是死記硬背代碼庫。

說人話就是：GPT-5.2這一代，核心變成了用強化學習教AI怎么"想"，這才是它能在專業任務上碾壓人類的底層原因。

死亡名單，哪些職業危險了？

好了，技術講完了，咱們聊點更扎心的：哪些人的飯碗最危險？

要回答這個問題，得先說說OpenAI發明的GDPval測試。

GDPval，全稱是"GDP Validation"，是OpenAI在2025年9月發布的一套評測體系。

它的核心思路很直接：不跟AI比考試分數，直接比"干活"。

OpenAI找來了一批真正的專業人士，平均從業經驗14年，覆蓋美國GDP貢獻最大的9個行業、44個職業。

這些人出題，出的都是他們日常工作中真實會干的活兒：做銷售PPT、搭財務三表模型、排急診室值班表….

然后讓AI和人類專家各干一遍，再請專家盲評：誰做得更好？

結果就是我們開頭說的：GPT-5.2 Thinking在70.9%的任務中，贏了或打平人類專家。

更恐怖的是：AI完成這些任務的速度是人類的11倍以上，成本不到人類的1%。

那么問題來了：哪些崗位最危險？

從GDPval測試覆蓋的44個職業來看，知識密集型白領崗位首當其沖。

投行分析師：OpenAI內部測試顯示，GPT-5.2在投行初級分析師的建模任務上，平均得分比GPT-5.1高出9.3%。

客服和售后：AI在工具調用測試Tau2-bench中拿下98.7%的準確率，能協調航班改簽、行李追蹤、特殊座位安排等復雜流程。

程序員：編程能力繼續飆升，Windsurf已經把GPT-5.2當成默認底座。

你的新角色：從"執行者"變成"審核員"

好在，AI雖然很厲害，但絕非萬能。

這幾天谷歌DeepMind聯合Kaggle，正式發布了一個名為"FACTS Grounding"的測試榜單。

FACTS是什么？說白了，就是專門測AI"有沒有在一本正經地胡說八道"。

測試方法很直接：給AI一份長文檔（最長32000個token），讓它基于文檔生成回答，然后檢查它說的每一句話是不是都有據可查、沒有編造。

結果呢？

目前市面上最強的AI模型，在這個測試里，準確率普遍卡在70%上下。

包括谷歌自家的Gemini系列，OpenAI的GPT系列，沒有任何一個模型能保證100%的事實準確性。

這就好比，你招了一個效率極高的員工，干活速度是別人的十倍，工資只要別人的零頭。

但果這個員工有30%的概率會"信口開河"，合同金額寫錯、法規條款引用錯誤、客戶信息張冠李戴。

現在你敢讓他獨立負責重要項目嗎？

AI的缺陷，恰恰是普通人最大的機會。

OpenAI自己也說了，GPT-5.2的定位是"在人類監督下協助專業工作"（when paired with human oversight）。

以前的打工人是什么？執行者。 老板說寫個方案，你就寫；說做個表，你就做。

以后的你必須成為AI的老板，要想清楚哪些事是有價值的，哪些事該安排給哪個AI干，干完如何判斷靠不靠譜、有沒有價值。

未來職場，不會淘汰"用AI的人"，一定會淘汰"試圖和AI競爭的人"。

給家長的話：與其焦慮，不如讓孩子提前準備

我們這代人還在適應AI，但下一代可以從小學會"和AI協作"。

就像計算機、互聯網成為今天必不可少的職場工具，AI未來也會如此。

【前哨AI冬令營】 專為8-16歲設計，7天讓孩子親手做出自己的小游戲和微信小程序，邊玩邊學，作品還能發給同學一起玩。

零基礎也能上手：從"玩游戲"到"做游戲"

抓住核心競爭力：培養和AI協作的能力

收獲硬成果：可上線的作品，實打實的積累

? 名額有限，先到先得，掃碼報名 ↓

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

GPT-5.3上線Codex！OpenAI回應Claude新模型只用了15分鐘

量子位 2026-02-06 10:43:56
3 跟貼 3
鍵盤長草，編程已死，agentic engineering時代已至

鈦媒體APP 2026-02-06 23:26:12
1 跟貼 1

程序員絕命！Claude Code瘋狂滲透GitHub，26年底將提交20%

新智元 2026-02-07 17:11:17
13 跟貼 13

蘋果開放第三方大模型：開發工具接入AI，小白10分鐘造APP不是夢

雷科技 2026-02-07 16:46:36
0 跟貼 0
堪比“ChatGPT”時刻！SemiAnalysis深度解讀：Claude Code將是AI “智能體”的轉折點

華爾街見聞官方 2026-02-06 20:19:24
3 跟貼 3

小米給KV Cache減負80%！MiMo團隊推出混合稀疏注意力架構

量子位 2026-02-07 18:48:49
0 跟貼 0

延遲下降20×，token減少4.4×！突破多智能體「共識」瓶頸

新智元 2026-02-07 12:23:24
0 跟貼 0
人活著的唯一理由是善良

葉檀財經 2026-02-01 17:07:04
16 跟貼 16

2025年出生的機器人已經“淤”了

虎嗅APP 2026-02-07 17:00:10
6 跟貼 6
算力競賽分叉：馬斯克太空煉丹，中國3萬AI卡同時點亮！

新智元 2026-02-07 12:23:58
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0
大模型的下半場，屬于擁有云+AI全棧引擎的玩家

量子位 2026-01-30 03:29:45
0 跟貼 0
行業最大規模具身數據集：10Kh RealOmni-Open DataSet

量子位 2026-01-06 10:53:25
0 跟貼 0
高通萬衛星談終端大模型優勢：個性化與數據推理

量子位 2025-12-11 03:38:41
0 跟貼 0
陶哲軒：AI看似在推理，其實是在背答案

量子位 2026-01-05 09:20:21
0 跟貼 0
行業最大規模具身數據集！出自簡智機器人GenRobot.AI

量子位 2026-01-05 17:11:41
0 跟貼 0
可靈3.0加入AI拜年戰場！人在工位搓好萊塢大片，分鏡邏輯封神

量子位 2026-02-07 18:45:04
0 跟貼 0
ChatGPT市場份額暴跌24個點！Gemini、Grok瘋狂追漲

智東西 2026-02-06 15:30:28
5 跟貼 5
DeepMind負責人：2036 AI意識覺醒？LeCun怒懟：LLM路線全錯！

新智元 2025-12-16 16:55:25
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
陳丹琦入職Mira翁荔公司，原來是有IOI三金王賽友

量子位 2026-02-06 14:29:49
0 跟貼 0
下一代谷歌頭顯，XREAL x Google 定義混合現實頭顯

愛范兒 2025-12-10 05:12:08
0 跟貼 0
機器人進汽車廠，給波士頓動力，裝上谷歌最強大腦

機器之心Pro 2026-01-06 19:02:05
0 跟貼 0
OpenAI、Anthropic發新模型，一個替你寫代碼，一個替公司管流程

DeepTech深科技 2026-02-06 14:59:53
2 跟貼 2
GPT-5編程成績有貓膩！自刪23道測試題，關鍵基準還是自己提的

量子位 2025-08-12 13:12:51
15 跟貼 15
我記得美隊要拿一個神奇女俠的模型

C位影視解說 2026-02-04 10:39:31
3 跟貼 3
袋鼬媽媽在捕食者面前的殘酷生存策略

星星科普 2026-02-06 04:50:13
11 跟貼 11
普通人，上船三天就想回家

荊棘觀察 2026-02-06 10:27:28
2 跟貼 2
棋仙鐘珍大戰棋王，妙棄巧取直擊弱點，誰能笑到最后？

象棋那點事 2026-02-07 06:22:02
0 跟貼 0
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
31 跟貼 31
地表最強編程王者PK！Opus 4.6雙榜單封神， Codex 5.3速度滿分

新智元 2026-02-07 10:29:05
1 跟貼 1
廣東一小伙年會上抽中價值9988元手機，拿回家打開后發現里面裝的是糖和瓷磚，當事人回應：手機可以不要，但是策劃人必須向自己道歉

揚子晚報 2026-02-06 23:10:58
3402 跟貼 3402
普通人一口氣到底能不能開1000公里？大哥分析太透徹了

行者服不服 2026-02-06 10:36:55
0 跟貼 0
真實展現聰明人與普通人的差距

瘋貓影視 2026-02-05 16:39:58
1 跟貼 1
與丈夫住農村，穿著樸素趕大集，59歲于文華才是真正的人間清醒

仙味少女心 2026-02-07 13:17:04
2 跟貼 2
這才是機器人該替代的工作，讓普通人干點，更輕松點的工作！

豆豆尬笑 2026-02-06 09:21:32
1 跟貼 1
普通人的永垂不朽

小夕遇見 2026-02-07 14:02:15
0 跟貼 0
拒絕平庸！高分懸疑英劇，案中案+高智商推理，每一集都藏著反轉

愛分享的TIARA 2026-02-06 15:48:34
1 跟貼 1
聯合國教科文組織啟動了溯源核查程序，沒有證據，直接取消！

包子同學呀 2026-02-05 11:28:00
0 跟貼 0
OpenAI春暖花開！GPT-5.3-Codex編碼全球第一，GPT-5降本蛋白生產王者歸來！

新智元 2026-02-06 14:55:29
0 跟貼 0

王毅外長：今后世上再無“中國臺灣省”之外的任何模糊稱謂。

王毅外長：今后世上再無“中國臺灣省”之外的任何模糊稱謂。

南權先生

2026-02-02 15:59:44

新臺幣有需要改版嗎？街訪臺灣民眾曝真實心聲一面倒

新臺幣有需要改版嗎？街訪臺灣民眾曝真實心聲一面倒

新時光點滴

2026-02-07 07:12:46

古特雷斯給日本定了性，不再是二戰的受害者，而是二戰的發起者。

古特雷斯給日本定了性，不再是二戰的受害者，而是二戰的發起者。

安安說

2026-02-01 14:06:34

你身邊悶聲發大財的都是什么行業？網友:賣饅頭賺好幾百萬

你身邊悶聲發大財的都是什么行業？網友:賣饅頭賺好幾百萬

夜深愛雜談

2026-02-01 19:39:06

1986年陳永貴病逝，追悼會規格成難題，鄧小平只說了一句話，全場安靜

1986年陳永貴病逝，追悼會規格成難題，鄧小平只說了一句話，全場安靜

寄史言志

2026-01-04 16:34:31

納因戈蘭：如今意甲整體水平很低；我的身價放到現在能值1.5億

納因戈蘭：如今意甲整體水平很低；我的身價放到現在能值1.5億

懂球帝

2026-02-07 00:30:20

被雙開的胡繼勇：在四川工作十四年，當年的上級曾任中石油副總裁

被雙開的胡繼勇：在四川工作十四年，當年的上級曾任中石油副總裁

嘆為觀止易

2026-01-21 10:21:06

普京承認，俄羅斯經濟增長1%，比預想要低，來中國這趟還是來晚了

普京承認，俄羅斯經濟增長1%，比預想要低，來中國這趟還是來晚了

王裕慶

2026-02-07 19:26:37

天生“苦相臉”的7位女星，個個愁容滿面，面無表情都像是要哭了

天生“苦相臉”的7位女星，個個愁容滿面，面無表情都像是要哭了

白宸侃片

2026-02-04 13:34:53

不結婚怎么解決生理需求？56歲的歌唱家張也，用行動給出了答案

不結婚怎么解決生理需求？56歲的歌唱家張也，用行動給出了答案

攬星辰入夢

2026-01-28 23:05:47

媒體人：申花吸金能力在中超第一檔，胸前廣告贊助額每年兩億元

媒體人：申花吸金能力在中超第一檔，胸前廣告贊助額每年兩億元

懂球帝

2026-02-07 01:04:18

中國的“斤”用了3000年，為何與國際接軌后，剛好相當于500克？

中國的“斤”用了3000年，為何與國際接軌后，剛好相當于500克？

千秋文化

2026-01-31 21:22:19

終于談妥了！蕭旭岑返臺，下飛機后立馬通告全島，賴清德自尋死路

終于談妥了！蕭旭岑返臺，下飛機后立馬通告全島，賴清德自尋死路

大魚簡科

2026-02-06 14:21:10

厄德高：迫不及待想去溫布利；桑德蘭很出色我們要保持高水平

厄德高：迫不及待想去溫布利；桑德蘭很出色我們要保持高水平

懂球帝

2026-02-07 19:38:07

A股58家高管集體出逃減持，商業航天、固態電池、芯片龍頭領跑

A股58家高管集體出逃減持，商業航天、固態電池、芯片龍頭領跑

一盅情懷

2026-02-07 17:52:51

女子因桃花眼走紅，訂婚兩年熱度依舊，網友喊話：88號快回來上班

女子因桃花眼走紅，訂婚兩年熱度依舊，網友喊話：88號快回來上班

梅子的小情緒

2025-12-19 14:04:18

5-5！周躍龍單桿82分救賽點，德比戰追平張安達，沖擊2大紀錄？

5-5！周躍龍單桿82分救賽點，德比戰追平張安達，沖擊2大紀錄？

劉姚堯的文字城堡

2026-02-07 17:47:13

四川省委常委陳煒已任省人大常委會黨組副書記、副主任

四川省委常委陳煒已任省人大常委會黨組副書記、副主任

澎湃新聞

2026-02-07 18:23:03

火箭！你好，保羅！

天光破云來

2026-02-07 11:27:14

大多數人窮極一生都沒搞懂，財富增值的核心從來不是多賺錢

大多數人窮極一生都沒搞懂，財富增值的核心從來不是多賺錢

流蘇晚晴

2026-01-31 17:36:23

王煜全帶你一起看創新

1007文章數 760關注度

往期回顧全部

科技要聞

小米千匹馬力新車亮相！問界M6雙動力齊報

頭條要聞

演員金晨交通事故處罰結果：罰款1500元不構成犯罪

頭條要聞

演員金晨交通事故處罰結果：罰款1500元不構成犯罪

體育要聞

中國體育代表團亮相米蘭冬奧會開幕式

娛樂要聞

何超欣說和何猷君沒競爭，實力遭質疑

財經要聞

金價高波動時代來了

汽車要聞

工信部公告落地全新騰勢Z9GT煥新升級

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

家居

旅游

手機

健康

公開課

家居要聞

現代輕奢溫馨治愈系

簡雅序章自然且閑適
灰白意境光影奏鳴曲
極簡木藝術典雅自在

旅游要聞

票根就是通行證！蘇州推出春節期間憑火車票飛機票惠游活動

手機要聞

iQOO 15 Ultra線下上手體驗：不吐不快，說說真實感受

轉頭就暈的耳石癥，能開車上班嗎？

公開課

李玫瑾：為什么性格比能力更重要？

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
中國最正宗的紋飾是什么？
李彥宏：百度離破產30天

© 1997-2026 網易公司版權所有 About NetEase | 公司簡介 | 聯系方法 | 招聘信息 | 客戶服務 | 隱私政策 | 不良信息舉報 Complaint Center | 廉正舉報 | 侵權投訴

無障礙瀏覽進入關懷版

<ruby id="zyrs6"><tr id="zyrs6"></tr></ruby>

<s id="zyrs6"><nav id="zyrs6"></nav></s>

<tfoot id="zyrs6"><source id="zyrs6"></source></tfoot>

<em id="zyrs6"><dfn id="zyrs6"></dfn></em>

<sup id="zyrs6"></sup><em id="zyrs6"><tfoot id="zyrs6"></tfoot></em>