網易首頁 > 網易號 > 正文申請入駐

GPT-5.2獲封“最強打工人”，谷歌同日以Gemini“性價比”系列應戰

2025-12-12 16:10:01　來源: 鈦媒體APP

北京舉報

分享至

圖片由AI生成

“我從未像現在這樣對我們的研發和產品路線圖，以及實現我們使命的整體方向感到如此樂觀。”

12月12日，在正式上線GPT-5.2的同時，OpenAI CEO薩姆·奧爾特曼（Sam Altman）發布了一篇十周年紀念文章中這樣說。

他極力向外界展現著自己依舊自信的一面。畢竟，雖然GPT大模型和ChatGPT聊天機器人至今仍是當前AI大潮的造浪者，但想必此刻，奧爾特曼感受到的競爭壓力堪稱空前。

今年以來，DeepSeek、Grok、Claude等競爭者的強勢追趕，尤其是谷歌上個月推出的Gemini 3大放異彩，都將AI大模型競爭推上了更新的高度。

最近，奧爾特曼先是在內部備忘錄中提示員工，需要接受最好的大模型不出自家之手的事實，繼而，又發出公司首個“紅色警報”，強調“立即行動，集中所有資源奪回領先地位”。

截圖來自社交平臺X

只有更強大的產品，才能支撐自信的底氣。

在十周年紀念日這天，OpenAI重磅發布預熱了一周多的GPT-5.2，評測表現再次反超所有競爭對手。

但谷歌不甘示弱，幾乎在同一時間發布了新品，讓這場大模型之爭的戰況再次升級。

GPT-5.2獲評“最強AI打工人”，但“工資”很高

GPT-5.2此次仍然“全線出擊”，一次性發布了Instant、Thinking和Pro三款不同層級的模型。

近一個月前Gemini 3發布時，其評測得分幾乎“碾壓”GPT-5的表現引發市場巨大關注。

而這次，根據OpenAI發布的基準測試結果，GPT-5.2實現了全面反超，其Thinking模型基準測試得分均高于Gemini 3 PRO和Anthropic的Claude Opus 4.5。

其中，GPT-5.2在博士級別的專家推理評估GPQA Diamond得分高達92.4%，相比GPT-5.1 Thinking的88.1%和Gemini 3 PRO剛剛刷出的91.9%高分再進一步。在不用工具的情況下，GPT-5.2在最新美國數學邀請賽（AIME2025）中拿到了滿分。

OpenAI尤其強調了GPT-5.2在專業工作方面的領先地位，稱其Thinking模型是“目前最能夠勝任現實中各類專業用途的模型”。

在用于評估專業型技能的GDPval測試中，該模型得到了70.9%的高分，比GPT-5.1 Thinking高了足足32.1%，領先Gemini 3 PRO有17.4%。此外，對比尤其擅長編程等企業工作，此前在該評估中更勝一籌的Claude Opus 4.5，OpenAI的新品也高出了11.3%。

圖片來自OpenAI

OpenAI給出的案例演示中，GPT-5.2聚焦了制作表格、整理分析數據、制作項目流程圖等十分落地的現實工作場景。

公司還表示，新模型在編寫代碼、制作PPT、圖像感知、理解長上下文、使用工具、處理復雜的多步驟項目方面都表現出色，而且錯誤率較前代產品大大減少。

模型發布后，GPT-5.2在實際工作場景中的表現也確實獲得了不少贊許，一些使用者給予了其“最強AI打工人”“職場最佳拍檔”等稱號。

不過，這個“打工人”的“高工資”可能會成為問題。

數據顯示，在輸入輸出價格方面，GPT-5.2要比前代貴了40%，輸入價格21美元，輸出價格高達168美元。

這再次引發了一些擔憂，此前，OpenAI堆算力發展大模型的做法已經受到質疑，無論是DeepSeek還是Gemini，似乎都證明著AI應用可以采取更具性價比的模式。

如果再考慮市場對以OpenAI和英偉達等引領的資本支出狂潮，以及市場對泡沫焦慮的警惕，GPT-5.2是靠算力“硬懟”實現的反擊，那這顯然對奧爾特曼來說，也是個隱憂。

可以看到的是，一些用戶在吐槽Thinking和PRO的應答時間明顯較慢，比其前代產品還要慢。而對于逐漸嵌入日常生活、工作的AI產品來說，機會成本和效率顯然已愈發重要。

普通即時版GPT-5.2仍然在一些常識問題上犯錯，也引發了一些用戶玩梗吐槽。

當然，OpenAI的動作還沒有結束。奧爾特曼表示，下周，會繼續給用戶帶來“小圣誕禮物”，ChatGPT的“成人模式”也預計將于明年一季度面世。

谷歌給OpenAI扔了個炸彈，提前1小時搶發Gemini Deep Research

OpenAI的勁敵們，早已準備好子彈，回擊這次GPT的重要更新。

谷歌搶在GPT-5.2前一個小時左右進行了產品更新，稱其深度研究智能體Gemini Deep Research全面增強，并首次向開發者開放，再次引發了關注，試圖不讓OpenAI獨占“頭條”。

據谷歌介紹，Gemini Deep Research基于Gemini 3 PRO構建，通過多步強化學習訓練，顯著減少“幻覺”，在復雜研究任務中表現出更高精度。

在人類終極大考（HLE）中，Gemini Deep Research得到46.4%分，比GPT-5.2 Thinking的45.5%要高，僅低于GPT-5 Pro的50%。

圖片來自谷歌

但是，其更大的優勢在成本極低，谷歌產品經理透露，新版智能體在與GPT-5 Pro表現相當的同時，成本僅為后者的十分之一左右，展現出強大的性價比優勢。

相對于OpenAI，更好的性價比、另辟蹊徑的訓練模式、公司的現金流、自研專用芯片等，都是谷歌“逆襲”敘事的核心。

如今，在大模型比拼性能的同時，谷歌的核心優勢仍在繼續，這也持續為OpenAI帶來壓力。

此外，為科學評估研究型智能體的能力，谷歌還同步開源了基準測試工具DeepSearchQA，包含覆蓋17個領域的900項復雜任務。

當然，GPT-5.2未必是奧爾特曼捍衛大模型王座的殺手锏。

此前有消息稱，OpenAI在加速開發自身全新的模型“Garlic”，致力于通過新的方式重建絕對領先的優勢。谷歌、Anthropic顯然還會繼續拿出更好的產品。而Meta和DeepSeek等競爭者也同樣有著令人期待的新品可能面世。

大模型浪潮的另一大贏家英偉達，最近與美銀舉辦了一次投資者線上交流會。英偉達方面提到，只依據Gemini 3的表現比GPT5更優，就認為谷歌自研的TPU要好于英偉達的GPU是不合理的。

尤其目前大部分的大模型都是用上一代H系列芯片訓練的，用Blackwell訓練的大模型要到2026年才會上線，其優勢到時才會顯現，更不用說還未投入使用的新一代超級芯片Rubin。

市場對英偉達的說法看法不一，有觀點認為模型強大與否與芯片代際不直接掛鉤，也有觀點認為更關鍵的還是性價比問題。不過，不管怎樣，英偉達的說法已讓明年的大模型之爭看起來更值得期待了。

2025年年末之際，AI大模型之戰和AI芯片之戰的戰局，都變得更加刺激，2026年，想必戰況還會繼續升級。這場戰事不僅是大模型能力之爭，更是關系到大模型的訓練、發展路徑，以及AI芯片的未來之戰。（作者｜胡珈萌，編輯｜李程程）

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

OpenAI紅色警報下的反擊：發布GPT-5.2迎戰Gemini 3

DeepTech深科技 2025-12-12 13:04:48
0 跟貼 0
英偉達AI世界模擬器？AI P圖學會「腦補」過程了！

新智元 2025-11-04 19:33:28
0 跟貼 0

GPT-5.2發布即降智？背后華人被挖出，清北校友核心貢獻

新智元 2025-12-12 13:03:48
0 跟貼 0

Gemini地理覺醒：一夜看懂世界！

新智元 2025-10-21 13:54:16
0 跟貼 0
GPT-5.2果然反超谷歌Gemini 3 Pro！北大數院校友核心貢獻

量子位 2025-12-12 12:49:03
6 跟貼 6

黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
7 跟貼 7

城區輔助駕駛下探至十萬級，規模化拐點將至

觀察者網 2025-12-11 21:22:08
0 跟貼 0
谷歌智能體發力：增強版Gemini Deep Research和專屬API都來了

量子位 2025-12-12 15:44:10
0 跟貼 0

7年前的傳感器+3年前的芯片，攢出來的怪東西能好用嗎？BleeqUP智能運動眼鏡體驗【X.PIN】

差評XPIN 2025-12-11 21:37:50
0 跟貼 0
谷歌最新版「深度研究」反擊GPT5.2

新智元 2025-12-12 10:15:41
0 跟貼 0
解綁英偉達H200背后是一場更大的陽謀

科技響鈴說 2025-12-10 17:24:43
4 跟貼 4
OpenAI與谷歌競爭不斷，半導體設備ETF(159516)漲超2%

每日經濟新聞 2025-12-12 13:54:36
0 跟貼 0
余凱挑戰13萬智駕壁壘，吉利10萬車裝HSD

史鹷的生活科普 2025-12-12 15:53:23
0 跟貼 0
招聘也在回歸性價比

樸素知道 2025-12-09 23:37:06
108 跟貼 108
媽媽想買臺電腦追劇，女子花200元給組裝了一個，網友：性價比拉滿了

大吵小鬧 2025-12-11 17:30:55
9 跟貼 9
谷歌新XR眼鏡薄如普通眼鏡，2026年就能買到

極果酷玩 2025-12-10 03:55:10
0 跟貼 0
英偉達CEO黃仁勛：我九歲的時候就嘗試過抽煙

知了3C 2025-12-09 14:06:17
0 跟貼 0
下一代谷歌頭顯，XREAL x Google 定義混合現實頭顯

愛范兒 2025-12-10 05:12:08
0 跟貼 0
航天智裝：應用于北斗導航衛星的SoC芯片產銷量穩定

財聯社 2025-12-12 16:05:20
0 跟貼 0
泰矽微發布TClux系列車規多通道LED驅動芯片

芯師爺 2025-12-10 14:30:06
0 跟貼 0
黑芝麻智能與元戎啟行將聯合打造高階輔助駕駛解決方案

全球TMT 2025-12-12 17:13:06
0 跟貼 0
全球首款！清華玉衡芯片突破光譜成像數十年瓶頸，分辨率高100倍

萬大叔來了 2025-12-11 18:37:09
7 跟貼 7
泰凌微：公司芯片產品在智能家居等多個領域向谷歌供貨

界面新聞 2025-12-10 16:58:54
0 跟貼 0
若不做出更多讓步，谷歌或因Google Play涉嫌違規遭歐盟罰款

界面新聞 2025-12-11 08:54:36
0 跟貼 0
中信證券：建議關注算力基建和應用落地等層面的機會

界面新聞 2025-12-10 08:50:41
0 跟貼 0
英偉達將舉辦數據中心電力短缺峰會

界面新聞 2025-12-12 09:11:16
0 跟貼 0
中國量子計算機崛起！10分鐘干完超級計算機1.6萬年的活

雷科技 2025-11-28 19:11:16
1 跟貼 1
不是新的輪胎買不起而是手搓的更有性價比

一只綿羊羊 2025-12-09 10:17:01
0 跟貼 0
誰在賦能這場數字樂章？主板背后的算力底座與生態力量

量子位 2025-11-29 16:58:47
0 跟貼 0
北約秘書長警告：作好與俄羅斯開戰準備

參考消息 2025-12-12 14:29:01
9868 跟貼 9868
新iPad史詩加強！芯片內存全部升級，網友：還沒高刷屏？

極果酷玩 2025-12-12 05:45:16
0 跟貼 0
格力電器：格力碳化硅功率芯片已從家電領域拓展至新能源、工業及特種場景

界面新聞 2025-12-11 21:23:08
0 跟貼 0
男子自行車被偷但有定位芯片，成功找到

中安在線 2025-12-12 04:19:42
0 跟貼 0
美國突然撤銷禁令，允許賣給中國高端芯片，終于發現情況不對了？

成視Talk 2025-12-10 07:13:00
0 跟貼 0
暗漏兩個月用水2203噸水費超1.5萬元用戶：太冤了！|云求助

封面新聞 2025-12-11 21:53:29
7442 跟貼 7442
全國集成電路標準化技術委員會IP核工作組成立

界面新聞 2025-12-09 20:34:07
0 跟貼 0
H200解禁≠算力自由？別被老美騙了！

智能相對論 2025-12-11 16:02:08
3 跟貼 3
小米15S Pro開箱！第一視角感受國產芯片的美麗

雷科技 2025-05-22 23:33:28
0 跟貼 0
佰奧智能：預中標2750.21萬元芯模工裝XX系統等項目

界面新聞 2025-12-09 19:07:02
0 跟貼 0
當萬千芯片、元件協同共舞，誰在賦能這場數字樂章？

量子位 2025-11-27 10:31:00
0 跟貼 0

鈦媒體APP

獨立財經科技媒體

127488文章數 861462關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

家居

手機

游戲

軍事航空

手機 / 數碼

房產 / 家居

GPT-5.2獲封“最強打工人”，谷歌同日以Gemini“性價比”系列應戰

凌晨突發！GPT-5.2上線，首批實測感受來了

沈逸：美國用最強硬的方式 吹響戰略撤退號角

沈逸：美國用最強硬的方式 吹響戰略撤退號角

15輪2分，他們怎么成了英超最爛球隊？

上海這一夜，33歲陳麗君秒了32歲吉娜？

鎂信健康闖關港交所：被指竊取商業秘密

插混四驅法拉利？849 Testarossa國內發布516.8萬起

態度原創

校長先要成為讀書人

溫潤質感 打造干凈空間

三星One UI 8.5新特性曝光，“說句話”自動AI修圖

《鵝鴨殺》手游定檔熱搜：年輕人用“社交貨幣”投出了一張信任票

澤連斯基：烏領土問題應由烏人民決定

沈逸：美國用最強硬的方式吹響戰略撤退號角

沈逸：美國用最強硬的方式吹響戰略撤退號角

溫潤質感打造干凈空間