網易首頁 > 網易號 > 正文申請入駐

GPT-5.2 翻車內幕曝光：技術團隊沒走「歪路」，但用戶成了大冤種

2025-12-19 17:37:38　來源: 愛范兒

廣東舉報

分享至

OpenAI 的十周歲生日，過得不太體面。

在當天發布的 GPT-5.2 交出了一份完美答卷：它橫掃許多基準測試的 SOTA，在數學和編程等競賽場景中的表現堪稱亮眼，也被官方描述為 AI「超級大腦」。

可到了社交網絡，迎接它的不是掌聲，而是用戶的集體罵街。

在 X 和 Reddit 上，憤怒與失望幾乎寫在每一條評論里。人們又一次懷念起那個曾經的「白月光」GPT-4o：有人說 GPT-5.2 變得平淡、乏味、像被磨平了棱角；也有人譏諷它成了「把成年人當幼兒園小孩對待」的說教。

當輿論的炮火對準 OpenAI 及其 CEO Sam Altman（山姆·奧特曼），一個尖銳的問題擺在面前：為什么模型更「聰明」了，用戶反而更不愛了？

更「聰明」的模型，為什么不討喜了

The Information 今天凌晨的最新報道，扒出了內幕。

過去一年，OpenAI 內部曾奉行一條鐵律：每一次模型的代際飛躍，都會伴隨著用戶量的爆發式增長，因為「變聰明」帶來的體驗升級是直觀的。但現在，這條鐵律失效了。

當然，模型在智能與科研計算領域的提升依舊顯著。研究團隊耗費數月打磨推理能力，讓它能攻克更復雜的數學與科學難題，但對于大多數普通用戶而言，這種感知微乎其微。

▲ https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset

換句話說，智能的提升，并不天然等同于體驗的提升。

普通用戶很少需要一臺「競賽級大腦」，他們更多需要一個「日常好用的助手」。OpenAI 對 150 萬次對話的大規模分析佐證了這一判斷，用戶的核心需求極其接地氣：實用指導（29%）、信息查詢（24%）以及寫作（24%）等，而與編程任務相關的對話只有 4.2%。

于是矛盾就變得非常具體：當技術團隊在實驗室里狂卷數理化、狂卷基準測試時，用戶在聊天框里只想要一句話解決問題——別繞、別教、別拖。

戰線拉得過長是一大槽點。

今年大部分時間里，奧特曼同時啟動了多個新項目：視頻生成應用 Sora、音樂 AI、瀏覽器、AI Agent、硬件設備、機器人……攤子越鋪越大，資源也被越分越碎。

這其實是科技巨頭最常見的經典錯誤：核心陣地還沒打穩，就急著開辟第二、第三戰場。短期看是「全面開花」，長期看，貪多嚼不爛，乃兵家大忌——每一條戰線都缺人、缺算力、缺產品打磨的耐心。

OpenAI 內部「研究優先」和「產品增長」之間的拉扯，在圖像生成上體現得尤為明顯：

即便 GPT-4o 的吉卜力風格在三月還短暫帶動過 ChatGPT 的使用與用戶增長，但 OpenAI 還是一度把圖像模型的開發優先級往后放，等到 Nano Banana 口碑發酵后，OpenAI 又緊急回頭補課，內部也因此爆發分歧——

奧特曼認定圖像模型是用戶增長的抓手，研究主管 Mark Chen 則更想把資源押在別的項目上。

另外，伴隨著 Scaling Laws 邊際效益遞減，為了突破大模型的瓶頸，OpenAI 過去一年里押注了推理模型，超過 1000 人的研究團隊將資源傾斜于此，導致對 ChatGPT 日常體驗的優化被邊緣化。

這種做法不僅分散了資源，甚至在年初的內測中出現了性能倒退——為了適配「聊天」場景，反而削弱了推理模型的純粹性。雖然后來推出了「思考模式」和「深度研究」來分流、來補救，但用戶使用率卻很低，真正的日常對話體驗并沒有因此變得更討喜。

除此之外，新舊模型之間也常出現兼容問題。

例如在發布 GPT-5 前，研究人員發現模型在集成進 ChatGPT 后在部分編程任務上表現變差——因為系統根據用戶職業等個性化信息調整回答，結果反而干擾了模型理解，導致錯誤答案。

誠然，推理模型越來越強，但 ChatGPT 體驗越來越拉胯。

當技術進步的方向和用戶需求的方向開始分叉，誰會先妥協？答案顯而易見。

Gemini 3 Pro 的強勢發布，最終把 OpenAI 逼到了墻角，于是便有了奧特曼發布「紅色警報」的經典名場面，要求 OpenAI 員工重新聚焦 ChatGPT，提高產品體驗吸引力。

而在同一時間，OpenAI 應用負責人 Fidji Simo 也在個人博客中闡述 ChatGPT 的愿景，那就是從主要以文本為主的對話系統，轉向能根據用戶意圖動態生成界面的全生成式 UI。

只是 Simo 也曾承認，公司本質仍以研究為中心，「產品本身并不是最終目標」。

從商業邏輯看，這句話其實很危險。

不同于 Anthropic 更偏向主攻 API 市場，OpenAI 的大頭收入來自個人訂閱。在消費市場，沒有人會為企業的「終極理想」買單，用戶只愿為當下的體驗付費。這就好比餐廳大廚醉心于研發米其林料理，而大堂里的食客僅僅想要一碗熱氣騰騰的陽春面。

不過，如果你因此就斷言 OpenAI 內部已經亂了陣腳，那可能低估了這家公司的韌性。

據彭博社援引 Mark Chen 的說法，「紅色警報」并非新鮮事，而更像是一種戰時狀態的常態化管理工具。每當 OpenAI 需要集中火力攻克某一單一目標，或要求團隊放下低優先級任務時，這種機制就會啟動。

▲播客地址：https://x.com/Kantrowitz/status/2001790090641645940

奧特曼在最新的播客中，同樣否認了拉響紅色警報帶來的過度焦慮。

「首先，所謂的『紅色警報』，在我們看來其實是一種低風險、但非常必要的應對措施。」奧特曼坦言，「在潛在的競爭威脅出現時，保持一點『偏執』、并迅速做出反應，是件好事。」

他甚至提到了今年年初 DeepSeek 的崛起，認為那和現在的 Gemini 3 一樣，都是一種良性的外部刺激。

「Gemini 3 到目前為止，還沒帶來我們原本擔心的那種毀滅性沖擊。雖然它和 DeepSeek 一樣，精準地刺痛了我們在產品策略上的軟肋，但也倒逼我們做出了極其迅速的調整。」

在奧特曼看來，這種緊急狀態通常只會持續六到八周。「我很高興我們有這種快速反應機制，我們不會在這個狀態里待太久。」

OpenAI 顯然也明白光喊口號不夠，他們今天也正式發布了 GPT-5.2-Codex。

作為專為解決復雜現實軟件工程問題而生的智能體編程模型，GPT-5.2-Codex 在通用智能的基礎上，融合了 GPT-5.1-Codex-Max 的終端操作能力，更擅長處理代碼重構、遷移等長程任務。

而同樣是在播客的尾聲，當主持人詢問「GPT-6 還要等多久？」時，奧特曼敞亮地表示：「我不知道我們什么時候會正式把某個模型命名為 GPT-6，但我預計在明年第一季度，會有比 5.2 有顯著提升的新模型發布。」

拉響「紅色警報」，到 GPT-5.2 系列的反擊，再到 GPT-6 的曖昧預告，OpenAI 試圖用新模型與新節奏重建信心，但決定長期勝負的，仍是分發入口、生態協同與算力成本等硬門檻。

Google 的陽謀，與奧特曼的 8300 億「空城計」

Google 的優勢，從來不只在 Gemini 3 Pro 這一個模型上，更在于它幾乎無可匹敵的分發渠道。

搜索、Chrome、辦公套件。在 AI 賽道，護城河可能是所有科技產品中最淺的。用戶的遷移成本幾乎為零，當 Google 的 AI 產品如空氣般無處不在，這幾乎成了一場無解的陽謀——你不需要「被說服」，你只會「順手就用」。

更重要的是，在與 Google 的較量中，硬件層面的短板成了 OpenAI 最大的軟肋。

相比于 Google 十二年前就開始布局專用 AI 芯片（TPU）所建立的效率優勢，OpenAI 每年仍需花費數十億美元租用算力。即便試圖通過自建數據中心和芯片來「補課」，但體驗在被追平、成本在被碾壓的現狀已是不爭的事實。

用網友的話來說：

OpenAI 現在并不需要一個更強大的模型，它需要的是 AMD。如果 OpenAI 收購了 AMD，這場 AI 之戰就將宣告結束。Google 之所以不怕 OpenAI，是因為它擁有自家的 TPU。但它真正該擔心的，是 OpenAI 擁有 AMD。

OpenAI 總裁 Greg Brockman 在最近的視頻中也坦言，由于算力捉襟見肘，每當新功能上線（如年初 GPT-4o 吉卜力風格），就必須從研究部門「抽血」，把算力挪給產品部。這是一種飲鴆止渴的循環——為了維持今天的用戶體驗，被迫推遲了明日的技術研發。

可算力這東西，歸根到底就是兩個字：燒錢。而且是海量地燒錢。

為此，據 WSJ 報道，OpenAI 已計劃發起 1000 億美元的巨額融資；若一切順利，這家超級獨角獸將在明年 Q1 之前，以 8300 億美元的估值，再次刷新資本市場的想象力。

而在今年早些時候，軟銀同意向 OpenAI 投資 300 億美元，并于上月出售所持的英偉達股份價值 58 億美元，為這筆投資籌資，并預計盡快完成剩余 225 億美元的出資。

但錢的問題沒那么簡單。預計到 2030 年，OpenAI 的現金消耗將超過 2000 億美元。相比之下，Google 財務穩健，甚至能通過 Oracle 等合作伙伴的股價波動間接擠壓 OpenAI 的融資前景。

到處籌錢的 OpenAI，看起來更像是在和時間賽跑。于是便誕生了那個笑話：照奧特曼的融資能力，沒準哪天連 Google 和英偉達都能「打包帶走」。

但玩笑歸玩笑，錢能買來時間，卻買不來口碑。

所以在 2025 年這個冬天，狂奔三年的 OpenAI 選擇先踩一腳剎車，其實是對的：收攏戰線、回撤資源，把方向重新對準 ChatGPT 的日常體驗。

這是一次昂貴但必要的糾偏。

技術領先不等于產品好用，基準測試第一不等于用戶滿意。更重要的是，你不能只在用戶懷念舊版本的時候，才想起來問問他們的感受。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

谷歌發布Gemini 3 Flash，口述即原型，速度堪比搜索引擎

DeepTech深科技 2025-12-18 11:32:34
0 跟貼 0
拆解CANN：當華為決定打開算力的「黑盒」

機器之心Pro 2025-12-19 14:45:00
0 跟貼 0

時代變了！樂奇AI眼鏡登上《自然》封面：中國AI定義全球未來

雷科技 2025-12-19 19:48:52
0 跟貼 0

早報｜曝字節推進AI手機合作：vivo員工證實/拼多多架構升級，目標「三年再造一個拼多多」/小米汽車獲北京L3路測牌照

愛范兒 2025-12-20 09:09:27
0 跟貼 0
荒野求生（機器狗全自主版），2025ATEC挑戰真實戶外無遙操

量子位 2025-12-08 19:24:34
0 跟貼 0

大模型也會賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0

李飛飛發起機器人家務挑戰賽，老黃第一時間批錢贊助

量子位 2025-10-13 09:30:54
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0

機器人終于有自己的真機評測大考了

量子位 2025-10-15 20:05:44
0 跟貼 0
機器狗被鋸腿也能繼續走，Skild Brain估值45億美元

量子位 2025-09-27 17:49:32
0 跟貼 0
五八智能四足機器人平臺Q20A 不止跑跳整活還能維護公共安全

量子位 2025-09-30 10:01:00
0 跟貼 0
AI重塑人機交互方式，下一代終端如何變革？

量子位 2025-09-24 20:17:01
0 跟貼 0
諾獎得主Hassabis：5-10年AGI將至，沖擊力將是工業革命10倍！

新智元 2025-12-20 09:21:27
0 跟貼 0
靈巧手作為獨立執行平臺，實現工業與家庭場景應用

量子位 2025-12-11 03:38:13
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
未來醫生摘得全球第一，臨床安全有效性評估新基準

量子位 2025-11-19 11:14:03
0 跟貼 0
Mini-Omni-Reasoner：實時推理，定義下一代端到端對話模型

機器之心Pro 2025-09-22 14:01:53
0 跟貼 0
摩爾線程發布第五代GPU架構“花港”：能效可提升十倍，明年量產

每日經濟新聞 2025-12-20 11:48:07
0 跟貼 0
OpenAI最強代碼模型GPT-5.2-Codex上線

機器之心Pro 2025-12-19 10:20:17
0 跟貼 0
沖擊6萬億估值！OpenAI再啟新一輪千億融資，亞馬遜一家投700億

智東西 2025-12-19 16:53:34
0 跟貼 0
英偉達巧用8B模型秒掉GPT-5 開源了

量子位 2025-12-06 14:07:18
21 跟貼 21
120多萬的卡宴只要60多萬？很多網友激動了！打飛的到海南買進口車，可行嗎？

都市快報橙柿互動 2025-12-19 18:00:00
23150 跟貼 23150
GPT-5編程成績有貓膩！自刪23道測試題，關鍵基準還是自己提的

量子位 2025-08-12 13:12:51
15 跟貼 15
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
7 跟貼 7
王力宏成都演唱會現場，機器人伴舞，動作整齊劃一

童話鶴壁 2025-12-19 14:09:01
35 跟貼 35
男生第一次體驗機器人商店，買兩瓶水被機器人急得想投訴

逛吃青島 2025-12-19 18:56:25
1 跟貼 1
DeepMind負責人：2036 AI意識覺醒？LeCun怒懟：LLM路線全錯！

新智元 2025-12-16 16:55:25
0 跟貼 0
蘋果開源新模型！一秒鐘讓照片變3D世界

智東西 2025-12-19 22:53:24
0 跟貼 0
"插座一哥"被同行質疑誤導消費者索賠420萬公牛回應

中國新聞周刊 2025-12-19 15:32:41
1760 跟貼 1760
夢幻西游：物暴傷害高達95%，聯賽頂級三攻凌波城，硬件太饞人！

浩仔說夢 2025-12-18 10:57:56
1 跟貼 1
中戲院長郝戎被查劉燁、章子怡、靳東等為其學生

大風新聞 2025-12-19 11:54:20
3932 跟貼 3932
比亞迪王傳福：做大產業，做出中國制造業應有的位置

每日經濟新聞 2025-07-22 17:51:59
15 跟貼 15
余承東，權力更進一步

互聯網思維 2025-12-19 23:34:21
50 跟貼 50
汽修師傅眼中的特斯拉，硬件把控非常嚴格，國內新勢力對標桿！

十點觀察站 2025-12-19 14:57:11
0 跟貼 0
余承東：我有一個夢想馬路上的所有車里都有華為的技術

每日經濟新聞 2025-07-23 17:06:16
295 跟貼 295
新聞多一度｜南京博物院藏品現身拍賣市場？最新回應來了

新京報 2025-12-19 20:45:08
5828 跟貼 5828
海南封關，樓市怎么樣？知名房企斥資近50億元接連拿地，“有山東客戶拿下上百套小戶型商辦房”

每日經濟新聞 2025-12-19 13:17:46
9786 跟貼 9786
龐家捐出去的寶藏書畫，是怎么得來的？

紅星新聞 2025-12-19 22:33:14
726 跟貼 726
360 萬、基于大模型的“交管小安”智能客服

云頭條 2025-12-20 11:49:43
0 跟貼 0
下一代谷歌頭顯，XREAL x Google 定義混合現實頭顯

愛范兒 2025-12-10 05:12:08
0 跟貼 0

愛范兒

消費科技第一媒體

38198文章數 2600422關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

本地

親子

時尚

手機

數碼

手機 / 數碼

房產 / 家居

GPT-5.2 翻車內幕曝光：技術團隊沒走「歪路」，但用戶成了大冤種

許四清：具身智能的"ChatGPT時刻"還未到來

牛彈琴：歐洲最后還是慫了 最打臉的就是馮德萊恩

牛彈琴：歐洲最后還是慫了 最打臉的就是馮德萊恩

我開了20年大巴，現在是一名西甲主帥

戚薇女兒大變樣，10歲就進入“尷尬期”

日本加息落地：暴跌沒有，麻煩在后頭

態度原創

云游安徽｜訪黃山云海古村，讀一城山水風骨

昆凌8年三胎剖腹產，女明星們為啥都不順產？

今年冬天流行的“露襪”穿法，時髦又減齡！

三星Galaxy XR頭顯被拆解：全用十字螺絲、更換主板較輕松

雷蛇黑寡婦蜘蛛V4競技極速版鍵盤限時贈送《阿凡達3》聯名鍵帽

牛彈琴：歐洲最后還是慫了最打臉的就是馮德萊恩

牛彈琴：歐洲最后還是慫了最打臉的就是馮德萊恩