![]()
OpenAI 的十周歲生日,過得不太體面。
在當天發布的 GPT-5.2 交出了一份完美答卷:它橫掃許多基準測試的 SOTA,在數學和編程等競賽場景中的表現堪稱亮眼,也被官方描述為 AI「超級大腦」。
可到了社交網絡,迎接它的不是掌聲,而是用戶的集體罵街。
![]()
在 X 和 Reddit 上,憤怒與失望幾乎寫在每一條評論里。人們又一次懷念起那個曾經的「白月光」GPT-4o:有人說 GPT-5.2 變得平淡、乏味、像被磨平了棱角;也有人譏諷它成了「把成年人當幼兒園小孩對待」的說教。
當輿論的炮火對準 OpenAI 及其 CEO Sam Altman(山姆·奧特曼),一個尖銳的問題擺在面前:為什么模型更「聰明」了,用戶反而更不愛了?
![]()
更「聰明」的模型,為什么不討喜了
The Information 今天凌晨的最新報道,扒出了內幕。
過去一年,OpenAI 內部曾奉行一條鐵律:每一次模型的代際飛躍,都會伴隨著用戶量的爆發式增長,因為「變聰明」帶來的體驗升級是直觀的。但現在,這條鐵律失效了。
當然,模型在智能與科研計算領域的提升依舊顯著。研究團隊耗費數月打磨推理能力,讓它能攻克更復雜的數學與科學難題,但對于大多數普通用戶而言,這種感知微乎其微。
![]()
▲ https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset
換句話說,智能的提升,并不天然等同于體驗的提升。
普通用戶很少需要一臺「競賽級大腦」,他們更多需要一個「日常好用的助手」。OpenAI 對 150 萬次對話的大規模分析佐證了這一判斷,用戶的核心需求極其接地氣:實用指導(29%)、信息查詢(24%)以及寫作(24%)等,而與編程任務相關的對話只有 4.2%。
![]()
于是矛盾就變得非常具體:當技術團隊在實驗室里狂卷數理化、狂卷基準測試時,用戶在聊天框里只想要一句話解決問題——別繞、別教、別拖。
戰線拉得過長是一大槽點。
今年大部分時間里,奧特曼同時啟動了多個新項目:視頻生成應用 Sora、音樂 AI、瀏覽器、AI Agent、硬件設備、機器人……攤子越鋪越大,資源也被越分越碎。
這其實是科技巨頭最常見的經典錯誤:核心陣地還沒打穩,就急著開辟第二、第三戰場。短期看是「全面開花」,長期看,貪多嚼不爛,乃兵家大忌——每一條戰線都缺人、缺算力、缺產品打磨的耐心。
![]()
OpenAI 內部「研究優先」和「產品增長」之間的拉扯,在圖像生成上體現得尤為明顯:
即便 GPT-4o 的吉卜力風格在三月還短暫帶動過 ChatGPT 的使用與用戶增長,但 OpenAI 還是一度把圖像模型的開發優先級往后放,等到 Nano Banana 口碑發酵后,OpenAI 又緊急回頭補課,內部也因此爆發分歧——
奧特曼認定圖像模型是用戶增長的抓手,研究主管 Mark Chen 則更想把資源押在別的項目上。
另外,伴隨著 Scaling Laws 邊際效益遞減,為了突破大模型的瓶頸,OpenAI 過去一年里押注了推理模型,超過 1000 人的研究團隊將資源傾斜于此,導致對 ChatGPT 日常體驗的優化被邊緣化。
![]()
這種做法不僅分散了資源,甚至在年初的內測中出現了性能倒退——為了適配「聊天」場景,反而削弱了推理模型的純粹性。雖然后來推出了「思考模式」和「深度研究」來分流、來補救,但用戶使用率卻很低,真正的日常對話體驗并沒有因此變得更討喜。
除此之外,新舊模型之間也常出現兼容問題。
例如在發布 GPT-5 前,研究人員發現模型在集成進 ChatGPT 后在部分編程任務上表現變差——因為系統根據用戶職業等個性化信息調整回答,結果反而干擾了模型理解,導致錯誤答案。
誠然,推理模型越來越強,但 ChatGPT 體驗越來越拉胯。
![]()
當技術進步的方向和用戶需求的方向開始分叉,誰會先妥協?答案顯而易見。
Gemini 3 Pro 的強勢發布,最終把 OpenAI 逼到了墻角,于是便有了奧特曼發布「紅色警報」的經典名場面,要求 OpenAI 員工重新聚焦 ChatGPT,提高產品體驗吸引力。
而在同一時間,OpenAI 應用負責人 Fidji Simo 也在個人博客中闡述 ChatGPT 的愿景,那就是從主要以文本為主的對話系統,轉向能根據用戶意圖動態生成界面的全生成式 UI。
只是 Simo 也曾承認,公司本質仍以研究為中心,「產品本身并不是最終目標」。
![]()
從商業邏輯看,這句話其實很危險。
不同于 Anthropic 更偏向主攻 API 市場,OpenAI 的大頭收入來自個人訂閱。在消費市場,沒有人會為企業的「終極理想」買單,用戶只愿為當下的體驗付費。這就好比餐廳大廚醉心于研發米其林料理,而大堂里的食客僅僅想要一碗熱氣騰騰的陽春面。
不過,如果你因此就斷言 OpenAI 內部已經亂了陣腳,那可能低估了這家公司的韌性。
據彭博社援引 Mark Chen 的說法,「紅色警報」并非新鮮事,而更像是一種戰時狀態的常態化管理工具。每當 OpenAI 需要集中火力攻克某一單一目標,或要求團隊放下低優先級任務時,這種機制就會啟動。
![]()
▲播客地址:https://x.com/Kantrowitz/status/2001790090641645940
奧特曼在最新的播客中,同樣否認了拉響紅色警報帶來的過度焦慮。
「首先,所謂的『紅色警報』,在我們看來其實是一種低風險、但非常必要的應對措施。」奧特曼坦言,「在潛在的競爭威脅出現時,保持一點『偏執』、并迅速做出反應,是件好事。」
他甚至提到了今年年初 DeepSeek 的崛起,認為那和現在的 Gemini 3 一樣,都是一種良性的外部刺激。
「Gemini 3 到目前為止,還沒帶來我們原本擔心的那種毀滅性沖擊。雖然它和 DeepSeek 一樣,精準地刺痛了我們在產品策略上的軟肋,但也倒逼我們做出了極其迅速的調整。」
![]()
在奧特曼看來,這種緊急狀態通常只會持續六到八周。「我很高興我們有這種快速反應機制,我們不會在這個狀態里待太久。」
OpenAI 顯然也明白光喊口號不夠,他們今天也正式發布了 GPT-5.2-Codex。
![]()
作為專為解決復雜現實軟件工程問題而生的智能體編程模型,GPT-5.2-Codex 在通用智能的基礎上,融合了 GPT-5.1-Codex-Max 的終端操作能力,更擅長處理代碼重構、遷移等長程任務。
而同樣是在播客的尾聲,當主持人詢問「GPT-6 還要等多久?」時,奧特曼敞亮地表示:「我不知道我們什么時候會正式把某個模型命名為 GPT-6,但我預計在明年第一季度,會有比 5.2 有顯著提升的新模型發布。」
拉響「紅色警報」,到 GPT-5.2 系列的反擊,再到 GPT-6 的曖昧預告,OpenAI 試圖用新模型與新節奏重建信心,但決定長期勝負的,仍是分發入口、生態協同與算力成本等硬門檻。
Google 的陽謀,與奧特曼的 8300 億「空城計」
Google 的優勢,從來不只在 Gemini 3 Pro 這一個模型上,更在于它幾乎無可匹敵的分發渠道。
搜索、Chrome、辦公套件。在 AI 賽道,護城河可能是所有科技產品中最淺的。 用戶的遷移成本幾乎為零,當 Google 的 AI 產品如空氣般無處不在,這幾乎成了一場無解的陽謀——你不需要「被說服」,你只會「順手就用」。
更重要的是,在與 Google 的較量中,硬件層面的短板成了 OpenAI 最大的軟肋。
相比于 Google 十二年前就開始布局專用 AI 芯片(TPU)所建立的效率優勢,OpenAI 每年仍需花費數十億美元租用算力。即便試圖通過自建數據中心和芯片來「補課」,但體驗在被追平、成本在被碾壓的現狀已是不爭的事實。
![]()
用網友的話來說:
OpenAI 現在并不需要一個更強大的模型,它需要的是 AMD。如果 OpenAI 收購了 AMD,這場 AI 之戰就將宣告結束。Google 之所以不怕 OpenAI,是因為它擁有自家的 TPU。但它真正該擔心的,是 OpenAI 擁有 AMD。
OpenAI 總裁 Greg Brockman 在最近的視頻中也坦言,由于算力捉襟見肘,每當新功能上線(如年初 GPT-4o 吉卜力風格),就必須從研究部門「抽血」,把算力挪給產品部。這是一種飲鴆止渴的循環——為了維持今天的用戶體驗,被迫推遲了明日的技術研發。
可算力這東西,歸根到底就是兩個字:燒錢。而且是海量地燒錢。
為此,據 WSJ 報道,OpenAI 已計劃發起 1000 億美元的巨額融資;若一切順利,這家超級獨角獸將在明年 Q1 之前,以 8300 億美元的估值,再次刷新資本市場的想象力。
![]()
而在今年早些時候,軟銀同意向 OpenAI 投資 300 億美元,并于上月出售所持的英偉達股份價值 58 億美元,為這筆投資籌資,并預計盡快完成剩余 225 億美元的出資。
但錢的問題沒那么簡單。預計到 2030 年,OpenAI 的現金消耗將超過 2000 億美元。相比之下,Google 財務穩健,甚至能通過 Oracle 等合作伙伴的股價波動間接擠壓 OpenAI 的融資前景。
到處籌錢的 OpenAI,看起來更像是在和時間賽跑。于是便誕生了那個笑話:照奧特曼的融資能力,沒準哪天連 Google 和英偉達都能「打包帶走」。
![]()
但玩笑歸玩笑,錢能買來時間,卻買不來口碑。
所以在 2025 年這個冬天,狂奔三年的 OpenAI 選擇先踩一腳剎車,其實是對的:收攏戰線、回撤資源,把方向重新對準 ChatGPT 的日常體驗。
這是一次昂貴但必要的糾偏。
技術領先不等于產品好用,基準測試第一不等于用戶滿意。更重要的是,你不能只在用戶懷念舊版本的時候,才想起來問問他們的感受。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.