網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請入駐

GPT-5.5 來了，但這次 OpenAI 想證明的不只是「更聰明」

2026-04-24 09:47:05　來源: 極客公園

北京舉報(bào)

分享至

六周，又一代。OpenAI 的發(fā)布節(jié)奏，讓人窒息。

作者｜樺林舞王

編輯｜靖宇

如果幾年前有人跟說，「你以后評測一個(gè)新 AI 模型，可能還沒寫完稿子，下一代就出來了」，你大概率會(huì)覺得是扯淡。

但現(xiàn)在，這件事真的發(fā)生了。

GPT-5.4 發(fā)布于六周前。今天，GPT-5.5 已經(jīng)在 ChatGPT 上向付費(fèi)用戶推送。

這不是一次普通的版本迭代。OpenAI 給它的定位是「全新的智能等級」——在實(shí)際服務(wù)中保持與 GPT-5.4 相當(dāng)?shù)耐评硌舆t，同時(shí)實(shí)現(xiàn)智能水平的「大幅躍升」。

一句話翻譯過來就是：更聰明，但更快。

根據(jù)目前大家體驗(yàn)反饋，OpenAI，這次可能真的要「翻盤」了！

「更快」和「更強(qiáng)」，

這次 OpenAI 想兩個(gè)都要

理解 GPT-5.5 的核心邏輯，得先理解 AI 行業(yè)長期以來的一個(gè)悖論。

模型越聰明，往往越慢、越貴。這幾乎是一條默認(rèn)的行業(yè)規(guī)律。你想要更深的推理、更復(fù)雜的任務(wù)處理，就得付出更高的延遲和更多的計(jì)算成本。用戶和企業(yè)客戶在這兩者之間，往往只能選一個(gè)。

GPT-5.5 想打破這個(gè)取舍。

GPT5.5 的表現(xiàn)在同類中顯得比較突出｜圖片來源：OpenAI

OpenAI 聲稱，新模型在「真實(shí)世界服務(wù)」中，每 token 延遲與 GPT-5.4 持平，但智能水平已經(jīng)遠(yuǎn)超后者。VentureBeat 的測試數(shù)據(jù)顯示，GPT-5.5 在 14 個(gè)基準(zhǔn)測試中達(dá)到了最先進(jìn)水平——相比之下，Anthropic 的 Claude Opus 4.7 達(dá)到 4 個(gè)，Google Gemini 3.1 Pro 達(dá)到 2 個(gè)。

在能力維度上，GPT-5.5 的強(qiáng)項(xiàng)集中在編寫和調(diào)試代碼、在線研究、數(shù)據(jù)分析、文檔處理，以及操作軟件等「代理式」任務(wù)上。

OpenAI 聯(lián)合創(chuàng)始人 Greg Brockman，把它稱為向「更具代理性和直觀的計(jì)算」邁進(jìn)的「重大進(jìn)步」。

最讓人有感知的案例來自 Jackson Laboratory。基因組醫(yī)學(xué)教授 Derya Unutmaz 用 GPT-5.5 Pro 分析了 2.8 萬個(gè)基因的數(shù)據(jù)集，幾分鐘內(nèi)生成了一份完整報(bào)告——這項(xiàng)工作他的團(tuán)隊(duì)通常要耗費(fèi)數(shù)月。

這不是壓縮時(shí)間，是改變工作方式本身的量級。

六周一代，這是產(chǎn)品節(jié)奏還是市場焦慮？

但更值得注意的，是這 OpenAI 發(fā)布節(jié)奏背后的信號(hào)。

六周。GPT-5.4 到 GPT-5.5，只有六周。

回看過去兩個(gè)月，OpenAI 的動(dòng)作密集得有些不尋常。4 月 21 日，ChatGPT Images 2.0 發(fā)布，Sam Altman 在直播中說從 gpt-image-1 到 gpt-image-2 的飛躍「相當(dāng)于從 GPT-3 到 GPT-5 的跳躍」。同一天，OpenAI 宣布與咨詢公司合作向企業(yè)推廣 Codex，首席收入官 Denise Dresser 表示這將幫助觸達(dá)「自己單獨(dú)無法接觸到的」企業(yè)客戶。

Codex 目前已有超過 400 萬周活躍用戶——兩周前是 300 萬，上個(gè)月是 200 萬。這個(gè)增速本身就說明了問題。

Cursor CEO 發(fā)來賀電｜圖片來源：OpenAI

與此同時(shí)，OpenAI 還在過去幾周，完成了對個(gè)人金融初創(chuàng)公司 Hiro 和新媒體公司 TBPN 的收購。前者被解讀為「不只是聊天機(jī)器人，而是更值得付費(fèi)的東西」，后者則明顯是為了「更好地塑造公眾形象——而最近的形象并不理想」。

把這些動(dòng)作放在一起看，你會(huì)感受到一種隱約的緊迫感。

這家公司剛剛完成了 1220 億美元的新一輪融資，每月營收達(dá)到 20 億美元。從任何角度看，這都是一家全球最有錢的 AI 公司之一。但社交媒體上關(guān)于「OpenAI 失去消費(fèi)者吸引力」「在企業(yè)客戶爭奪中落后于 Anthropic」的聲音，并沒有因?yàn)檫@些數(shù)字而消失。

GPT-5.5 的發(fā)布，某種意義上是OpenAI對這些質(zhì)疑的一次公開回應(yīng)。

基準(zhǔn)測試贏了，但企業(yè)要的是「不出錯(cuò)」

不過，用基準(zhǔn)測試來定義勝負(fù)，在企業(yè)市場往往是個(gè)誤導(dǎo)。

紐約銀行 CIO Leigh-Ann Russell 說得很直接——她最在意的不是某個(gè)能力有多強(qiáng)，而是「響應(yīng)質(zhì)量和令人印象深刻的幻覺抵抗」。「銀行需要非常高的準(zhǔn)確度，這對一個(gè)受高度監(jiān)管的機(jī)構(gòu)來說很關(guān)鍵。」

這句話代表了相當(dāng)大一批企業(yè)客戶的真實(shí)訴求。他們不是在選「最聰明的 AI」，他們在選「最不會(huì)出錯(cuò)的 AI」。

這也是 Anthropic 在企業(yè)市場能持續(xù)拿下份額的原因——Claude 系列在「安全性」和「可預(yù)測性」上長期保持著很高的品牌認(rèn)知。GPT-5.5 在基準(zhǔn)測試上的全面領(lǐng)先，要真正轉(zhuǎn)化為企業(yè)合同，還需要在「可信賴度」這個(gè)維度上積累更多證據(jù)。

一個(gè)細(xì)節(jié)值得注意：NVIDIA 內(nèi)部有工程師表示，「失去 GPT-5.5 的訪問權(quán)限，感覺像是被截?cái)嗔艘粭l四肢」。這種說法在行業(yè)內(nèi)部流傳，某種程度上說明 GPT-5.5 的能力，已經(jīng)在部分高端用戶中建立了真實(shí)的依賴感。

但從「有人非常喜歡」到「企業(yè)愿意在核心系統(tǒng)上部署」，中間還有很長的距離。

當(dāng)速度本身成為競爭力

從更高的視角看，GPT-5.5 這次發(fā)布揭示了一個(gè)更深層的行業(yè)趨勢。

前沿 AI 實(shí)驗(yàn)室的競爭，正在從「誰的模型更強(qiáng)」演變?yōu)椤刚l的迭代更快」。

六周一個(gè)大版本，這在兩年前是不可想象的。而且不只是版本號(hào)的更新，每次迭代背后都有真實(shí)的能力躍升——Axiom Bio 的 CEO Brandon White 甚至預(yù)測，如果 OpenAI 保持這個(gè)速度，「藥物發(fā)現(xiàn)的基礎(chǔ)，將在今年年底前改變」。

這句話可能有些樂觀，但它捕捉到了一種真實(shí)的感受：AI 能力的提升速度，正在開始超越大多數(shù)人對它應(yīng)用潛力的想象。

OpenAI 首席研究官 Mark Chen，把 GPT-5.5 在科學(xué)和技術(shù)研究領(lǐng)域的能力，總結(jié)為「有意義的進(jìn)展」，并指出它可以「幫助專家科學(xué)家取得進(jìn)步」。這個(gè)措辭值得玩味——不是「替代」科學(xué)家，而是「幫助專家取得進(jìn)步」。這是一種在展示能力的同時(shí)，主動(dòng)管理敘事的方式。

GPT-5.5 面向 Plus、Pro、Business 和 Enterprise 訂閱用戶，同時(shí)在 ChatGPT 和 Codex 中推出。這個(gè)分發(fā)策略本身就是商業(yè)信號(hào)——既要守住消費(fèi)者端的用戶粘性，又要在企業(yè)端通過 Codex 和咨詢合作伙伴加速滲透。

兩條腿走路，節(jié)奏還在加快。

六周后，我們大概會(huì)看到 GPT-5.6。

*頭圖來源：OpenAI

本文為極客公園原創(chuàng)文章，轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO

極客一問

ChatGPT 5.4 你用明白了嗎？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.