![]()
六周,又一代。OpenAI 的發(fā)布節(jié)奏,讓人窒息。
作者|樺林舞王
編輯|靖宇
如果幾年前有人跟說,「你以后評測一個(gè)新 AI 模型,可能還沒寫完稿子,下一代就出來了」,你大概率會(huì)覺得是扯淡。
但現(xiàn)在,這件事真的發(fā)生了。
GPT-5.4 發(fā)布于六周前。今天,GPT-5.5 已經(jīng)在 ChatGPT 上向付費(fèi)用戶推送。
這不是一次普通的版本迭代。OpenAI 給它的定位是「全新的智能等級」——在實(shí)際服務(wù)中保持與 GPT-5.4 相當(dāng)?shù)耐评硌舆t,同時(shí)實(shí)現(xiàn)智能水平的「大幅躍升」。
一句話翻譯過來就是:更聰明,但更快。
根據(jù)目前大家體驗(yàn)反饋,OpenAI,這次可能真的要「翻盤」了!
01
「更快」和「更強(qiáng)」,
這次 OpenAI 想兩個(gè)都要
理解 GPT-5.5 的核心邏輯,得先理解 AI 行業(yè)長期以來的一個(gè)悖論。
模型越聰明,往往越慢、越貴。這幾乎是一條默認(rèn)的行業(yè)規(guī)律。你想要更深的推理、更復(fù)雜的任務(wù)處理,就得付出更高的延遲和更多的計(jì)算成本。用戶和企業(yè)客戶在這兩者之間,往往只能選一個(gè)。
GPT-5.5 想打破這個(gè)取舍。
![]()
GPT5.5 的表現(xiàn)在同類中顯得比較突出|圖片來源:OpenAI
OpenAI 聲稱,新模型在「真實(shí)世界服務(wù)」中,每 token 延遲與 GPT-5.4 持平,但智能水平已經(jīng)遠(yuǎn)超后者。VentureBeat 的測試數(shù)據(jù)顯示,GPT-5.5 在 14 個(gè)基準(zhǔn)測試中達(dá)到了最先進(jìn)水平——相比之下,Anthropic 的 Claude Opus 4.7 達(dá)到 4 個(gè),Google Gemini 3.1 Pro 達(dá)到 2 個(gè)。
在能力維度上,GPT-5.5 的強(qiáng)項(xiàng)集中在編寫和調(diào)試代碼、在線研究、數(shù)據(jù)分析、文檔處理,以及操作軟件等「代理式」任務(wù)上。
OpenAI 聯(lián)合創(chuàng)始人 Greg Brockman,把它稱為向「更具代理性和直觀的計(jì)算」邁進(jìn)的「重大進(jìn)步」。
最讓人有感知的案例來自 Jackson Laboratory。基因組醫(yī)學(xué)教授 Derya Unutmaz 用 GPT-5.5 Pro 分析了 2.8 萬個(gè)基因的數(shù)據(jù)集,幾分鐘內(nèi)生成了一份完整報(bào)告——這項(xiàng)工作他的團(tuán)隊(duì)通常要耗費(fèi)數(shù)月。
這不是壓縮時(shí)間,是改變工作方式本身的量級。
02
六周一代,這是產(chǎn)品節(jié)奏還是市場焦慮?
但更值得注意的,是這 OpenAI 發(fā)布節(jié)奏背后的信號(hào)。
六周。GPT-5.4 到 GPT-5.5,只有六周。
回看過去兩個(gè)月,OpenAI 的動(dòng)作密集得有些不尋常。4 月 21 日,ChatGPT Images 2.0 發(fā)布,Sam Altman 在直播中說從 gpt-image-1 到 gpt-image-2 的飛躍「相當(dāng)于從 GPT-3 到 GPT-5 的跳躍」。同一天,OpenAI 宣布與咨詢公司合作向企業(yè)推廣 Codex,首席收入官 Denise Dresser 表示這將幫助觸達(dá)「自己單獨(dú)無法接觸到的」企業(yè)客戶。
Codex 目前已有超過 400 萬周活躍用戶——兩周前是 300 萬,上個(gè)月是 200 萬。這個(gè)增速本身就說明了問題。
![]()
Cursor CEO 發(fā)來賀電|圖片來源:OpenAI
與此同時(shí),OpenAI 還在過去幾周,完成了對個(gè)人金融初創(chuàng)公司 Hiro 和新媒體公司 TBPN 的收購。前者被解讀為「不只是聊天機(jī)器人,而是更值得付費(fèi)的東西」,后者則明顯是為了「更好地塑造公眾形象——而最近的形象并不理想」。
把這些動(dòng)作放在一起看,你會(huì)感受到一種隱約的緊迫感。
這家公司剛剛完成了 1220 億美元的新一輪融資,每月營收達(dá)到 20 億美元。從任何角度看,這都是一家全球最有錢的 AI 公司之一。但社交媒體上關(guān)于「OpenAI 失去消費(fèi)者吸引力」「在企業(yè)客戶爭奪中落后于 Anthropic」的聲音,并沒有因?yàn)檫@些數(shù)字而消失。
GPT-5.5 的發(fā)布,某種意義上是OpenAI對這些質(zhì)疑的一次公開回應(yīng)。
03
基準(zhǔn)測試贏了,但企業(yè)要的是「不出錯(cuò)」
不過,用基準(zhǔn)測試來定義勝負(fù),在企業(yè)市場往往是個(gè)誤導(dǎo)。
紐約銀行 CIO Leigh-Ann Russell 說得很直接——她最在意的不是某個(gè)能力有多強(qiáng),而是「響應(yīng)質(zhì)量和令人印象深刻的幻覺抵抗」。「銀行需要非常高的準(zhǔn)確度,這對一個(gè)受高度監(jiān)管的機(jī)構(gòu)來說很關(guān)鍵。」
這句話代表了相當(dāng)大一批企業(yè)客戶的真實(shí)訴求。他們不是在選「最聰明的 AI」,他們在選「最不會(huì)出錯(cuò)的 AI」。
這也是 Anthropic 在企業(yè)市場能持續(xù)拿下份額的原因——Claude 系列在「安全性」和「可預(yù)測性」上長期保持著很高的品牌認(rèn)知。GPT-5.5 在基準(zhǔn)測試上的全面領(lǐng)先,要真正轉(zhuǎn)化為企業(yè)合同,還需要在「可信賴度」這個(gè)維度上積累更多證據(jù)。
一個(gè)細(xì)節(jié)值得注意:NVIDIA 內(nèi)部有工程師表示,「失去 GPT-5.5 的訪問權(quán)限,感覺像是被截?cái)嗔艘粭l四肢」。這種說法在行業(yè)內(nèi)部流傳,某種程度上說明 GPT-5.5 的能力,已經(jīng)在部分高端用戶中建立了真實(shí)的依賴感。
但從「有人非常喜歡」到「企業(yè)愿意在核心系統(tǒng)上部署」,中間還有很長的距離。
04
當(dāng)速度本身成為競爭力
從更高的視角看,GPT-5.5 這次發(fā)布揭示了一個(gè)更深層的行業(yè)趨勢。
前沿 AI 實(shí)驗(yàn)室的競爭,正在從「誰的模型更強(qiáng)」演變?yōu)椤刚l的迭代更快」。
六周一個(gè)大版本,這在兩年前是不可想象的。而且不只是版本號(hào)的更新,每次迭代背后都有真實(shí)的能力躍升——Axiom Bio 的 CEO Brandon White 甚至預(yù)測,如果 OpenAI 保持這個(gè)速度,「藥物發(fā)現(xiàn)的基礎(chǔ),將在今年年底前改變」。
這句話可能有些樂觀,但它捕捉到了一種真實(shí)的感受:AI 能力的提升速度,正在開始超越大多數(shù)人對它應(yīng)用潛力的想象。
OpenAI 首席研究官 Mark Chen,把 GPT-5.5 在科學(xué)和技術(shù)研究領(lǐng)域的能力,總結(jié)為「有意義的進(jìn)展」,并指出它可以「幫助專家科學(xué)家取得進(jìn)步」。這個(gè)措辭值得玩味——不是「替代」科學(xué)家,而是「幫助專家取得進(jìn)步」。這是一種在展示能力的同時(shí),主動(dòng)管理敘事的方式。
GPT-5.5 面向 Plus、Pro、Business 和 Enterprise 訂閱用戶,同時(shí)在 ChatGPT 和 Codex 中推出。這個(gè)分發(fā)策略本身就是商業(yè)信號(hào)——既要守住消費(fèi)者端的用戶粘性,又要在企業(yè)端通過 Codex 和咨詢合作伙伴加速滲透。
兩條腿走路,節(jié)奏還在加快。
六周后,我們大概會(huì)看到 GPT-5.6。
*頭圖來源:OpenAI
本文為極客公園原創(chuàng)文章,轉(zhuǎn)載請聯(lián)系極客君微信 geekparkGO
極客一問
ChatGPT 5.4 你用明白了嗎?
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.