網易首頁 > 網易號 > 正文申請入駐

奧特曼「紅色警戒」5個月后，GPT Image 2屠榜，斷層領先反殺谷歌

2026-04-27 18:33:56　來源: 新智元

北京舉報

分享至

新智元報道

編輯：元宇

【新智元導讀】被Google按了半年頭，OpenAI終于祭出一記反殺。GPT Image 2上線12小時，就登頂Arena文生圖榜，領先Nano Banana 2達241分。Arena官方稱，這是Image Arena文生圖排行榜迄今最大的分差。

發布當天，三榜通殺。

GPT Image 2上線12小時，Text-to-Image（文生圖）、Single-Image Edit（單圖編輯）、Multi-Image Edit（多圖編輯）三個分榜全部登頂。

Arena官方原話：「a clean sweep」（全勝）。

文生圖主榜，GPT Image 2 1512分，Nano Banana 2 1271分。241分差距，Arena史上最大。

「沒有任何模型曾以這種差距統治過Image Arena」，Arena官方表示。

在Image Arena所有盲測對決中，GPT Image 2的勝率是93%：100張圖配對盲選，93張人們選了OpenAI那張。

「如果把DALL-E看作洞穴壁畫，把Images 1.0視為古代藝術，那么Images 2.0就是文藝復興」。

OpenAI在發布會開場中這樣介紹Images 2.0，奧特曼更是將它稱作跨代升級：

這好像一下子從GPT-3躍升到了GPT-5。

https://www.youtube.com/watch?v=sWkGomJ3TLI

OpenAI官方API文檔對Images 2.0給出了一個最高級的評價。

https://developers.openai.com/api/docs/models/gpt-image-2

但真正的故事，并不在數據里。

被Google壓了半年

OpenAI總算扳回一局

時間倒回2025年8月。

Google放出了Nano Banana。這個在Gemini里嵌入的圖像生成模型，在C端瞬間引爆。

三個月后的Q3財報會上，Google CEO Sundar Pichai親口披露了一組數字：Gemini月活，從7月的4.5億漲到10月的6.5億。

Google Labs負責人Josh Woodward稱，這一增長很大程度上來自Nano Banana帶動的圖像生成熱潮。

11月，Google再發Nano Banana Pro。文本渲染能力驚艷，AI圖像第一次能把字寫對，OpenAI在C端被反超。

11月18日，Google再補一刀。Gemini 3發布即登頂LM Arena，1501分，首個突破1500的前沿模型。

這一月底，奧特曼對全公司發了一份「紅色警戒」（code red）的內部備忘錄。

據The Information報道，奧特曼私下告訴員工，Gemini 3可能給OpenAI帶來經濟逆風。Yahoo Finance后續披露：code red之下，OpenAI暫停了AI Agent等其他產品的研發，資源全部傾斜到ChatGPT。

12月，OpenAI倉促拿出GPT Image 1.5。Arena第一，但C端沒能引爆。

2026年2月，Google再補一刀，Nano Banana 2登場，Arena再度領先。

OpenAI又輸了一次。

一直到4月21日，GPT Image 2上線，OpenAI這才實現反超，重新扳回一局。

畫圖AI將被重新定義

GPT Image 2憑什么能領先241分？

核心答案藏在架構層面。

GPT Image 2不是Stable Diffusion那一代的擴散模型。

OpenAI研究負責人Boyuan Chen稱這是「revamped from scratch」（從零重構）的「generalist model」（通用模型），OpenAI的內部叫法是「圖像版的GPT」。

但Chen在press briefing時拒絕公開承認它具體是擴散還是自回歸架構。

外界普遍把它理解為「帶推理規劃的圖像生成系統」：畫之前先規劃，再下筆。這正是GPT Image 2和上一代圖像模型最大的不同。

OpenAI在官方說明里給了它一個新標簽：首個具備原生思考能力的圖像模型（image model with native thinking capabilities）。

畫之前先想、畫完自己檢查、需要時聯網搜索資料、一次能產出8張前后連貫的圖。

這不是畫筆，是會思考的視覺助理。

Arena榜單分項數據顯示：

文字渲染（Text Rendering）單項，GPT Image 2比前代漲了316分；卡通動漫和人像各漲296分；3個產品/3D/寫實分類，整體在+247到+277分區間。

文字渲染是2025年11月Nano Banana Pro首次解決的問題，但當時準確率94%。GPT Image 2把它推到了99%。

OpenAI發布會現場演示：讓GPT Image 2畫一碗米飯，其中只有一粒米上寫有模型名字。

具體到能力展示，OpenAI總裁Greg Brockman在自己的X賬號上做了示范。

第一個案例，老照片修復。

褪色發黃的家庭老照片，一個提示詞，立刻變身高清彩色版。

OpenAI官方API文檔里那句「high-fidelity image inputs」（高保真圖像輸入），說的就是模型對原圖細節的保留能力：輸入端能精確讀取褪色的、破損的、模糊的老照片細節，輸出端才能重新渲染出清晰版。

第二個案例中，Brockman轉發了用戶@doodlestein的一組測試圖：用同一個復雜提示詞讓GPT Image 2畫一張數學解釋圖。

他評價說，即便是復雜提示詞，GPT Image 2也能生成風格各異的圖。

@doodlestein 測試GPT Image 2用同一個提示詞畫一張線性代數解釋圖。模型一口氣畫出4個完全不同的版本：同樣是Mona Lisa+特征向量教學，每個版本的構圖、配色、信息密度完全不同。

這個案例真正價值不在「能畫數學圖」，而是解決了過去兩年中AI生圖的一個重要的痛點：輸出單一、變體可控性差。

GPT Image 2第一次讓「一個prompt給我4個完全不同的方向」變成了產品級能力。

業內一位LM Arena資深測試者點評道：

GPT Image 2和Nano Banana Pro之間的差距，跟Nano Banana Pro和DALL-E之間的差距一樣大。

跨了整整一代。

GPT Image 2 Thinking模式生成的manga風格漫畫頁：從一個簡單提示詞出發，模型保持角色一致性、鋪出多格劇情。

DALL-E退役

Adobe Canva被逼到墻角

發布當天，下游工具集成的速度比技術圈預期的還快。

Figma、Canva、Adobe Firefly、fal、Hermes Agent，全部在4月21日當天完成集成。

API定價更是暗藏殺機：

高質量出圖$0.21一張；ChatGPT Plus $20一個月，圖像生成已經包含在套餐里。

這個差價背后，可能帶來2026年圖像生成行業最大的產業重構。

GPT Image 2生成的photorealistic candid（寫實抓拍）。海岸、陰天、復古車、膠片質感——這種過去要專業攝影師外拍+后期才能達到的視覺效果，現在API $0.21一張。OpenAI研究員Gabriel Goh說，photorealism是他對這個模型最興奮的能力。

5月12日，DALL-E 2和DALL-E 3正式退役。

它們是2022年開啟了整個AIGC視覺革命的開山祖師。三年后，被OpenAI自家的繼承者，親手送入歷史。

OpenAI在官方發布說明里提到：

圖像不是裝飾，是語言。一張好圖做的事和一個好句子一樣：選擇、排列、揭示。

這代表了一種產品哲學的轉向。

當然，也不是沒有反方聲音。ZDNet在實測中發現，GPT Image 2無法準確復刻品牌logo，連ZDNet自己的logo都被畫歪了。

Nano Banana 2在portrait realism和multi-reference一致性上仍有優勢。

GPT Image 2雖然還不夠完美，但賽道格局已經出現了變化。

渲染時代結束了

推理時代剛開始

Google把推理塞進圖像模型里。OpenAI把圖像工具塞進推理模型里。242分Elo差距測的就是二者架構上的差異。

implicator.ai的這句評價，劃分了圖像生成的兩個時代。

2022到2025年，是渲染時代。

DALL-E、Midjourney、Stable Diffusion，目標都是「畫得像」。模型是畫筆，用戶是畫師，prompt是畫稿。

GPT Image 2代表的是一個推理時代。

模型先思考再下筆，能搜索、能自檢、能完成任務。它不是畫筆，是會畫畫的助手。

GPT Image 2發布真正值得重視的，是圖像生成走向「會思考」這件事本身。

短期看，Black Forest Labs（Flux 2）麻煩可能最大。

Kingy AI直言：作為diffusion-first（擴散為先）的廠商，Flux 2的整條技術流水線在架構上和「token-by-token」的推理路線是沖突的。

要么融合，要么重寫，沒有第三條路。

中期看，Google可能會在下個季度反擊。Nano Banana 3，或者Imagen-Reason，時間不會太久。

長期看，這件事的影響遠不止圖像生成。

當AI開始用「思考」來產出圖像、視頻、音頻、代碼，整個生成式AI的范式都會跟著發生變化。

去年12月，奧特曼在備忘錄里敲下「code red」的時候，應該沒想到五個月后會以這種方式回到Arena榜首。

但這次反殺的真正意義，可能不是OpenAI贏了Google，而是OpenAI改寫了圖像生成賽道的規則。

Arena.AI單圖編輯榜（Image Edit Arena）：GPT Image 2 (medium) 仍以1510+分繼續登頂，第二、三、四、五名全部被OpenAI自家模型和Google Gemini系列占據。https://arena.ai/leaderboard/image-edit

Google下一拳什么時候出？這個問題決定了2026下半年AI格局的走向。

而在那一拳揮出來之前，GPT Image 2會在Arena榜首坐多久，沒人知道。

參考資料：

https://x.com/gdb/status/2048449695622586576

https://arena.ai/leaderboard/image-edit

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

他設計出史上最丑奧特曼后被罵到退網，只因靈感來自偷看中國男娘

情報姬 2026-04-26 23:14:58
0 跟貼 0
小孩哥騎車分心沒看路，下一秒路邊停好的電動車尾箱被撞壞

樂動向前 2026-04-23 18:16:00
0 跟貼 0

別一用力給捏死了，這可太脆弱了

大嘴觀影 2026-04-26 14:39:06
3 跟貼 3

小時候看電影感受單純，長大后再看心境轉變，前后感覺大不同

冰心說影 2026-04-23 09:41:38
2 跟貼 2
澤塔奧特曼：遙輝，你身體借我用用

劇蜀黍影視 2026-04-26 14:46:41
3 跟貼 3

當視頻難以被表征1

機器之心Pro 2026-03-03 17:21:59
0 跟貼 0

微軟解綁OpenAI：轉為非獨家，停止收入分成

華爾街見聞官方 2026-04-27 21:48:24
1 跟貼 1
阿里HappyHorse突然上線！實測讓馬斯克和奧爾特曼法庭開撕，還手搓了GTA6

智東西 2026-04-27 21:12:09
0 跟貼 0

英霸已老，谷王當立 | 財經峰評

鈦媒體APP 2025-12-07 22:30:21
7 跟貼 7
世界模型雙冠王誕生！國產世界模型力壓谷歌、英偉達等持續領跑

機器之心Pro 2026-04-27 20:55:03
0 跟貼 0
谷歌計劃向Anthropic投資至多400億美元，支持后者大幅擴展算力

界面新聞 2026-04-25 10:46:52
0 跟貼 0
DeepSeek推理分裂出多重人格，越社交越聰明

量子位 2026-02-04 03:32:03
0 跟貼 0
紅色警戒-基地展開基地車遁入荒原，絕地重建防線！

剪輯師八條 2026-04-26 02:10:26
8 跟貼 8
男子曝入職全球頂尖科技公司時突然被降薪20萬，拒offer后被嘲諷：你的愛國情懷不值20萬嗎

爆角追蹤 2026-04-27 14:54:06
17151 跟貼 17151
AI大戰徹底打響！馬斯克與OpenAI今日將對簿公堂，徹底鬧崩

雷科技 2026-04-27 14:45:37
1 跟貼 1
微軟提出Computer-Using World Model，教智能體理解動作的后果

機器之心Pro 2026-03-09 11:59:44
0 跟貼 0
「龍蝦之父」吐槽人類互聯網后，終于有人把這當個事兒辦了

機器之心Pro 2026-03-31 11:09:26
0 跟貼 0
小男孩翻出陽臺玩耍，媽媽耐心引導其回室內，抓住瞬間憤怒值拉滿

星視頻 2026-04-27 07:54:01
126 跟貼 126
美股三大數走弱，英特爾盤中創歷史新高，存儲股大漲，中國金龍指數跌超1%

每日經濟新聞 2026-04-28 00:01:07
0 跟貼 0
硬剛GPT-Image-2！國產AI生圖“天花板”又被捅破了？

量子位 2026-04-25 15:01:42
15 跟貼 15
一大批高校，將搬遷！

吉刻新聞 2026-04-27 16:08:43
140 跟貼 140
AI能讓《原神》和“塞爾達”聯動后，還能相信“有圖有真相”嗎？

3DM游戲 2026-04-27 09:29:38
1 跟貼 1
5月1日懷集這里全城矚目！水上樂園新開放+奧特曼大戰怪獸，門票免費送！

懷集領域網 2026-04-27 09:42:10
2 跟貼 2
NASA公布拍攝到的不可思議的圖像，這該怎么解釋？

達達愛剪輯 2026-04-27 00:20:37
89 跟貼 89
AI狼人殺決戰，誰是國內推理天花板

思哲與創富 2026-04-27 10:28:17
1 跟貼 1
奧特曼和達里奧的十年恩怨，如何走到全面開戰？

量子位 2026-04-06 05:39:19
0 跟貼 0
還是奧特曼比較會玩

大鴨梨講電影啦 2026-04-26 14:45:03
1 跟貼 1
一位治療師為何公開質疑奧特曼

晚風也遺憾 2026-04-28 01:09:50
0 跟貼 0
一醫院原院長：我就像一個吸血鬼

南方都市報 2026-04-26 23:49:54
153 跟貼 153
半壁華人！GPT Image 2團隊曝光：無錫才俊帶隊，13人4個月封神

量子位 2026-04-23 16:07:27
8 跟貼 8
韓國人吹噓本國地圖像猛虎，評論區翻車笑死人：感覺更像大青蟲！

肆無忌憚的哭 2026-04-27 04:47:43
1 跟貼 1
安卓車載系統難用？我找到四個隱藏開關

算力游俠 2026-04-27 20:44:44
0 跟貼 0
手柄戰爭：Valve憑什么挑戰Xbox霸權？

野生運營 2026-04-28 01:09:02
0 跟貼 0
Snapchat提出Canvas-to-Image：一張畫布集成 ID、姿態與布局

機器之心Pro 2025-12-09 14:14:17
0 跟貼 0
泡泡瑪特推出Labubu冰箱，售價5999元，上千人預約

大象新聞 2026-04-26 13:01:02
5034 跟貼 5034
Gemini 3一句話打造拍立得應用刷屏！全網最火8個玩法都在這，看完秒上手

愛范兒 2025-11-20 18:04:33
29 跟貼 29
買衛生紙得多個心眼！這樣用可能致病又致癌——

BRTV新聞 2026-04-27 23:05:44
2 跟貼 2
曼聯為何將在對陣布倫特福德的比賽中更換胸前贊助商

綠茵情報局 2026-04-27 19:22:06
2 跟貼 2
“楊冪臉被蒸汽眼罩燙傷了”熱搜爆了，本人曬右眼下方紅色燙傷痕跡，并配文：蒸汽眼罩咬我

魯中晨報 2026-04-27 21:04:03
11 跟貼 11
江蘇一70多歲老人想打工，辦假證把年齡改小8歲，還特意染了黑發，民警：他老伴離世，自己一個人想找個工作充實自己

大象新聞 2026-04-27 11:17:05
597 跟貼 597

新智元

AI產業主平臺領航智能+時代

15077文章數 66815關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

教育

藝術

親子

房產

公開課

白巖松談人口老齡化：社會要降低老年人門檻
為什么人類有不同的膚色？
七個無法存下錢的壞習慣
李彥宏：百度離破產30天

手機 / 數碼

房產 / 家居

奧特曼「紅色警戒」5個月后，GPT Image 2屠榜，斷層領先反殺谷歌

DeepSeek V4上線三天，第一批實測出來了

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

坐在特朗普身邊親歷槍擊案的女記者 身份非常不一般

人類馬拉松"破二"新紀元，一場跑鞋軍備競賽

黃楊鈿甜為“耳環風波”出鏡道歉：謠言已澄清

Meta 140億收購Manus遭中國發改委否決

不那么小眾也可以 smart的路會越走越寬

態度原創

學生課堂偷吃、聽課“擺爛”……這位老師的應對方式絕了！

他的油畫筆觸粗獷又細膩，透著一種不可言說的美！

小姨又給妹妹買了好多衣服，姐做兼職給你買

信號！海南商業版圖，迎來大變局！

坐在特朗普身邊親歷槍擊案的女記者身份非常不一般

坐在特朗普身邊親歷槍擊案的女記者身份非常不一般