網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛！ChatGPT Images 2.0突然發(fā)布，實(shí)測(cè)強(qiáng)得離譜

2026-04-22 09:39:47　來(lái)源: 雷科技

廣東舉報(bào)

分享至

還在熬夜做圖的設(shè)計(jì)師們，這下真的有些尷尬了：在幾乎沒(méi)有預(yù)告的情況下，OpenAI 于北京時(shí)間 2026 年 4 月 22 日凌晨發(fā)布了 ChatGPT Images 2.0 模型（下文簡(jiǎn)稱(chēng) Images 2.0）。

和 ChatGPT 原本的生圖模型相比，Images 2.0 在圖片精度、語(yǔ)言支持、分辨率支持和交互方式上都有著相當(dāng)顯著的提升。值得一提的是，這次發(fā)布的 Images 2.0 甚至還擁有了思考的能力。

圖片來(lái)源：OpenAI

簡(jiǎn)單來(lái)說(shuō)，Images 2.0（現(xiàn)已在 ChatGPT、API 中使用）其實(shí)包含兩個(gè)模型（分支）：

1. 快速模型（Instant Model）可以處理絕大多數(shù)日常任務(wù)，比如制作 Logo、多語(yǔ)言海報(bào)甚至是文章配圖；

2. 思考模型（Thinking Model、需手動(dòng)切換）可以通過(guò)網(wǎng)絡(luò)查找相關(guān)信息，并在生圖前先對(duì)內(nèi)容進(jìn)行推理，并在一組輸出中保證畫(huà)面內(nèi)容連貫。

接下來(lái)我們直接用圖片來(lái)舉例。

下面這張照片是雷科技 AWE26 報(bào)道團(tuán)出發(fā)前拍的合照，我們直接把這張圖丟給 ChatGPT、輸出我們的需求：

圖片來(lái)源：雷科技

做一本《雷科技》科技雜志的封面，封面是圖片里這幾個(gè)人。

不到一分鐘，ChatGPT 就把封面做好了。可以看到全新的 Images 2.0，不僅不會(huì)把基礎(chǔ)圖片重繪（這是大多數(shù)生圖 AI 的通病），甚至連中文的部分都能正確繪制。

圖片來(lái)源：雷科技

但這還沒(méi)完，在提出「日期改成 2026 年 3月」「人的姿勢(shì)可以變一下，這樣太死板了」等模糊的提示詞后，ChatGPT 依舊能順利完成任務(wù)。

圖片來(lái)源：雷科技

同樣的，只要「喂」給 Images 2.0 一張手機(jī)外觀，ChatGPt 也能直接完成手機(jī)使用場(chǎng)景照。

圖片來(lái)源：雷科技

而在全新的圖片查看界面，ChatGPT 還加入了兩項(xiàng)全新的功能——我們可以直接選擇圖片需要修改的區(qū)域，要求 ChatGPT 做出修改，還可以直接在長(zhǎng)寬比選單中選擇需要輸出的圖片比例，自媒體配圖變得更方便了。

除了基于圖片生成新的圖片，Images 2.0 基于文字做圖的能力也有所提升。雷科技只給出了「電車(chē)通馬上要出發(fā)報(bào)道 2026 北京車(chē)展」的信息，Images 2.0 就能自己找齊相關(guān)信息，并正確輸出海報(bào)。

圖片來(lái)源：雷科技

較為可惜的是，盡管在 OpenAI 的直播中，Images 2.0 可以正確處理二維碼信息，但雷科技經(jīng)過(guò)多次嘗試，仍無(wú)法在圖片中嵌入可以被識(shí)別的二維碼。

圖片來(lái)源：雷科技

其實(shí)從效果來(lái)看，Images 2.0 的多語(yǔ)言支持已經(jīng)非常出色了。但為了拉開(kāi)能力差距，雷科技決定給 Images 2.0 上點(diǎn)強(qiáng)度：

生成一個(gè)照片風(fēng)格圖片：一幅毛筆書(shū)法作品在博物館展出，上書(shū)：北國(guó)風(fēng)光，千里冰封，萬(wàn)里雪飄。望長(zhǎng)城內(nèi)外，惟余莽莽；大河上下，頓失滔滔。山舞銀蛇，原馳蠟象，欲與天公試比高。須晴日，看紅裝素裹，分外妖嬈。江山如此多嬌，引無(wú)數(shù)英雄競(jìng)折腰。惜秦皇漢武，略輸文采；唐宗宋祖，稍遜風(fēng)騷。一代天驕，成吉思汗，只識(shí)彎弓射大雕。俱往矣，數(shù)風(fēng)流人物，還看今朝。

盡管文本內(nèi)容更長(zhǎng)，不過(guò) ChatGPT 仍在一分鐘之內(nèi)就輸出了結(jié)果。可以看出，Images 2.0 的中文支持確實(shí)不錯(cuò)，字體字形基本沒(méi)有問(wèn)題，但書(shū)法的「質(zhì)感」仍有欠缺，怎么看都像是「印刷品」。

圖片來(lái)源：雷科技

說(shuō)完 Instant Model，我們?cè)賮?lái)看看思考模式的能力。這次雷科技直接給 Images 2.0 準(zhǔn)備了一道大題：

以上圖里的形象為漫畫(huà)主角，生成一部摩托車(chē)為主題的短篇漫畫(huà)，篇幅至少要 8 頁(yè)，封面和封底為彩色，其余為黑白，畫(huà)風(fēng)參考石森章太郎。

接到需求后，Images 2.0 會(huì)有一個(gè)明顯的思考推理步驟；點(diǎn)開(kāi)推理詳情，我們甚至能看到 Images 2.0 編寫(xiě)對(duì)話(huà)的過(guò)程。這其實(shí)越正常，畢竟我并沒(méi)有給出任何關(guān)于劇情的提示詞，全權(quán)交給 Images 2.0 自由發(fā)布。

在耗時(shí) 11 分鐘后，Images 2.0 成功輸出了一組 8 張圖。值得注意的是，Images 2.0 不僅在 8 張圖中做到了畫(huà)風(fēng)和細(xì)節(jié)的統(tǒng)一（除了時(shí)有時(shí)無(wú)的頭盔），甚至連劇情都能保持上下文連貫。這種超長(zhǎng)連續(xù)推理能力，即使是 Nano Banana 也難以做到。

也正因如此，雷科技認(rèn)為，Images 2.0 的表現(xiàn)，完全可以用一騎絕塵來(lái)形容。

因?yàn)橛|發(fā)了 ChatGPT Plus 用戶(hù)的公平使用限額機(jī)制，雷科技的 Images 2.0 體驗(yàn)到這里就暫告一段落了。但就雷科技的體驗(yàn)來(lái)說(shuō)，Images 2.0 的能力上限遠(yuǎn)不僅如此：

除了支持中文（及印地語(yǔ)、日語(yǔ)等多種亞洲語(yǔ)言）、連續(xù)推理等能力外，在直播中，OpenAI 還提到了Images 2.0 能在米粒上寫(xiě)字的超精細(xì)制圖能力，以及生成 360 度全景照片的能力。

圖片來(lái)源：OpenAI

也正因 Images 2.0 制圖效果如此出色，雷科技認(rèn)為 Images 2.0 的登場(chǎng)，也標(biāo)志著 AI 生圖正式告別了那個(gè)靠玄學(xué)提示詞「抽卡」的蠻荒時(shí)代。

如果大家有玩過(guò) Stable Diffusion 等早期文生圖 AI，應(yīng)該對(duì)文生圖的「蠻荒時(shí)代」有印象：你可能第一次嘗試就做出了自己想要的圖片，也可能來(lái)來(lái)回回調(diào)整提示詞，用兩個(gè)小時(shí)生成了幾百 GB 的廢片，體驗(yàn)甚至比二次元「抽卡手游」還要差——二游至少有保底機(jī)制。

在當(dāng)時(shí)，我們?nèi)绻胍ＷC圖片「有較大概率符合要求」，就必須用 ComfyUI；而 ComfyUI 復(fù)雜的節(jié)點(diǎn)設(shè)計(jì)，從某種意義上也違背了 AI 生圖「偷懶」的目標(biāo)。

但 Images 2.0 引入「思考模型」后，AI 第一次具備了長(zhǎng)文本邏輯解析與時(shí)空一致性的推理能力。

以剛剛提到的畫(huà)漫畫(huà)工作流為例，Images 2.0 可以先理解場(chǎng)景、構(gòu)思劇情、布局文字，最后再落筆。這種從底層邏輯出發(fā)的進(jìn)化，直接解決了 AI 繪畫(huà)中「文字崩壞」與「畫(huà)風(fēng)不統(tǒng)一」這兩大問(wèn)題，極大地拓寬了 AI 的生產(chǎn)力邊界。

圖片來(lái)源：OpenAI

可以肯定的是，Images 2.0 的出現(xiàn)，對(duì)于繪畫(huà)、攝影行業(yè)的沖擊極為「慘烈」；而從 AI 發(fā)展的角度看，OpenAI 也再次證明了單純的分辨率并不能從根本提升 AI 的工作效率，推理能力才是 AI 圖像的核心競(jìng)爭(zhēng)力領(lǐng)域。

在 AI 圖像時(shí)代，OpenAI 已經(jīng)為我們開(kāi)了一個(gè)好頭。接下來(lái)，就得看 Google 和國(guó)內(nèi) AI 巨頭們?cè)撊绾螒?yīng)對(duì)了。

2026第十九屆北京國(guó)際汽車(chē)展覽會(huì)將于4月24日至5月3日在北京?中國(guó)國(guó)際展覽中心（順義館）和首都國(guó)際會(huì)展中心（新國(guó)展二期）舉行，本屆車(chē)展以“領(lǐng)時(shí)代·智未來(lái)”為主題，集中展現(xiàn)汽車(chē)工業(yè)的更多黑科技。
比亞迪、小米、鴻蒙智行（問(wèn)界等）、小鵬、蔚來(lái)、嵐圖等頭部品牌集結(jié)，多款重磅新車(chē)首秀；地平線(xiàn)、Momenta、卓馭等供應(yīng)商集體秀肌肉，AI大模型深度賦能，高階智駕、動(dòng)力電池、超快充技術(shù)等前沿科技集中亮相，看點(diǎn)拉滿(mǎn)！
雷科技旗下「電車(chē)通」將派出報(bào)道團(tuán)直擊現(xiàn)場(chǎng)，以“關(guān)注電動(dòng)車(chē)，更懂智能化”的專(zhuān)業(yè)視角，帶來(lái)一線(xiàn)獨(dú)家報(bào)道，敬請(qǐng)關(guān)注！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.