還在熬夜做圖的設(shè)計(jì)師們,這下真的有些尷尬了:在幾乎沒(méi)有預(yù)告的情況下,OpenAI 于北京時(shí)間 2026 年 4 月 22 日凌晨發(fā)布了 ChatGPT Images 2.0 模型(下文簡(jiǎn)稱(chēng) Images 2.0)。
和 ChatGPT 原本的生圖模型相比,Images 2.0 在圖片精度、語(yǔ)言支持、分辨率支持和交互方式上都有著相當(dāng)顯著的提升。值得一提的是,這次發(fā)布的 Images 2.0 甚至還擁有了思考的能力。
![]()
圖片來(lái)源:OpenAI
簡(jiǎn)單來(lái)說(shuō),Images 2.0(現(xiàn)已在 ChatGPT、API 中使用)其實(shí)包含兩個(gè)模型(分支):
1. 快速模型(Instant Model)可以處理絕大多數(shù)日常任務(wù),比如制作 Logo、多語(yǔ)言海報(bào)甚至是文章配圖;
2. 思考模型(Thinking Model、需手動(dòng)切換)可以通過(guò)網(wǎng)絡(luò)查找相關(guān)信息,并在生圖前先對(duì)內(nèi)容進(jìn)行推理,并在一組輸出中保證畫(huà)面內(nèi)容連貫。
接下來(lái)我們直接用圖片來(lái)舉例。
下面這張照片是雷科技 AWE26 報(bào)道團(tuán)出發(fā)前拍的合照,我們直接把這張圖丟給 ChatGPT、輸出我們的需求:
![]()
圖片來(lái)源:雷科技
做一本《雷科技》科技雜志的封面,封面是圖片里這幾個(gè)人。
不到一分鐘,ChatGPT 就把封面做好了。可以看到全新的 Images 2.0,不僅不會(huì)把基礎(chǔ)圖片重繪(這是大多數(shù)生圖 AI 的通病),甚至連中文的部分都能正確繪制。
![]()
圖片來(lái)源:雷科技
但這還沒(méi)完,在提出「日期改成 2026 年 3月」「人的姿勢(shì)可以變一下,這樣太死板了」等模糊的提示詞后,ChatGPT 依舊能順利完成任務(wù)。
![]()
圖片來(lái)源:雷科技
同樣的,只要「喂」給 Images 2.0 一張手機(jī)外觀,ChatGPt 也能直接完成手機(jī)使用場(chǎng)景照。
![]()
圖片來(lái)源:雷科技
而在全新的圖片查看界面,ChatGPT 還加入了兩項(xiàng)全新的功能——我們可以直接選擇圖片需要修改的區(qū)域,要求 ChatGPT 做出修改,還可以直接在長(zhǎng)寬比選單中選擇需要輸出的圖片比例,自媒體配圖變得更方便了。
![]()
除了基于圖片生成新的圖片,Images 2.0 基于文字做圖的能力也有所提升。雷科技只給出了「電車(chē)通馬上要出發(fā)報(bào)道 2026 北京車(chē)展」的信息,Images 2.0 就能自己找齊相關(guān)信息,并正確輸出海報(bào)。
![]()
圖片來(lái)源:雷科技
較為可惜的是,盡管在 OpenAI 的直播中,Images 2.0 可以正確處理二維碼信息,但雷科技經(jīng)過(guò)多次嘗試,仍無(wú)法在圖片中嵌入可以被識(shí)別的二維碼。
![]()
圖片來(lái)源:雷科技
其實(shí)從效果來(lái)看,Images 2.0 的多語(yǔ)言支持已經(jīng)非常出色了。但為了拉開(kāi)能力差距,雷科技決定給 Images 2.0 上點(diǎn)強(qiáng)度:
生成一個(gè)照片風(fēng)格圖片:一幅毛筆書(shū)法作品在博物館展出,上書(shū): 北國(guó)風(fēng)光,千里冰封,萬(wàn)里雪飄。望長(zhǎng)城內(nèi)外,惟余莽莽;大河上下,頓失滔滔。山舞銀蛇,原馳蠟象,欲與天公試比高。須晴日,看紅裝素裹,分外妖嬈。 江山如此多嬌,引無(wú)數(shù)英雄競(jìng)折腰。惜秦皇漢武,略輸文采;唐宗宋祖,稍遜風(fēng)騷。一代天驕,成吉思汗,只識(shí)彎弓射大雕。俱往矣,數(shù)風(fēng)流人物,還看今朝。
盡管文本內(nèi)容更長(zhǎng),不過(guò) ChatGPT 仍在一分鐘之內(nèi)就輸出了結(jié)果。可以看出,Images 2.0 的中文支持確實(shí)不錯(cuò),字體字形基本沒(méi)有問(wèn)題,但書(shū)法的「質(zhì)感」仍有欠缺,怎么看都像是「印刷品」。
![]()
圖片來(lái)源:雷科技
說(shuō)完 Instant Model,我們?cè)賮?lái)看看思考模式的能力。這次雷科技直接給 Images 2.0 準(zhǔn)備了一道大題:
![]()
以上圖里的形象為漫畫(huà)主角,生成一部摩托車(chē)為主題的短篇漫畫(huà),篇幅至少要 8 頁(yè),封面和封底為彩色,其余為黑白,畫(huà)風(fēng)參考石森章太郎。
接到需求后,Images 2.0 會(huì)有一個(gè)明顯的思考推理步驟;點(diǎn)開(kāi)推理詳情,我們甚至能看到 Images 2.0 編寫(xiě)對(duì)話(huà)的過(guò)程。這其實(shí)越正常,畢竟我并沒(méi)有給出任何關(guān)于劇情的提示詞,全權(quán)交給 Images 2.0 自由發(fā)布。
在耗時(shí) 11 分鐘后,Images 2.0 成功輸出了一組 8 張圖。值得注意的是,Images 2.0 不僅在 8 張圖中做到了畫(huà)風(fēng)和細(xì)節(jié)的統(tǒng)一(除了時(shí)有時(shí)無(wú)的頭盔),甚至連劇情都能保持上下文連貫。這種超長(zhǎng)連續(xù)推理能力,即使是 Nano Banana 也難以做到。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
![]()
也正因如此,雷科技認(rèn)為,Images 2.0 的表現(xiàn),完全可以用一騎絕塵來(lái)形容。
因?yàn)橛|發(fā)了 ChatGPT Plus 用戶(hù)的公平使用限額機(jī)制,雷科技的 Images 2.0 體驗(yàn)到這里就暫告一段落了。但就雷科技的體驗(yàn)來(lái)說(shuō),Images 2.0 的能力上限遠(yuǎn)不僅如此:
除了支持中文(及印地語(yǔ)、日語(yǔ)等多種亞洲語(yǔ)言)、連續(xù)推理等能力外,在直播中,OpenAI 還提到了Images 2.0 能在米粒上寫(xiě)字的超精細(xì)制圖能力,以及生成 360 度全景照片的能力。
![]()
圖片來(lái)源:OpenAI
![]()
圖片來(lái)源:OpenAI
也正因 Images 2.0 制圖效果如此出色,雷科技認(rèn)為 Images 2.0 的登場(chǎng),也標(biāo)志著 AI 生圖正式告別了那個(gè)靠玄學(xué)提示詞「抽卡」的蠻荒時(shí)代。
如果大家有玩過(guò) Stable Diffusion 等早期文生圖 AI,應(yīng)該對(duì)文生圖的「蠻荒時(shí)代」有印象:你可能第一次嘗試就做出了自己想要的圖片,也可能來(lái)來(lái)回回調(diào)整提示詞,用兩個(gè)小時(shí)生成了幾百 GB 的廢片,體驗(yàn)甚至比二次元「抽卡手游」還要差——二游至少有保底機(jī)制。
在當(dāng)時(shí),我們?nèi)绻胍WC圖片「有較大概率符合要求」,就必須用 ComfyUI;而 ComfyUI 復(fù)雜的節(jié)點(diǎn)設(shè)計(jì),從某種意義上也違背了 AI 生圖「偷懶」的目標(biāo)。
但 Images 2.0 引入「思考模型」后,AI 第一次具備了長(zhǎng)文本邏輯解析與時(shí)空一致性的推理能力。
以剛剛提到的畫(huà)漫畫(huà)工作流為例,Images 2.0 可以先理解場(chǎng)景、構(gòu)思劇情、布局文字,最后再落筆。這種從底層邏輯出發(fā)的進(jìn)化,直接解決了 AI 繪畫(huà)中「文字崩壞」與「畫(huà)風(fēng)不統(tǒng)一」這兩大問(wèn)題,極大地拓寬了 AI 的生產(chǎn)力邊界。
![]()
圖片來(lái)源:OpenAI
可以肯定的是,Images 2.0 的出現(xiàn),對(duì)于繪畫(huà)、攝影行業(yè)的沖擊極為「慘烈」;而從 AI 發(fā)展的角度看,OpenAI 也再次證明了單純的分辨率并不能從根本提升 AI 的工作效率,推理能力才是 AI 圖像的核心競(jìng)爭(zhēng)力領(lǐng)域。
在 AI 圖像時(shí)代,OpenAI 已經(jīng)為我們開(kāi)了一個(gè)好頭。接下來(lái),就得看 Google 和國(guó)內(nèi) AI 巨頭們?cè)撊绾螒?yīng)對(duì)了。
2026第十九屆北京國(guó)際汽車(chē)展覽會(huì)將于4月24日至5月3日在北京?中國(guó)國(guó)際展覽中心(順義館)和首都國(guó)際會(huì)展中心(新國(guó)展二期)舉行,本屆車(chē)展以“領(lǐng)時(shí)代·智未來(lái)”為主題,集中展現(xiàn)汽車(chē)工業(yè)的更多黑科技。
比亞迪、小米、鴻蒙智行(問(wèn)界等)、小鵬、蔚來(lái)、嵐圖等頭部品牌集結(jié),多款重磅新車(chē)首秀;地平線(xiàn)、Momenta、卓馭等供應(yīng)商集體秀肌肉,AI大模型深度賦能,高階智駕、動(dòng)力電池、超快充技術(shù)等前沿科技集中亮相,看點(diǎn)拉滿(mǎn)!
雷科技旗下「電車(chē)通」將派出報(bào)道團(tuán)直擊現(xiàn)場(chǎng),以“關(guān)注電動(dòng)車(chē),更懂智能化”的專(zhuān)業(yè)視角,帶來(lái)一線(xiàn)獨(dú)家報(bào)道,敬請(qǐng)關(guān)注!
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.