作者|子川
來源|AI先鋒官
面對(duì)Google Nanobanana Pro的強(qiáng)勢出擊,OpenAI終于坐不住了。
就在剛剛,OpenAI推出了新一代圖片生成模型——GPTImage 1.5。
此次OpenAI瞄準(zhǔn)的核心是一個(gè)長期困擾用戶的痛點(diǎn):圖片編輯的一致性問題。
此前的GPT-4o生圖雖然在網(wǎng)上掀起過一場"吉卜力美學(xué)"的熱潮,但其最大的軟肋就是編輯時(shí)的一致性不行。
除了一致性的改進(jìn),新模型的生成速度也提升到了之前的四倍,同時(shí)新模型對(duì)指令的遵循也更加可靠。
還有大家關(guān)心的價(jià)格,GPT Image 1.5 的圖像輸入和輸出成本比上一代降低了 20%。
此外,ChatGPT還給生圖功能配套了一個(gè)全新的獨(dú)立使用界面,內(nèi)置了豐富的風(fēng)格庫和很多創(chuàng)意的玩法。
![]()
不過這里有一個(gè)壞消息,OpenAI明確指出,不支持中文。
在我們實(shí)測的過程中也發(fā)現(xiàn)了這個(gè)問題,中文生成的效果非常糟糕。
![]()
那它的其他的效果怎么樣呢?老規(guī)矩,我們實(shí)際測試一番。
先來看GPT Image 1.5的一致性效果如何?
案例一:背景移除
提示詞:移除背景中的任何人物,同時(shí)保持主要人物不變。自然地填補(bǔ)背景,使其看起來好像那些人從未存在過。
![]()
除了消除背景中的人物外,其他的物體都沒有變化,而且它還補(bǔ)全了之前被人物遮擋的畫面。
案例二:單屬性編輯
提示詞:把她的頭發(fā)顏色換成金色/橘色/粉色/紅色,保持發(fā)型和人物不變
![]()
這組會(huì)更加直觀,除了發(fā)色變了之外,衣服上的花紋、紋理都沒有任何變化。
案例三:三視技術(shù)圖
提示詞:請(qǐng)根據(jù)圖片精細(xì)繪制cybertruck的標(biāo)準(zhǔn)三視技術(shù)圖,并補(bǔ)充爆炸分解展示。所有主要部件用英文標(biāo)注名稱及功能說明,標(biāo)明關(guān)鍵尺寸,布局清晰現(xiàn)代、具有科技感,整體規(guī)范符合工業(yè)工程制圖標(biāo)準(zhǔn)。
![]()
![]()
效果依舊不錯(cuò),整個(gè)畫面是清晰、可讀的。每部件都有英文標(biāo)標(biāo)簽,分解部分也是專業(yè)。
案例4:黑白圖上色
提示詞:給圖片進(jìn)行上色
![]()
上色的效果很好,細(xì)節(jié)沒有喪失。整個(gè)畫面依舊充滿故事性的,并不是看起來不自然。
案例5:YouTube封面
提示詞:幫我生成youtube的封面圖
![]()
整個(gè)圖片構(gòu)圖非常好,無論是文字的主體突出、排版還是上色,都十分協(xié)調(diào)。
案例6:紙張修復(fù)
提示詞:修復(fù)撕毀的紙張,還原完整清晰的文字和筆跡
![]()
這一組明顯翻車了。根據(jù)第一張圖看,"TH"和"DE"各自是一行的,但還原的圖片同樣把它們放到了同一行。
案例七:多人物一致性
提示詞:制作一個(gè)好萊塢級(jí)別的真人英雄海報(bào),這6個(gè)人都在海報(bào)封面上
![]()
其他人物還原的都很好。但山姆.奧特曼像是開了美顏似的,他的下顎線有這么鋒利嗎?
目前,GPTImage 1.5已經(jīng)向全球所有 ChatGPT 用戶和 API 用戶推出,免費(fèi)用戶也可以使用,感興趣的可以去試玩一下。
掃碼邀請(qǐng)進(jìn)群,我們帶你一起來玩轉(zhuǎn)ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學(xué)一些AI搞錢技能。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.