OpenAI于昨日(4月21日)正式推出ChatGPT Images 2.0,底層采用全新圖像生成模型gpt-image-2。新模型在文本渲染、復(fù)雜布局、多語言支持及寫實能力上實現(xiàn)了顯著突破,同時內(nèi)容生成尺度較以往版本明顯放開,迅速引發(fā)全球AI社區(qū)的熱議。
![]()
最具代表性的案例來自網(wǎng)友生成的游戲截圖。他使用簡單提示詞直接生成了一組以《金瓶梅》為主題的古代ARPG MMO開放世界游戲截圖。畫面中呈現(xiàn)了古典街景、西門慶府等《金瓶梅》小說中的經(jīng)典場景,并配有完整的游戲UI框架以及游戲角色。圖像細節(jié)豐富、光影自然、風(fēng)格逼真,幾乎讓人誤以為是真實游戲的截圖。
![]()
![]()
OpenAI官方表示,gpt-image-2是其迄今最強大的圖像生成模型,支持Instant(即時生成)和Thinking(思考模式)兩種方式。在Thinking模式下,模型可以先行推理、搜索網(wǎng)頁信息、自我校驗,再輸出多張一致性圖像,尤其擅長雜志排版、信息圖、游戲UI、漫畫故事板等復(fù)雜布局。OpenAI甚至用該模型生成了整個官方發(fā)布頁面,充分展示了其在精確文本渲染和視覺連貫性上的實力。
![]()
業(yè)內(nèi)人士評價稱,新模型在多語言文本、全信息圖和復(fù)雜場景生成上“近乎完美”,標(biāo)志著圖像生成從“快速繪制”向“智能創(chuàng)作”的轉(zhuǎn)變。盡管OpenAI仍保留一定內(nèi)容安全機制,但此次《金瓶梅》主題案例凸顯模型在敏感題材上的尺度明顯擴大,引發(fā)了用戶對內(nèi)容政策調(diào)整的討論。
![]()
有專家指出,這類能力提升將大幅降低游戲開發(fā)、影視概念設(shè)計和視覺內(nèi)容創(chuàng)作的門檻,但也需要警惕深度偽造等潛在風(fēng)險。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.