作者|子川
來源|AI先鋒官
圖片模型又迎來一位重磅好手!
今年3月份,OpenAI的GPT-4o的圖片生成功能一經上線,瞬間風靡全球。
只需一句提示詞,就可輕松實現在線編輯圖片,指哪改哪。
森林實驗室推出FLUX.1 Kontext模型,將角色一致性,局部編輯的能力又拔高了一大截。
而就在最近,一款名為Nano-Banana的神秘圖像編輯AI模型悄然現身lmarena平臺。
訊速在X上刷屏了,不少網友體驗過后,直呼和flux kontext不相上下。
![]()
更有爆料稱:這是谷歌正在測試的新模型。
![]()
話不多說,我們來看看效果如何
有網友上傳了一張動漫風格的生物圖片,要求將其置于暴風雪中的山區。
提示詞:"Place the creature roaming across a a mountainous region in the middle of a blizzard"
![]()
結果如下:
![]()
Nano-Banana Flux Kontext MAX
從生成效果來看,兩款模型都精準地保留了原圖中生物的所有細節特征。
相較之下,Nano-Banana在背景融合方面表現得更為自然,光影和氛圍的統一性更好。
另一位網友則嘗試將蘋果公司CEO蒂姆·庫克的照片與一張網傳的iPhone 17進行融合。
輸入圖片:
![]()
結果如下:
![]()
效果是不是不錯?
小編為了進一步了解Nano-Banana和 Flux Kontext MAX到底誰更強一點,對它們倆進行了對比測試。
先來看文字修改能力,上傳一張帶有字母“Petrichor”的圖片,要求將文字替換為“This is my House”,同時保持圖片其他元素不變。
提示詞:Change 'Petrichor' in the image to 'This my house', and keep everything else the same.
![]()
結果如下:
![]()
Nano-Banana Flux Kontext MAX
Nano-Banana和 Flux Kontext MAX都很完美的遵循了提示詞的指令。
不過也有細微的不同,Flux Kontext MAX模型將雨滴給消除了。
除了修改文字外,再來看看它們消除文字的能力。
一開始我跑了很多案例,Nano-Banana和 Flux Kontext MAX表現都很好。
直到我換上了這張具有3D文字效果的海報,Nano-Banana就有點招架不住了。
提示詞:Remove all the text, keep the rest unchanged.
![]()
結果如下:
![]()
Nano-Banana Flux Kontext MAX
FLUX Kontext MAX干凈利落地移除了所有文字,而Nano-Banana在處理后,圖片上卻留下了兩塊大小不一的紅色色塊
再來看看它的角色一致的能力,上傳一張身穿綠色小姐姐的圖片,要求模型生成一張她正從俯視角度拿著手機自拍的圖片。
提示詞:The girl is sitting on the grass, taking a selfie with her phone from a bird's-eye view.
![]()
結果如下:
![]()
Nano-Banana Flux Kontext MAX
效果一目了然,Nano-Banana更勝一籌,并且還解決了 Flux Kontext MAX清晰度不夠的問題。
不過Nano-Banana有一個致命的缺陷,它的手指和腳趾的數量對不上,變成了四根手指頭和六根腳趾了。。。
再來看看它們復雜指令的遵循能力。
要求將原圖中的綠色裙子改為白色,人物拿著一把透明雨傘,并保持低頭站立的姿勢。
提示詞:The green dress is changed to a white dress, holding a transparent umbrella, standing with the head bowed down, at eye level.
![]()
Nano-Banana Flux Kontext MAX
Nano-Banana將所有的文字指令都呈現出來了,FLUX Kontext MAX則忽略了“站立”這一動作
不過Nano-Banana的手指頭和腳趾頭的數量又不對了,手指問題似乎是這個模型的通病。
再來一個難度更大的,上傳一張人物細節滿滿的側臉圖(有水印),讓臉轉向前面。
提示詞:The girl's head turned around, facing forward.
![]()
結果如下:
![]()
Nano-Banana Flux Kontext MAX
Flux Kontext MAX只生出了半邊耳機,而且正視圖和側視圖像換了個人一樣,并且把我水特意準備的水印給消除掉了。
Nano-Banana生成的效果就十分不錯,和原圖的神韻高度一致,但也有瑕疵,就是臉上的紅暈沒了。
總的來說,Nano-Banana模型在背景融合、復雜指令遵循以及高難度圖像重繪等方面的能力確實不錯,甚至在部分場景比FLUX Kontext MAX表現的更好,但存在手部細節方面的短板。
目前這款模型上架到LMSYS Arena平臺,這款模型出現的概率還是挺高的,大家感興趣可以去玩一下。
傳送門:
https://lmarena.ai/?chat-modality=image
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.