![]()
作者 | 阿虎 石瀨
編輯 | Kino
AI生圖界,最近真是要過年了。
谷歌Nano Banana模型還沒玩夠,字節最新圖像創作模型Seedream 4.0又來了。該模型的核心亮點是首次支持多模態生圖,同一模型可以實現文生圖、圖像編輯、組圖生成等多種任務。
簡單來說就是,無論是用AI“無中生有”,還是用AI實現精準P圖,Seedream 4.0都比以往版本的模型體驗更絲滑、更可控。
更讓我們期待的是,或許Seedream 4.0可以解決Nano Banana中文字生成不穩定、圖片比例不可控等問題。對國內大多數用戶來說,Seedream 4.0如果在性能上能打,那以后也不必大費周章非要用Nano Banana了。
目前,Seedream 4.0模型已陸續全量上線即夢、豆包App和扣子空間。我們第一時間上手,設計了幾個貼近日常使用場景的實測案例,讓Seedream 4.0和Nano Banana來了場PK,下面一起來看看“豆包大戰香蕉”,誰會是新的P圖之王?
![]()
連續修改同一張圖人物保持不變
我們先是把一張馬斯克的圖片“喂”給了豆包和Nano Banana,讓它們更換原圖背景的同時保持人物表情不變。
原圖:
![]()
背景圖:
![]()
提示詞:把圖1背景換成圖2。
![]()
可以看到,兩個模型都遵循了提示詞的要求。不過,左邊豆包生成的圖片色彩飽和度更高,右邊Nano Banana更為嚴謹地引用了用戶上傳的參考圖。
接著我們試著調整了一下圖中馬斯克發型和妝造。
提示詞:把他的發型換成搖滾長發男,加上煙熏妝。
![]()
Nano Banana
![]()
豆包
有一說一,豆包生成的搖滾長發男還真是那個味兒,雖然提示詞里沒有要求更改衣服和面部裝飾,但它生成的圖片確實更符合我們預期的想要生成的形象。
在創意發揮上,豆包更勝一籌,能舉一反三生成更符合搖滾氛圍的整體形象;而在指令的精準遵循上,Nano Banana的表現則更為嚴謹。但總的來說,AI生圖模型在人物一致性方面確實保持得越來越好了。
![]()
生成真實感自拍圖
提示詞:請畫一張極其平凡無奇的iPhone自拍照,沒有明確的主體或構圖感,就像是隨手一拍的快照。照片略帶運動模糊,陽光或店內燈光不均導致輕微曝光過度。角度尷尬、構圖混亂,整體呈現出一種刻意的平庸感,就像是從口袋里拿手機時不小心拍到的一張自拍。主角是水豚(卡皮巴拉),背景是大學校園的宿舍里。
![]()
左邊為Nano Banana;右邊為豆包生成
豆包和Nano Banana都精準生成了水豚、宿舍等樣式,還成功復刻了國內外大學寢室之間的差異性。
值得一提的是,實測過程中我們發現,Nano Banana支持基于上下文的多輪圖片編輯,但豆包需要再次上傳圖片、下達新指令,體驗稍顯繁瑣。
![]()
基于參考圖生成寵物手辦
另外,我們可以上傳單張或者多張圖片,再加上具體的指令,進行任何形式的圖片編輯。
提示詞:基于參考圖,將角色轉換為1/6比例的高完成度PVC靜態手辦的圖片,圖片中該角色置于手中,手辦背后是一只較大的手辦品牌開窗盒,正面透明塑料窗可看見同款手辦的本體和配件。室內暖色燈光,柔和的45°主光+頂補光;單反攝影質感,50mm鏡頭,f/2.8,淺景深,真實PVC/ABS塑料反射,噴涂陰影、細微合模線與微劃痕,桌面反射與顆粒感,背景輕微散景。
![]()
從左至右,分別是參考圖、豆包生成、Nano Banana生成
![]()
米其林級別的可視化食譜
提示詞:參照這張圖的展示風格,把絲瓜湯的制作步驟變成可視化食譜
![]()
優雅,太優雅了。在這一輪的比拼中,兩者可以說是棋逢對手,都生成了質感高級、菜譜清晰、風格統一的圖片。有趣的是,在豆包的概念中,絲瓜湯是一定要配雞蛋的,符合中式大廚的習慣偏好。
接著,我們再試試豆包和Nano Banana生成組圖的能力,舉個例子,我們只給一道菜名,看看AI是不是能生成前后相符的關聯性圖像,把整個制作過程“想象”出來。
提示詞:手繪風格,做出一張絲瓜湯的制作步驟完整教程的長圖,步驟說明要中文
![]()
豆包生成了4張連續圖片
![]()
Nano Banana生成圖片
在生成連續長圖方面,兩個模型都還有待完善,豆包還無法將整個制作過程完整地展示在一張長圖上,而Nano Banana生成中文的能力依然是短板。
但讓我們驚喜的是,豆包對漫畫風格的一致性“拿捏”得很好。對于有分鏡制作需求的漫畫師、導演、創作者來說,它或許會是一個“好幫手”,更好地幫助你發散靈感。
最后,再給你們開開眼,當豆包家族“玩梗”絲瓜湯:
提示詞:幫我生成圖片:風格不變,把圖中的女生變成老奶奶的樣子,手里端著一碗綠色的絲瓜湯,下方寫著文字“喝點絲瓜湯降降火”。比例 1:1。
![]()
幫我生成圖片:風格不變,把圖中的男生變成老大爺的樣子,戴著老花眼鏡,用手指著鏡頭,下方寫著文字“那你錯了”。比例 1:1。
![]()
提示詞:讓這四個人圍坐在一個飯桌前,桌上擺滿了用絲瓜做成的菜,背景是家里的餐廳,比例16:9
![]()
話說回來,自從前兩周Nano Banana掀起生圖熱潮以來,網友們發掘出了成百上千個AI生圖的“邪修玩法”,甚至有報道直言“屬于AI生圖的ChatGPT時刻來了”。
從我們的實測來看,這場對決沒有絕對的贏家,更像是兩位高手過招。盡管兩者在細節上仍有所欠缺,但兩者的價值或許不在于一時的技術比拼,而是在一次次技術進步中,用越來越低的門檻,推動我們邁向一個AI生圖的新時代。
「AI新榜交流群」進群方式:添加微信“banggebangmei”并備注姓名+職業/公司+進群,歡迎玩家們來群里交流,一起探索見證AI的進化。
歡迎分享、點贊、推薦
一起研究AI
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.