昨天跟大家簡單說了Nano Banana 2上線以及它的一些能力,
然后跟大家立flag說我今天會出一篇Nano Banana Pro和 Nano Banana 2的效果對比。
我的年費Lovart第一時間上線了Nano Banana 2,而且Gemini里現(xiàn)在都沒有辦法主動切換Pro還是2
![]()
所以我和Lovart 一拍即合,從人物海報、產(chǎn)品設(shè)計、推理能力、分格漫畫、多文字信息圖、文字翻譯6個方面對比了20個case,讓大家全方位地感受 Nano Banana Pro 和 Nano Banana 2 的區(qū)別。
Here we go!
老規(guī)矩,因為有的圖片提示語很長,所以給大家整理了文檔,后臺回復(fù)“banana2”就可以了
ps.下面的所有對比圖順序都為左邊是原圖,中間是Banana Pro生成,右邊是Banana 2生成。
先看幾組人物海報,
這張圖我是讓Banana Pro(中間)和Banana 2(右邊)把我的照片改成黃色寸頭,然后做了一個 Vogue 風格的封面。可以看到,兩張圖在人臉部分其實沒什么太大區(qū)別,但是一張保留了眼鏡,一張沒有保留。其實這個我并沒有給出具體的提示,整體上來看差別不大。
![]()
![]()
![]()
再看看直接通過文生圖,讓Banana Pro(左)和Banana 2(右)以同樣的提示語做了一張巴黎世家的人物貼圖海報,人物形象、畫面構(gòu)圖以及文字展示,都是讓它根據(jù)巴黎世家的品牌調(diào)性去設(shè)計的。實際上可以發(fā)現(xiàn),從普通人的視角來看,其實看不出太大的區(qū)別,都還挺帥的。
![]()
![]()
但是到了全身照這里,我同樣用了自己原本的那張自拍圖,但會發(fā)現(xiàn)Banana 2(右)全身照的人臉和我原本的臉相差了很多。
![]()
![]()
然后再看一張設(shè)計感比較強的照片。圖片是用各種各樣的手機屏幕設(shè)備,把我的臉拼接在一起。實際可以看到,Banana 2(右)的執(zhí)行能力會稍微差一點,首先設(shè)備的選擇就不太對,有一些屏幕根本就不是正常設(shè)備里面的屏幕,而且整個畫面的拼接也有點錯誤。
![]()
![]()
然后我們來看關(guān)于產(chǎn)品,以及一些品牌設(shè)計相關(guān)的展現(xiàn),首先是做一個KITKAT的信息圖展現(xiàn),
Banana Pro(左) 做出來的圖片,整體來看確實更美觀一些,大家可以檢查一下這里面的文字信息,因為我讓它填補的文字信息比較多,可以對比檢查一下文字信息有沒有錯誤。
![]()
![]()
然后是做一個創(chuàng)意logo的展現(xiàn),區(qū)別也不大,Banana Pro(左)給這個 logo 加了一個底色,和原圖更加貼近。但像Banana 2做的這種純文字渲染的 logo 也挺好看的。
![]()
![]()
還做了一個比較好玩的嘗試,是把給到的產(chǎn)品圖做成一半實體、一半具有科技感的虛擬線效果。事實上,不管是 Banana Pro(左)還是 Banana 2(右),這兩個產(chǎn)品的展現(xiàn)效果和細節(jié)處理都非常出色且豐富。
![]()
![]()
關(guān)于品牌這塊,我還做了一個比較經(jīng)典的圖,是可口可樂的發(fā)展信息圖,文字信息包含得也很多,整個產(chǎn)品羅列整體上看是沒有什么區(qū)別的。左邊 Banana Pro 給出了塑料瓶裝的可樂,但是沒有聽裝的;右邊Banana 2是有聽裝,但沒塑料瓶裝。因為給出的提示語比較泛概念,讓它自己去查找信息并根據(jù)自己的世界信息去推理生成的。所以這兩張圖在我這里來看區(qū)別不大,整體完成質(zhì)量都很高。
![]()
![]()
然后還給了一個手機皮套的圖,整個的光影質(zhì)感在我看來區(qū)別也不大,整個產(chǎn)品的細節(jié)展示也都很好,從審美的角度來看,我可能會更喜歡右邊 Banana Pro 生成的這個效果。
![]()
![]()
![]()
再看看推理能力的對比,首先是根據(jù)一句詩句“采菊東籬下,悠然見南山”,讓它給我想象并畫出對應(yīng)的畫面。Banana 2(右)畫出了一個更加完整的展現(xiàn),把詩句補全并寫在了畫面上,整體來看,表現(xiàn)都還是很不錯的。
![]()
![]()
然后我又讓它們給我畫了一張高中物理課本風格的插圖,展示小球的平拋運動軌跡。清晰標注初速度 v0(水平方向)和重力加速度 g(垂直向下)。
有沒有物理學好的人,來給我看一下這兩個圖畫得都對不對。。。
![]()
![]()
再來個數(shù)學好的,給我看看這道數(shù)學題,他們兩個解得都對不對哈哈哈哈哈
![]()
![]()
![]()
然后給它們兩個角色,讓它們畫這兩個角色的分格漫畫。可以看到,其實 Banana 2表現(xiàn)得會更好,它會畫出更加完整的一段劇情,畫面也會更加豐富。
![]()
![]()
包括我給到它的部分,可以指定它想要的那種漫畫風格。我給到它我們家小貓的照片,讓它們做一個鬼滅之刃畫面風格的冒險漫畫,也是 Banana 2(右)的畫面細節(jié)會更多一點,設(shè)計的劇情也更豐富一些。
![]()
![]()
其實上面很多圖里已經(jīng)可以看到文字的展示了。Banana 2現(xiàn)在的表現(xiàn),對于多文字的展現(xiàn)實力依舊不弱,甚至我覺得使用起來會感覺更穩(wěn)定。
接下來這幾組對比,都是比較關(guān)注在文字上的。比如之前 Banana Pro 時期就已經(jīng)很火的玩法,讓它扮演一個角色,并根據(jù)你給的主題去設(shè)計一張海報。
可以看到 Banana Pro(左)整個的配圖會更多,文字排版也會讓視覺感受更加舒服。但是 Banana 2(右)放入了更多的文字,整體還是根據(jù)大家各自的審美需求來選擇,這一部分我個人會更偏向于 Banana Pro。
![]()
![]()
再到大家會比較關(guān)注的,這種畫攻略圖和畫菜譜圖,其實我個人感覺差別不大。你想要的文字信息,它都能夠展示出來,表現(xiàn)也都比較穩(wěn)定。
![]()
![]()
![]()
![]()
那從給圖片上的翻譯角度上來說,像Banana 2(右) 對于原圖的改變就會比較大,它連背景都調(diào)整了一下。
![]()
![]()
![]()
那關(guān)于漫畫上色的這一部分,從我個人體驗上來說,Banana 2(右)得到可用的、文字內(nèi)容不錯亂的畫面的抽卡次數(shù)會少于 Banana Pro(左),因為我記得當時給 Banana Pro 抽這個翻譯的時候,至少抽了十幾二十次吧,但是現(xiàn)在 Banana 2 基本上三四次就能得到一張可用圖。
![]()
![]()
![]()
而且配合上我們之前介紹過很多Lovart中專業(yè)的圖像二次編輯功能,比如說精準編輯-Touch Edit、編輯文字、樣機Mock up、圖片分層編輯等等,具體使用方法可以看我之前的文章。
現(xiàn)在加上 Banana 2 更快的速度以及更便宜的價格,實際上能夠?qū)崿F(xiàn)更大批量的圖片輸出。
終于測完了,現(xiàn)在大家的感受肯定更直觀了。
我是感覺,
隨著模型的迭代,實際上可以給大家更多的選擇,
這中間其實不存在模型能力的下降,
而是看你到底需要做什么,
它能夠匹配你更精準的需求。
如果你想追求更高質(zhì)量,可以選擇多花一點錢,
選擇 Banana Pro,
如果你想快速出預(yù)覽,
或者追求更快的速度和更高的性價比,
其實 Banana 2 就完全夠用了。
那現(xiàn)在,
我又開始坐等下一款香蕉Pro2的誕生了。
@ 作者 / 卡爾 & 阿湯
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉(zhuǎn)發(fā)|評論
如果想要第一時間收到推送,不妨給我個星標
如果你有更有趣的玩法,歡迎在評論區(qū)聊聊
更多的內(nèi)容正在不斷填坑中……
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.