![]()
智東西
作者 陳駿達(dá)
編輯 心緣
Nano Banana升級了!
智東西11月21日報道,昨晚23點,谷歌發(fā)布了其最新一代圖像生成和編輯模型Nano Banana Pro,這是此前爆火的Nano Banana的重磅更新。谷歌直接將Gemini 3 Pro的推理能力與世界知識庫,塞進(jìn)了Nano Banana Pro。
Nano Banana Pro的正式名稱為Gemini 3 Pro Image。基于增強(qiáng)的推理能力、世界知識和實時信息,這一模型可以生成更準(zhǔn)確、更具上下文信息的視覺效果。用谷歌的話來說,它不再只是生成“像模像樣”的圖像,而是能夠真正打造出實用的內(nèi)容。
谷歌CEO Sundar Pichai分享道,Nano Banana Pro是一款SOTA級的圖像生成與編輯模型,非常擅長制作復(fù)雜的圖表,看待世界的方式就像工程師一樣。Pichai分享的案例里,Nano Banana Pro用實拍和手繪草圖結(jié)合的方式,講解了金門大橋的基本結(jié)構(gòu)信息,一目了然。
![]()
Nano Banana Pro的實用性還體現(xiàn)在較強(qiáng)的文字渲染能力上。結(jié)合其自帶的聯(lián)網(wǎng)搜索能力,智東西試著讓Nano Banana Pro打造了一個剪紙風(fēng)的實時天氣卡片。模型不僅找到了正確的天氣信息,文字渲染、風(fēng)格化也是毫無破綻,徹底和上一代Nano Banana的“鬼畫符”告別了。
![]()
知名科技播客主播Lex Fridman專門跑到Pichai的評論區(qū),給Nano Banana Pro點贊。
![]()
目前,Nano Banana Pro已在Gemini應(yīng)用和Web端免費(fèi)可用,但有一定限額,用完后將恢復(fù)到原有的Nano Banana模型,Google AI Plus、Pro和Ultra訂閱用戶可獲得更高的配額。
谷歌廣告服務(wù)、谷歌Slides和谷歌Vids中的圖像生成功能將升級為Nano Banana Pro。用戶也可通過API調(diào)用、企業(yè)訂閱方案等使用這一模型。
體驗鏈接:https://gemini.google.com/
一、外掛谷歌搜索,字體、元素融合玩出花
借助更豐富的知識,Nano Banana Pro可以制作復(fù)雜的教育性講解圖,比如直接生成一份“小豆蔻茶”菜譜。
可以看到,模型生成的結(jié)果不僅文字清晰、毫無亂碼,說明步驟也直觀易懂;插圖與內(nèi)容配合自然,整體設(shè)計風(fēng)格統(tǒng)一協(xié)調(diào)。以這樣的完成度來說,幾乎不需要再做二次編輯。
![]()
Nano Banana Pro能連接到谷歌搜索,幫助用戶創(chuàng)建可視化的實時信息,例如天氣或體育賽事等等。
下圖就是Nano Banana Pro自行搜索并打造的波普風(fēng)格天氣海報,上面的信息我們已經(jīng)核驗過了,是完全正確的。
![]()
此外,Nano Banana Pro在文字渲染和多語言方面有了進(jìn)展。模型現(xiàn)在可以更為深刻的理解圖像,感知細(xì)節(jié),從而給圖像編輯和生成提供了更多空間。
在下面這一案例中,Nano Banana Pro能根據(jù)一張劇照,直接還原出一份手寫體的黑板故事板草圖,還是帶有運(yùn)鏡和故事情節(jié)的。
![]()
Nano Banana Pro現(xiàn)在支持更豐富的紋理、字體和書法,能創(chuàng)造更為精細(xì)的文字。比如,它就在下圖中把“BERLIN(柏林)”一詞融入了建筑設(shè)計,且毫無違和感。
![]()
或者是把文字和紋理巧妙地融合在一起,下面的文字上就完美融合了木頭橫截面的紋理。
![]()
書法、字體方面,Nano Banana Pro的風(fēng)格是由語義啟發(fā)的,比如CRASH一詞的藝術(shù)字就有很多裂痕,DRIP一詞就使用了滴落的效果。
![]()
借助Gemini增強(qiáng)的多語言推理功能,Nano Banana Pro可以生成多種語言的文本,或者對內(nèi)容進(jìn)行本地化和翻譯。
下方就是一個英語譯韓國語的案例,商品圖中不同角度的文字在翻譯時都得到了準(zhǔn)確的對應(yīng)。
![]()
面向?qū)I(yè)創(chuàng)作者的需求,Nano Banana Pro現(xiàn)在允許用戶融合更多的元素,最多可使用14張圖像,并保持最多5位人物的一致性和相似度。下圖就是由14張輸入圖像+文字提示詞打造的,角色一致性得到不錯的保持。
![]()
這一功能不僅適用于角色,也適用于物體。比如,可以將沙發(fā)、綠植和連衣裙和場景等元素一同輸入,然后輸出全新的場景。
![]()
Nano Banana Pro提供了高級創(chuàng)意控制功能。改進(jìn)的局部編輯功能現(xiàn)在支持選擇、優(yōu)化和調(diào)整圖像里的任何部分,比如調(diào)整相機(jī)角度、改變焦點、應(yīng)用精細(xì)的色彩分級,甚至改變場景光照(例如,將白天變?yōu)橐雇砘騽?chuàng)建散景效果)。
![]()
模型現(xiàn)在支持豐富的寬高比調(diào)整和2K、4K分辨率,讓生成結(jié)果適用于更專業(yè)的場景。
![]()
隨著Nano Banana Pro將虛擬和現(xiàn)實的邊界進(jìn)一步模糊,谷歌打造了一款專用的驗證工具,以應(yīng)對這一挑戰(zhàn)。
現(xiàn)在用戶可以將照片上傳到Gemini,并要求Gemini識別圖片是否為AI生成。谷歌已經(jīng)為自家所有的AI生成媒體內(nèi)容配備了SynthID數(shù)字水印,Gemini將會據(jù)此進(jìn)行判斷。目前,該功能率先支持圖片驗證,但很快將擴(kuò)展到音頻和視頻。
二、多元素一鍵換裝,可“拍攝”復(fù)古老照片
Nano Banana Pro上線后,已經(jīng)有海量網(wǎng)友分享了自己的使用體驗。
這位網(wǎng)友利用Nano Banana Pro打造了四張抓拍照。可以看到Nano Banana Pro在運(yùn)動場景生成的肢體動作不僅沒有扭曲,還很有沖擊力,而此類場景對大多數(shù)圖像生成模型來說其實是不小的挑戰(zhàn)。這位網(wǎng)友感嘆,谷歌真的在改變世界。
![]()
Nano Banana Pro可以用來“拍攝”懷舊風(fēng)格的老照片,如果不是網(wǎng)友特別說明,恐怕我們已經(jīng)很難分辨下面四張圖片究竟是真正的老照片,還是AI生成的。
![]()
同樣的風(fēng)格化能力也能用來復(fù)刻游戲的畫風(fēng),一位日本網(wǎng)友就分享了他打造的像素風(fēng)游戲角色卡。
![]()
元素組合功能對于電商場景來說十分實用。這位設(shè)計師分享,自己上傳了模特圖和衣物圖,Nano Banana Pro便能讓模特“穿上”新衣服,并且融合得很自然。
![]()
Nano Banana Pro的圖像編輯能力也可用于優(yōu)化照片。這位網(wǎng)友將自己實拍的CyberTruck交給Nano Banana Pro處理,他認(rèn)為該模型在調(diào)整光線、去除瑕疵方面表現(xiàn)很出色。Nano Banana Pro幫他把豎屏照片擴(kuò)展為了橫屏照片,能直接當(dāng)壁紙用。
![]()
結(jié)語:Nano Banana實用程度獲針對性提升
憑借底層模型的升級,Nano Banana Pro現(xiàn)在讓更多普通用戶能輕松上手使用圖像創(chuàng)作模型,僅依賴簡單的提示詞就能還原自己內(nèi)心的想法。
不過,值得注意的是,谷歌在本次升級中的不少方向是在提升模型的實用性。無論更多樣的字體,更多的元素,還是高級控制選項,都能給專業(yè)創(chuàng)作者以更多選擇,打造真正符合其創(chuàng)意的畫面。
谷歌已經(jīng)在積極將Nano Banana Pro融入其To-B的創(chuàng)意產(chǎn)品,未來該模型能否在商用場景展示真實價值,值得持續(xù)關(guān)注。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.