![]()
新智元報道
編輯:好困 桃子
【新智元導讀】AI圈集體失眠!Nano Banana 2深夜炸場,登頂文生圖榜首,以Flash級速度暴力直出Pro級4K超清畫質。更離譜的是,成本直接砍半,全網首測玩瘋。
一周一更,谷歌又在深夜扔出「深水炸彈」。
就在剛剛,最強生圖模型Nano Banana 2橫空出世,背靠全新Gemini 3.1 Flash Image。
它不僅生成速度飛快,多語言文字處理更強,還能實時聯網,一次直出4K大片。
![]()
剛一發布,全網就被它的恐怖實力刷屏了。
一句話直接生成游戲UI界面;隨手一張草圖變成網頁版UI;一次輸出20張連環畫,眼都不眨一下。
網友直呼:設計師完蛋了!
![]()
![]()
![]()
![]()
左右滑動查看
甚至,NB2寫的漢字穩得一批,徹底告別了「鬼畫符」。
![]()
各大評測,更是坐實了Nano Banana 2生圖一哥的地位。
在Artificial Analysis的文生圖基準測試中,它輕松拿下全球第一。
在圖像編輯能力上則位列第三,僅次于GPT Image 1.5和Nano Banana Pro。
![]()
![]()
![]()
在Image Arena中,NB2文生圖同樣問鼎榜首,斬獲1279 Elo得分,圖像編輯實力僅次于GPT Image。
![]()
![]()
谷歌官方測評中,NB2(開啟Thinking + 文本搜索 + 圖像搜索后)在整體偏好、視覺質量和信息圖表準確性三個維度上,不僅全面壓制了GPT-Image 1.5、Grok Imagine Image Pro等一眾競品,甚至還超越了大哥Nano Banana Pro。
![]()
而且,它的輸出價格只要0.0672美元/張,僅為Pro的一半。
![]()
快,但不只是快
話不多說,下面我們就來看看它都有哪些殺手級本領。
第一個是世界知識。
Nano Banana 2全面接入了Gemini的知識庫和實時網絡搜索。
你讓它畫一座真實存在的建筑,它會先上網搜一搜視覺參考資料,搞清楚這地方到底長什么樣,然后再按照你指定的風格渲染。
這種理解力也讓它能直接幫你做信息圖表、把筆記變成示意圖、生成數據可視化。
比如,讓它生成水循環的科普信息圖。
模型選擇了正上方俯拍的鳥瞰視角,在干凈的淺灰色紋理背景上,把水循環的每個步驟從左到右清晰鋪開。
背景上還畫了簡約的黑色手繪箭頭來引導視線,光線柔和均勻,幾乎沒有陰影干擾,整體既有教育感又不沉悶,是那種你真的可以直接拿去課堂用的水平。
![]()
描繪水循環的平鋪俯拍信息圖
再看這張云類型的對比圖。
它采用了三聯畫的形式,把積云、層云和卷云分別放在三個畫幅中,每種云都有極具戲劇感的天空作為背景,配上醒目的標簽文字。
整體是高對比度的美漫風格,信息清晰,視覺沖擊力也拉滿了。
![]()
對比不同云類型的三聯畫信息圖
這張則是讓模型先搜索克洛·呂斯城堡(達·芬奇晚年居住的法國城堡)的真實照片作為參考,然后用色彩明艷的綜合立體主義風格重新演繹。
模型不僅準確還原了建筑的基本結構特征,還把立體主義那種多視角拼貼、幾何化解構的精髓融了進去,而且嚴格遵守了「無文字」的要求。
這就是「世界知識」帶來的差距——它知道這座城堡長什么樣,而不是憑空捏造。
![]()
綜合立體主義風格的克洛·呂斯城堡
更厲害的是,谷歌還專門做了一個叫「Window Seat」(靠窗座位)的應用來秀這個能力。
具體來說,他們讓Nano Banana 2調用知識庫和網絡圖像搜索,再結合世界各地的真實場景和實時天氣數據,生成逼真的飛機窗外風景。
相當于給你來了一場足不出戶的環球旅行,而且每一幀窗外的景色都基于真實的地理和氣象信息,不是隨便糊弄的。
第二個是文本渲染和翻譯。
AI圖像生成最大的老毛病之一就是「寫字像鬼畫符」,Nano Banana 2在這塊下了狠功夫。
生成的文字準確清晰,做營銷海報、賀卡完全夠用。
看下面這組圖。
第一張是一個充滿自然氣息的電影級特寫,展現了一塊由回收環保材料制成的精美指示牌,上面畫著當地的鳥類和花卉,牌子下方用優雅的手寫字體寫著「原生野生動物:請保持距離觀賞」。柔和的漫射光透過旁邊蕨類植物的葉片灑下,背景是生機勃勃的綠色植物虛化效果。
第二張則是一句話就完成了場景本地化——把整個概念轉換成印度場景,所有文字翻譯成印地語,連植被、光線氛圍都做了相應調整。這種「一鍵本地化」的能力,對做全球化內容的創作者來說太實用了。
![]()
本地化版本的「原生野生動物」指示牌
同樣的,谷歌也為這個能力配了一個酷炫的演示——「Global Ad Localizer」。
這個全球廣告本地化工具,能直接把廣告素材翻譯成不同語言版本,不僅渲染翻譯后的文本,還會同步調整畫面中的視覺元素來適配目標市場。
4K創意大片,畫質更牛了
速度上去了,質量沒掉,這才是Nano Banana 2真正讓人興奮的地方。
首先,是主體一致性的大幅提升。
具體來說就是,一個工作流里最多能保持5個角色的特征一致,以及14個對象的高保真度。
什么概念?看完下面這張圖你就懂了。
14個風格各異的角色和道具一起出現在農場場景里愉快玩耍,整體氛圍逗趣、搞怪、歡樂。
關鍵是每一個角色和道具都嚴格保持了原本的特征與形象,沒有一個「變臉」或「串臺」的。
![]()
農場里逗趣歡樂的角色和道具
再看這組更有敘事感的例子。
3個毛茸茸的小伙伴一起建樹屋的故事,被拆成了6個章節。整個故事驚險刺激、情節跌宕起伏,以一個歡樂的時刻收尾。
最厲害的是,三個角色在6張圖里的服裝和外貌特征始終一致,但表情和視角每張都不一樣,而且嚴格保證每張圖里每個角色只出現一次。
這對需要做連續敘事的創作者來說簡直是福音——終于不用每生成一張圖就發現「主角換了張臉」。
![]()
正在建造樹屋的毛茸茸小伙伴們
接下來這個名叫「Pet Passport」(寵物護照)的應用,堪稱是「鏟屎官的快樂制造機」。
在這里,你只需要上傳一張寵物的照片,模型就能讓你的毛孩子開啟一場全球大冒險,打卡各大著名地標。
而且,它還內置了各種創意控制設置,讓你能定制不同的風格和效果。
關鍵是無論去到哪個目的地,寵物的外觀都能保持高度一致。
其次,指令遵循更精準了。
你腦子里想的那些微妙細節,現在模型能更好地捕捉到。復雜的描述不再被「自由發揮」成另一個東西。
第三,規格也拉滿了。
從512px到4K,各種寬高比隨你挑。
值得一提的是,512px是這次新增的分辨率層級,專門為低延遲和高負載場景優化。如果你的工作流需要快速迭代大量圖像,這個檔位能幫你把效率拉到極致。
寬高比方面,除了常見的比例之外,這次還新增了4:1、1:4、8:1和1:8這些極端比例,橫幅廣告、豎屏長圖、信息流卡片都能原生適配,不用再靠后期裁切了。
![]()
對于開發者來說,還有一個對畫質影響很大的新功能:可配置的思考級別(Thinking Level)。
你可以手動調整模型在生成圖像之前的「思考深度」——默認是最低級別,追求速度。
切換到高級或動態模式后,模型會在渲染前對復雜的提示詞進行更充分的推理,從而顯著提升輸出質量和指令遵循度。
最后,視覺質量本身也躍升了一個臺階。
光影更生動,紋理更豐富,細節更銳利。
比如下面這張霧氣繚繞的山谷航拍圖。
可以看到,從極高的俯視角度鳥瞰整個峽谷,前景是深色水域環繞著一片明亮的綠色田野,田野邊緣點綴著散落的樹木和灌木,一條狹窄蜿蜒的小路在右側的綠丘中穿梭消失在遠方。
山谷深處,淺藍灰色的湖泊在植被茂密的巍峨群山之間延伸,山峰隱沒在低垂的霧氣中。
主色調從前景郁郁蔥蔥的翠綠過渡到遠處更暗更柔和的色調,水面倒映著陰沉的天空,厚重的云層營造出柔和的漫射光效。整體散發著蘇格蘭高地般的粗獷之美,那種寧靜、未被馴服的荒野氣息撲面而來。
![]()
霧氣繚繞的翠綠山谷全景航拍圖
再看這張波普藝術時尚人像。
畫面采用略低的仰視機位,一位年輕的深膚色人物穿著一套極其搶眼的西裝。
面料上印著大膽的電光藍漩渦波浪紋,其間穿插著巨大的亮粉色同心圓,相互重疊向外輻射。
寬大翻領的西裝外套搭配鐘形袖,內搭熨燙平整的黃色翻領襯衫,闊腿褲向地面戲劇性地散開。
亮黃色的心形墨鏡、巨大的粉色圓形耳環、雙手叉腰的桀驁姿勢,在純粹均勻的天藍色背景前,整個畫面就像一顆從波普藝術宇宙里炸出來的視覺炸彈。
而且,不管你要求什么樣的比例,模型都能精準輸出。
![]()
不同寬高比的高度風格化波普藝術時尚人像
全網首測
一幀畫面「腦補」整個世界
自Nano Banana出世后,全世界人們已用它生成超十億張圖像。
谷歌DeepMind通過「氛圍編碼」手搓了一個demo,展示了NB對現實世界的強大理解力。
每一幀畫面,NB2都只能看到前一張圖,便能「腦補」出接下來的場景,連貫性簡直強到離譜。
如今,一大批網友們紛紛曬出了Nano Banana 2的驚艷實測demo。
一句簡單的提示,它便完美還原了1970年代的貝爾法斯特。
![]()
![]()
甚至,可以隨意截取一張地圖,讓NB2生成一張卡通風格的全景圖。
![]()
![]()
上傳一本書的封面圖,NB2即可直出一張書本中的展示水母的頁面。
![]()
![]()
在文本渲染上,NB2再上一個全新的臺階,精準直出手稿、白板、海報等字體。
![]()
![]()
![]()
![]()
左右滑動查看
讓NB2生成一張今日科技界新聞報紙,通過聯網搜索,它直出新聞頭版,不過在較小細節上有些問題。
![]()
另一個demo中,NB2在文本生成上同樣展現出超強的統治力。
![]()
不僅如此,NB2生成的人物肖像更加真實,肉眼難以辨別真假。
![]()
![]()
![]()
![]()
左右滑動查看
一張對比圖中,NB2在游戲人物刻畫上更加精細、強大。
![]()
還有貨柜展示、旋轉樓梯等各種創意圖,NB2全都表現不凡。
![]()
![]()
![]()
![]()
![]()
左右滑動查看
一張二次元動漫圖,NB2可以一鍵復刻成GTA風格的圖片。
![]()
![]()
NB2生成的一張3D微縮模型場景圖,場景還原非常逼真。
![]()
NB2制作的信息圖,細節非常豐富。
![]()
![]()
![]()
左右滑動查看
a16z合伙人Justine Moore測試中發現,NB2在信息圖表、廣告、動作鏡頭,甚至是卡通生成實力提升,且速度非常快。
![]()
![]()
![]()
![]()
![]()
左右滑動查看
在同一提示下,NB2可以更好遵循指令,生成效果要比GPT Image 1.5更加逼真。
![]()
以下是一些谷歌DeepMind官方的demo:
![]()
![]()
![]()
![]()
![]()
![]()
左右滑動查看
![]()
![]()
![]()
左右滑動查看
哪里能用上?
從世界知識到文本渲染,從14個主體保真到4K輸出,能力盤點到這里,你可能已經躍躍欲試了。
好消息是,Nano Banana 2已經在谷歌的全線產品中鋪開:
GeminiApp是最直接的入口。
![]()
Nano Banana 2將在Fast、Thinking和Pro模型中全面取代Nano Banana Pro,想要「頂配」的用戶依然可以通過三點菜單選擇「重新生成圖像」來切換回Nano Banana Pro。
![]()
順便提一句:圖片生成的數量,每天是有限額的。
未訂閱Google AI方案的用戶,24小時內最多可生成100張圖片;已訂閱Google AI Plus、Pro或Ultra的用戶,這個上限提升到1,000張。
對于大多數人來說足夠用了,重度創作者可以考慮上個訂閱。
![]()
谷歌的老本行——搜索,也安排上了。包括Google App、移動端和桌面端的AI Mode,以及智能鏡頭(Lens)。
![]()
開發者可以在AIStudio、GeminiAPI和Vertex AI中拿到預覽版,Google Antigravity同樣支持。
Flow的用戶更是直接受益——Nano Banana 2成了默認模型,全員免積分使用。
![]()
GoogleAds里也集成了,創建廣告系列時會自動提供智能建議。
結語
總結來看,谷歌這次打的什么算盤,其實一目了然:
用Nano Banana 2覆蓋絕大多數用戶的日常需求——快、準、好看、能搜能翻譯;
把Nano Banana Pro留給那些對事實準確性有極高要求的專業場景。
不搞「要么Pro要么湊合」的二選一,而是讓大多數人在不降速的前提下就能用上旗艦級的能力。
![]()
參考資料:
https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/
https://blog.google/innovation-and-ai/technology/developers-tools/build-with-nano-banana-2/
https://x.com/GoogleDeepMind/status/2027051577899380991
https://x.com/GeminiApp/status/2027052041697464629
https://x.com/Google/status/2027051660392944035
https://x.com/jesselaunz/status/2027133199156142372?s=20
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.