出品 | 網易智能
作者 | 小小
編輯 | 王鳳枝
2月26日深夜,谷歌正式發布Nano Banana 2,核心優勢就是便宜。
它兼顧了出圖速度與專業畫質,在維持生成質量不掉線的前提下,將單張成本直接砍半。
![]()
根據AI模型評測平臺Arena.ai的榜單顯示,Nano Banana 2以1279分的文本轉圖像得分,超越了GPT-Image-1.5和自家老大哥Nano Banana Pro;單圖編輯拿下1407分,與ChatGPT-Image-Latest持平。每張圖的生成成本約為0.067美元(約合人民幣0.46元),比Nano Banana Pro便宜一半。
![]()
資深用戶在搶先體驗后表示,雖然模型還不完美,但它是第一個能相對穩定處理復雜圖表和指令跟隨的產品。
網友普遍認為,Nano Banana 2并非那種讓人驚呼顛覆的創新,它在做的是讓AI生圖從偶爾玩票的創意玩具,徹底變成每天能跑幾千張的生產工具。
01 Nano Banana 2到底是什么?
Nano Banana 2的正式名稱是Gemini 3.1 Flash Image。它并非Nano Banana Pro的續作,而是初代Nano Banana(Gemini 2.5 Flash Image)的深度升級版,直接換上了Gemini 3 Flash的核心引擎。
谷歌的思路是把Pro級別的核心能力,比如世界知識、文本渲染、主體一致性等,全部整合進Flash產品線。速度保持Flash級別,能力向Pro看齊。
對企業用戶來說,這意味著以前需要為高質量圖像生成支付Pro級價格,每張1K分辨率(百萬像素級)圖像成本約0.134美元。現在同樣的質量需求,完全可以用Flash級價格滿足,成本降到0.067美元。對于每天生成數千張圖像的應用場景,這個差距直接決定項目能否從概念驗證走向規模化部署。
![]()
賓夕法尼亞大學沃頓商學院教授、生成式AI實驗室聯合主任伊桑·莫利克(Ethan Mollick)提前體驗后表示,這款模型還不完美,但已經是第一個能相對穩定處理復雜圖像和圖表的模型,文本準確性和復雜指令的跟隨能力提升明顯。
![]()
Nano Banana 2最核心的升級是“世界知識”能力的落地。
傳統AI圖像生成依賴訓練數據中的記憶。讓它畫世界貿易中心一號樓,輪廓或許可以畫對,但要畫出塔身上某個特定時期的細節或者某個品牌的Logo,它就無能為力了,因為這些細節并不存在于訓練數據中。
Nano Banana 2的解決方案是:在生成圖像的同時可以實時調用網絡搜索。它先搜索相關信息,理解目標對象長什么樣,然后再進行生成。
![]()
這意味著,讓它畫“2026年超級碗中場秀舞臺”,它會去搜索當時的現場照片并基于真實信息生成。讓它為某個品牌設計海報,它能準確還原Logo細節,因為它真的去“看”了。
谷歌CEO桑達爾·皮查伊(Sundar Pichai)在發布時演示了一個“靠窗座位”功能:模型獲取當地實時天氣信息,從世界任何一扇窗戶生成窗外的精準畫面,支持2K/4K分辨率。窗外的陰晴雨雪,都能在畫面中得到真實的體現。
![]()
這個能力在信息圖場景下尤其有用。硅谷風險投資公司Andreessen Horowitz的合伙人賈斯汀·摩爾(Justine Moore)在測試中發現,Nano Banana 2可以用搜索快速生成篇幅較長、內容扎實的信息圖。她試了“解釋麥當勞冰淇淋機工作原理以及為什么總壞”的提示,生成結果圖文匹配,邏輯通順。
![]()
02文本渲染:終于能看清圖里的字了
AI生圖領域有個老問題:讓模型在圖像里生成能看的文字,比畫個人難得多。以前很多圖遠看還行,放大一看招牌上的字母全是亂碼,菜單上的文字像外星符號。這導致商業場景根本無法直接使用。
Nano Banana 2在這個問題上做了針對性優化。
摩爾用雜志封面做了測試。生成的封面里,每一行文字都準確清晰,沒有亂碼且沒有字體扭曲。對比Nano Banana Pro,后者雖然也能生成文字但偶爾會出錯,而且畫面總帶點3D渲染的塑料感。摩爾評價稱,Nano Banana 2的結果更像真實照片,而非渲染圖。
![]()
莫利克也提到,復雜的圖表標注以前是AI的難點,現在Nano Banana 2能正確顯示詳細標簽,雖然偶爾還會出問題,但已經是明顯的進步。
翻譯功能也被整合進來了。一張英文海報可以要求它直接轉成日文、法文或印地語,文本在圖像內直接替換,構圖保持不變。對于跨國營銷團隊而言,這個功能可以節省大量重復設計的時間。
另一個讓創作者高度關注的升級是主體一致性。
根據谷歌提供的信息,Nano Banana 2可以在單個工作流中,維持最多5個角色的長相一致,同時保持14個物體的視覺特征不變。
摩爾用一個8格漫畫做了測試,主題是“Sam Altman在OpenAI被解雇又復職的過程”。以前的模型畫到第三四格人物就開始變形,服裝亂飄且場景失控。Nano Banana 2跑完8格,人物從頭到尾都保持著同一張臉。
![]()
她還測試了產品攝影場景。上傳一張橄欖油瓶的照片,要求生成“一位女士在廚房拿著這瓶油”的畫面。生成的圖像里,瓶子的標簽、顏色和形狀都與參考圖高度一致。輸出結果看起來就像是精心拍攝的照片,AI生成的感覺極淡。
![]()
對于廣告公司和內容工作室來說,這個能力意味著可以用更短的時間完成故事板、產品陳列、品牌資產積累等需要極強視覺連續性的工作。
03創意風格:動作片、黏土風都能玩
除了硬核的生產力功能,Nano Banana 2在創意風格上也有一些新嘗試。
體育攝影一直是AI的重災區。運動員發力時的肌肉狀態以及運動中的物理規律,稍微差一點畫面就會顯得極假。摩爾測試了動作照片生成,結果遠超預期。有些圖甚至可以直接拿去做廣告,只需加點文案效果就能被市場接受。
![]()
Gemini應用里還預置了一批風格模板,點一下就能直接套用。她試了“哥特式黏土”和“琺瑯徽章”兩個選項,上傳普通照片后,一鍵轉換出來的效果堪比藝術品。
她還測試了用戶生成內容場景。讓模型生成TikTok創作者的屏幕截圖,完美復刻了那種拿著產品在廚房或浴室自拍的風格。只需提供一張產品照片配上簡短提示,生成的截圖就能以假亂真。
04親測體驗:速度、質量、成本的平衡
綜合多位早期體驗者的反饋,Nano Banana 2在產品定位上確實踩中了一個關鍵點。
速度方面,測試者普遍反饋生成時間被明顯縮短。有測試者讓Nano Banana 2生成一個完整的比特幣歷史時間線,包括搜索研究和最終圖像輸出,整個過程所用的時間與Nano Banana Pro單獨生成圖像的時間差不多。緊接著再加一個以太坊時間線的任務,幾乎沒有增加任何額外時間。
![]()
![]()
質量方面,文本處理和主體一致性是最受好評的兩大核心能力。雜志封面、復雜圖表、多格漫畫,這些以前極易翻車的場景,現在的成功率得到了顯著提高。
成本方面,每張0.067美元的價格比Pro級便宜了一半,這讓更多邊緣應用場景具備了商業化的可能。
當然問題依然存在。有測試者嘗試讓Nano Banana 2編輯真實照片把服裝換成內衣,模型經過長時間推理后直接拒絕了請求,而換成泳裝則可以正常生成。審查機制的存在和邊界限制,是需要企業用戶提前了解的合規要點。
![]()
05競爭對手:阿里和字節也在出牌
Nano Banana 2發布的時間點,正好撞上了兩個強大競爭對手的動作。
2月10日,阿里Qwen團隊發布Qwen-Image-2.0,70億參數量比上一代的200億參數輕了三分之二,但能力并未縮水。它原生支持2K分辨率,采用統一架構同時處理生成和編輯任務,在AI Arena的盲測排行榜上生成和編輯雙雙排進前三。
![]()
更關鍵的是它具備開源的預期。Qwen-Image v1當初就是在發布一個月后開源的,開發者圈子里已經有大量聲音在期待v2.0走同樣的路。如果開源成真,企業就可以在自己的服務器上運行一個能力接近Nano Banana Pro的模型,每張圖的API調用費用將徹底省下。
同一周,字節跳動的Seedream 5也悄然亮相。
![]()
這款產品在創作者社區里的口碑一直極佳。原因有三:靈活、便宜(API每張0.035美元,約谷歌三分之一的價格)、內容審核相對寬松。那些想用真人照片做視覺創作的開發者,被谷歌的安全機制拒絕后,往往會果斷轉向Seedream。
Seedream 5同樣把實時搜索整合進了生成流程,不僅推理能力升級、參考一致性加強,還支持在單輪編輯里使用14張參考圖,實現2K/4K分辨率秒出。它甚至支持本地運行,這在谷歌封閉的生態里是絕對不被允許的。
06企業怎么選:三條路徑各有利弊
對于正在搭建AI圖像生成能力的企業來說,當下有三條路徑可以仔細評估。
第一條,繼續走谷歌路線。如果團隊已經深度綁定了谷歌云,Nano Banana 2絕對是順理成章的選擇。價格比Pro級砍半,且產品線全面鋪開,包括Gemini應用、Google搜索的AI模式和鏡頭、AI Studio、Vertex AI、Google Cloud以及Flow等,無需修改架構就能直接用上生產級能力。強大的文本渲染能力對于營銷素材和本地化場景來說更是剛需。
第二條,賭一把開源路線。如果公司具有嚴格的數據主權顧慮,或者每天生成的圖像量過大導致按張計費成本無法承受,再或者就是單純想要擺脫API依賴,那么Qwen-Image-2.0值得高度關注。參數少意味著自托管的GPU成本極低,統一架構能省掉模型串接的繁瑣,且輸出質量并不掉隊。唯一的風險在于阿里是否會按時放出權重。
第三條,保留Pro級通道。Nano Banana Pro并沒有退場,Google AI Pro和Ultra訂閱者依然可以在Gemini應用里通過“重新生成”菜單調用它。對于極高端的創意項目,或者每張圖都需要精細定制調性的場景,Pro級模型依然是不可替代的天花板。
最后一個容易被忽略的致命因素是水印和出處。
Nano Banana 2出廠就強制打上了SynthID水印,同時完美兼容C2PA內容憑證標準。自去年11月在Gemini應用上線以來,SynthID驗證功能已經被高頻使用了2000多萬次。對于金融、醫療等受嚴格監管行業的企業來說,這個功能絕不是可有可無的加分項,而是業務生存的合規必選項。如果企業自己部署的開源模型在水印和憑證這一關過不去,業務流轉同樣會陷入徹底的停滯。
結語:中間地帶的戰爭
綜合來看,Nano Banana 2不是那種讓人驚呼顛覆的產品。它做的是更致命的事:融合Flash的速度與Pro的能力,成本砍半且質量不掉線,徹底夯實了其作為高頻生產工具的地位。
Arena.ai的榜單把它推到了第一。莫利克驗證了它對復雜圖表的掌控力,摩爾則在全場景實測后給出了“重大升級”的定語。但另一邊,Qwen-Image-2.0在開源側翼嚴陣以待,Seedream 5在靈活性和價格上持續死磕。
這場競爭的結果,可能不是誰家模型畫得最漂亮,而是誰家模型畫得夠快、夠便宜、夠穩,能讓企業放心把它塞進生產流程。Nano Banana 2占據的,正是大多數企業真正需要的中間地帶:不需要天花板級的畫質,但要足夠好的效果、足夠快的速度和足夠低的成本。
