網易首頁 > 網易科技 > 網易科技 > 正文

單張不到五毛錢！谷歌深夜發布Nano Banana 2，沒有顛覆性，但量大管飽！

2026-02-27 10:05:15　來源: 網易智能

北京舉報

分享至

出品 | 網易智能

作者 | 小小

編輯 | 王鳳枝

2月26日深夜，谷歌正式發布Nano Banana 2，核心優勢就是便宜。

它兼顧了出圖速度與專業畫質，在維持生成質量不掉線的前提下，將單張成本直接砍半。

根據AI模型評測平臺Arena.ai的榜單顯示，Nano Banana 2以1279分的文本轉圖像得分，超越了GPT-Image-1.5和自家老大哥Nano Banana Pro；單圖編輯拿下1407分，與ChatGPT-Image-Latest持平。每張圖的生成成本約為0.067美元（約合人民幣0.46元），比Nano Banana Pro便宜一半。

資深用戶在搶先體驗后表示，雖然模型還不完美，但它是第一個能相對穩定處理復雜圖表和指令跟隨的產品。

網友普遍認為，Nano Banana 2并非那種讓人驚呼顛覆的創新，它在做的是讓AI生圖從偶爾玩票的創意玩具，徹底變成每天能跑幾千張的生產工具。

01 Nano Banana 2到底是什么？

Nano Banana 2的正式名稱是Gemini 3.1 Flash Image。它并非Nano Banana Pro的續作，而是初代Nano Banana（Gemini 2.5 Flash Image）的深度升級版，直接換上了Gemini 3 Flash的核心引擎。

谷歌的思路是把Pro級別的核心能力，比如世界知識、文本渲染、主體一致性等，全部整合進Flash產品線。速度保持Flash級別，能力向Pro看齊。

對企業用戶來說，這意味著以前需要為高質量圖像生成支付Pro級價格，每張1K分辨率（百萬像素級）圖像成本約0.134美元。現在同樣的質量需求，完全可以用Flash級價格滿足，成本降到0.067美元。對于每天生成數千張圖像的應用場景，這個差距直接決定項目能否從概念驗證走向規模化部署。

賓夕法尼亞大學沃頓商學院教授、生成式AI實驗室聯合主任伊桑·莫利克（Ethan Mollick）提前體驗后表示，這款模型還不完美，但已經是第一個能相對穩定處理復雜圖像和圖表的模型，文本準確性和復雜指令的跟隨能力提升明顯。

Nano Banana 2最核心的升級是“世界知識”能力的落地。

傳統AI圖像生成依賴訓練數據中的記憶。讓它畫世界貿易中心一號樓，輪廓或許可以畫對，但要畫出塔身上某個特定時期的細節或者某個品牌的Logo，它就無能為力了，因為這些細節并不存在于訓練數據中。

Nano Banana 2的解決方案是：在生成圖像的同時可以實時調用網絡搜索。它先搜索相關信息，理解目標對象長什么樣，然后再進行生成。

這意味著，讓它畫“2026年超級碗中場秀舞臺”，它會去搜索當時的現場照片并基于真實信息生成。讓它為某個品牌設計海報，它能準確還原Logo細節，因為它真的去“看”了。

谷歌CEO桑達爾·皮查伊（Sundar Pichai）在發布時演示了一個“靠窗座位”功能：模型獲取當地實時天氣信息，從世界任何一扇窗戶生成窗外的精準畫面，支持2K/4K分辨率。窗外的陰晴雨雪，都能在畫面中得到真實的體現。

這個能力在信息圖場景下尤其有用。硅谷風險投資公司Andreessen Horowitz的合伙人賈斯汀·摩爾（Justine Moore）在測試中發現，Nano Banana 2可以用搜索快速生成篇幅較長、內容扎實的信息圖。她試了“解釋麥當勞冰淇淋機工作原理以及為什么總壞”的提示，生成結果圖文匹配，邏輯通順。

02文本渲染：終于能看清圖里的字了

AI生圖領域有個老問題：讓模型在圖像里生成能看的文字，比畫個人難得多。以前很多圖遠看還行，放大一看招牌上的字母全是亂碼，菜單上的文字像外星符號。這導致商業場景根本無法直接使用。

Nano Banana 2在這個問題上做了針對性優化。

摩爾用雜志封面做了測試。生成的封面里，每一行文字都準確清晰，沒有亂碼且沒有字體扭曲。對比Nano Banana Pro，后者雖然也能生成文字但偶爾會出錯，而且畫面總帶點3D渲染的塑料感。摩爾評價稱，Nano Banana 2的結果更像真實照片，而非渲染圖。

莫利克也提到，復雜的圖表標注以前是AI的難點，現在Nano Banana 2能正確顯示詳細標簽，雖然偶爾還會出問題，但已經是明顯的進步。

翻譯功能也被整合進來了。一張英文海報可以要求它直接轉成日文、法文或印地語，文本在圖像內直接替換，構圖保持不變。對于跨國營銷團隊而言，這個功能可以節省大量重復設計的時間。

另一個讓創作者高度關注的升級是主體一致性。

根據谷歌提供的信息，Nano Banana 2可以在單個工作流中，維持最多5個角色的長相一致，同時保持14個物體的視覺特征不變。

摩爾用一個8格漫畫做了測試，主題是“Sam Altman在OpenAI被解雇又復職的過程”。以前的模型畫到第三四格人物就開始變形，服裝亂飄且場景失控。Nano Banana 2跑完8格，人物從頭到尾都保持著同一張臉。

她還測試了產品攝影場景。上傳一張橄欖油瓶的照片，要求生成“一位女士在廚房拿著這瓶油”的畫面。生成的圖像里，瓶子的標簽、顏色和形狀都與參考圖高度一致。輸出結果看起來就像是精心拍攝的照片，AI生成的感覺極淡。

對于廣告公司和內容工作室來說，這個能力意味著可以用更短的時間完成故事板、產品陳列、品牌資產積累等需要極強視覺連續性的工作。

03創意風格：動作片、黏土風都能玩

除了硬核的生產力功能，Nano Banana 2在創意風格上也有一些新嘗試。

體育攝影一直是AI的重災區。運動員發力時的肌肉狀態以及運動中的物理規律，稍微差一點畫面就會顯得極假。摩爾測試了動作照片生成，結果遠超預期。有些圖甚至可以直接拿去做廣告，只需加點文案效果就能被市場接受。

Gemini應用里還預置了一批風格模板，點一下就能直接套用。她試了“哥特式黏土”和“琺瑯徽章”兩個選項，上傳普通照片后，一鍵轉換出來的效果堪比藝術品。

她還測試了用戶生成內容場景。讓模型生成TikTok創作者的屏幕截圖，完美復刻了那種拿著產品在廚房或浴室自拍的風格。只需提供一張產品照片配上簡短提示，生成的截圖就能以假亂真。

04親測體驗：速度、質量、成本的平衡

綜合多位早期體驗者的反饋，Nano Banana 2在產品定位上確實踩中了一個關鍵點。

速度方面，測試者普遍反饋生成時間被明顯縮短。有測試者讓Nano Banana 2生成一個完整的比特幣歷史時間線，包括搜索研究和最終圖像輸出，整個過程所用的時間與Nano Banana Pro單獨生成圖像的時間差不多。緊接著再加一個以太坊時間線的任務，幾乎沒有增加任何額外時間。

質量方面，文本處理和主體一致性是最受好評的兩大核心能力。雜志封面、復雜圖表、多格漫畫，這些以前極易翻車的場景，現在的成功率得到了顯著提高。

成本方面，每張0.067美元的價格比Pro級便宜了一半，這讓更多邊緣應用場景具備了商業化的可能。

當然問題依然存在。有測試者嘗試讓Nano Banana 2編輯真實照片把服裝換成內衣，模型經過長時間推理后直接拒絕了請求，而換成泳裝則可以正常生成。審查機制的存在和邊界限制，是需要企業用戶提前了解的合規要點。

05競爭對手：阿里和字節也在出牌

Nano Banana 2發布的時間點，正好撞上了兩個強大競爭對手的動作。

2月10日，阿里Qwen團隊發布Qwen-Image-2.0，70億參數量比上一代的200億參數輕了三分之二，但能力并未縮水。它原生支持2K分辨率，采用統一架構同時處理生成和編輯任務，在AI Arena的盲測排行榜上生成和編輯雙雙排進前三。

更關鍵的是它具備開源的預期。Qwen-Image v1當初就是在發布一個月后開源的，開發者圈子里已經有大量聲音在期待v2.0走同樣的路。如果開源成真，企業就可以在自己的服務器上運行一個能力接近Nano Banana Pro的模型，每張圖的API調用費用將徹底省下。

同一周，字節跳動的Seedream 5也悄然亮相。

這款產品在創作者社區里的口碑一直極佳。原因有三：靈活、便宜（API每張0.035美元，約谷歌三分之一的價格）、內容審核相對寬松。那些想用真人照片做視覺創作的開發者，被谷歌的安全機制拒絕后，往往會果斷轉向Seedream。

Seedream 5同樣把實時搜索整合進了生成流程，不僅推理能力升級、參考一致性加強，還支持在單輪編輯里使用14張參考圖，實現2K/4K分辨率秒出。它甚至支持本地運行，這在谷歌封閉的生態里是絕對不被允許的。

06企業怎么選：三條路徑各有利弊

對于正在搭建AI圖像生成能力的企業來說，當下有三條路徑可以仔細評估。

第一條，繼續走谷歌路線。如果團隊已經深度綁定了谷歌云，Nano Banana 2絕對是順理成章的選擇。價格比Pro級砍半，且產品線全面鋪開，包括Gemini應用、Google搜索的AI模式和鏡頭、AI Studio、Vertex AI、Google Cloud以及Flow等，無需修改架構就能直接用上生產級能力。強大的文本渲染能力對于營銷素材和本地化場景來說更是剛需。

第二條，賭一把開源路線。如果公司具有嚴格的數據主權顧慮，或者每天生成的圖像量過大導致按張計費成本無法承受，再或者就是單純想要擺脫API依賴，那么Qwen-Image-2.0值得高度關注。參數少意味著自托管的GPU成本極低，統一架構能省掉模型串接的繁瑣，且輸出質量并不掉隊。唯一的風險在于阿里是否會按時放出權重。

第三條，保留Pro級通道。Nano Banana Pro并沒有退場，Google AI Pro和Ultra訂閱者依然可以在Gemini應用里通過“重新生成”菜單調用它。對于極高端的創意項目，或者每張圖都需要精細定制調性的場景，Pro級模型依然是不可替代的天花板。

最后一個容易被忽略的致命因素是水印和出處。

Nano Banana 2出廠就強制打上了SynthID水印，同時完美兼容C2PA內容憑證標準。自去年11月在Gemini應用上線以來，SynthID驗證功能已經被高頻使用了2000多萬次。對于金融、醫療等受嚴格監管行業的企業來說，這個功能絕不是可有可無的加分項，而是業務生存的合規必選項。如果企業自己部署的開源模型在水印和憑證這一關過不去，業務流轉同樣會陷入徹底的停滯。

結語：中間地帶的戰爭

綜合來看，Nano Banana 2不是那種讓人驚呼顛覆的產品。它做的是更致命的事：融合Flash的速度與Pro的能力，成本砍半且質量不掉線，徹底夯實了其作為高頻生產工具的地位。

Arena.ai的榜單把它推到了第一。莫利克驗證了它對復雜圖表的掌控力，摩爾則在全場景實測后給出了“重大升級”的定語。但另一邊，Qwen-Image-2.0在開源側翼嚴陣以待，Seedream 5在靈活性和價格上持續死磕。

這場競爭的結果，可能不是誰家模型畫得最漂亮，而是誰家模型畫得夠快、夠便宜、夠穩，能讓企業放心把它塞進生產流程。Nano Banana 2占據的，正是大多數企業真正需要的中間地帶：不需要天花板級的畫質，但要足夠好的效果、足夠快的速度和足夠低的成本。