用 AI 生圖,總有一道坎繞不過去:要更快,還是要更好?
但速度與質量之間,未必是魚和熊掌不可兼得。就在剛剛,Google 正式發布了他們的新一代圖像生成模型:Nano Banana 2(Gemini 3.1 Flash Image)。
![]()
沒有太多顛覆世界的口號,它只是把更好的畫質和更懂人話的理解力,一起塞進了全新的底層架構里。就這一件事,卻讓 AI 生圖少了幾分抽卡感,多了幾分真正能用的踏實。
![]()
官方博客地址:https://blog.google/innovation-and-ai/technology/ai/nano-banana-2/
接入了整個互聯網,這次的 AI 真的懂你在說什么
要說清楚這次的變化,得先回想一下三年前 AI 生圖有多難用。
你讓它畫「紅燒肉」,它可能老老實實給你畫一塊正在燃燒的肉;你讓它在海報上寫句中文,它往往會給你湊出一堆毫無意義的鬼畫符。缺乏對真實世界的常識,是第一代 AI 最容易讓人崩潰的地方。
現在的 Nano Banana 2,改變了不少。它和前代 Nano Banana Pro 一樣,接入了 Gemini 積累的龐大真實世界知識庫,還能結合網頁搜索的實時信息,用起來更像是一個見過世面、懂點常識的人。
最先感受到的變化,是它開始更好地理解空間和比例了。
![]()
提示詞:畫面中,【東方明珠廣播電視塔】被一只超級巨大、超級可愛的【貓】占據。周圍的建筑物看起來就像玩具模型一樣小,而【貓】則非常巨大。游戲背景設定在一個逼真的城市環境中。整體氛圍安靜、溫暖、舒緩、可愛。
在上面這個案例中,AI 精準地還原了上海的地標,并極其自然地處理了巨貓與微縮城市之間的光影和透視關系。
再比如讓它畫一幅《楓橋夜泊》的水墨畫。畫面上方不僅端端正正地用書法寫出了「月落烏啼霜滿天」等全句,甚至連排版和水墨的意境都把握得比較準。
![]()
當然,也不是沒有瑕疵,仔細看上方悄悄多出了一個「滿」字。
除了詩意,它還能處理相當復雜的 UI 場景——在下面這張圖里,復雜的半透明數據面板、懸浮的購物清單、精準的中文顯示,被 AI 有條不紊地安排得井井有條,信息之間的層級關系也真正理清楚了。
![]()
提示詞:第一人稱視角,置身于燈光明亮的超市貨架通道中。人類雙手將一瓶芬達汽水舉到鏡頭前方。鮮艷的橙色飲料裝在其標志性的品牌瓶身里,周圍環繞著多層全息增強現實界面,用中文展示營養相關數據,包括熱量數值、含糖量、咖啡因水平、新鮮度指示、保質/到期日期,以及基于芬達推薦的清爽飲品配方和雞尾酒調制方案。玻璃質感的 UI 面板,柔和的環境光暈,逼真的光照與陰影,自然的景深效果,沉浸式第一人稱交互界面,2K
排版極其講究的雙頁黑白日式漫畫,也是手拿把掐。
![]()
提示詞:設計一份逼真的雙頁漫畫雜志樣張。每一頁都應包含多個漫畫風格分鏡,以富有動感的版式排列,呈現出專業印刷的日本漫畫質感。整體風格為黑白稿,使用粗獷有力的墨線、網點效果(screen tones)以及富有表現力的人物繪制。畫面中加入對白氣泡、中文擬聲詞,并通過分鏡之間的過渡來傳達動作、情緒與節奏。左右兩頁需要連貫銜接,像同一場景或同一話章節的一部分。采用傳統漫畫鏡頭語言:特寫、遠景、斜向分鏡以及戲劇化的視角與構圖。整體觀感要真實可信,仿佛來自一本真正的漫畫雜志的跨頁內容。
或者這張帶步驟說明的「功夫茶」中文信息圖,從排版到意境,都給出了一套可以直接用的視覺方案。
![]()
生成提示詞:一張關于中國傳統功夫茶道設計精美的垂直信息圖。中國傳統水墨畫背景。頂部有巨大的、優雅的中文書法標題,明確寫著「功夫茶」。向下有三個圖文并茂的步驟:步驟 1 展示用沸水溫杯,配有中文「溫杯」;步驟 2 展示將茶葉放入蓋碗,配有中文「投茶」;步驟 3 展示倒出茶湯,配有中文「出湯」。優雅、極簡、溫暖的大地色調,平衡的布局。
一位很早就接觸到 Nano Banana 2 的內測用戶,給出了一個相當中肯的評價:「它并不完美,但它是第一個能夠以一定一致性,去處理真正復雜圖像和圖表的模型。」
![]()
為了測試這個新模型的理解極限,他隨手甩出了一道極其刁鉆的測試題:「給我畫一張設定在古威尼斯的《尋找沃爾多(Where's Waldo)》,但里面要找的不能是人,得是一只穿著藍色條紋飛行服的水獺。」
Nano Banana 2 最終也真的理清了邏輯,不僅沒畫串,還穩穩地交出了答卷。
快和好,終于不用二選一了?
除了懂常識,強大的「主體一致性」是這次 Nano Banana 2 更新的另一大殺手锏。
在一次生成過程中,它最多能保持 5 個角色的臉不崩,或者 14 個物品的樣子不變。這意味著,你可以放心大膽地拿它來畫連載漫畫或者做影視分鏡了。
![]()
不僅如此,它的畫質也達到了可以直接干活的標準。
從 512px 的配圖到 4K 級別的超高清海報,它都能拿捏。輸入一段關于「重慶老火鍋」的提示詞,它能生成一張賽博朋克風的雨夜街景,濕漉漉的柏油路上,紅藍霓虹燈的倒影和「24 小時營業」的招牌都細致入微。
![]()
提示詞:一張繁忙亞洲城市雨夜的電影感街頭照片。一個巨大的、發光的紅色霓虹燈牌掛在一座老建筑上,上面清晰地寫著「重慶老火鍋」。在它下面,一個較小的藍色霓虹燈牌寫著「24 小時營業 - 歡迎光臨」。濕漉漉的柏油路反射著霓虹燈光。
色彩張力極強的波普藝術風格,它也駕馭得住。
![]()
或者是這種帶著幾分荒誕、又透著高級感的時尚大片:
![]()
提示詞:This high-resolution bird's-eye view photograph was taken with a LOMO Ic-a. The ground is covered with countless black-and-white billboard advertisements of beautiful fashion models, and standing on top of the advertisements is an incredibly beautiful chinese film actress wearing a long black coat.
在這個俯視視角的案例中,AI 極好地模擬了老式 LOMO 相機的特殊質感。女演員孑然獨立于鋪滿黑白海報的地面上,畫面的電影張力和故事感呼之欲出。
不過也不是沒有明顯短板,讓它將二次元人物、鉛筆素描和黏土人強行塞進同一個真實咖啡館的場景中,素描人物的融入就顯得十分生硬,邊緣過渡也不夠自然。
顯然,在跨維度融合上,它遠不及前代模型效果來得自然,還有進步的空間。
![]()
提示詞:A photo of an everyday scene at a busy cafe serving breakfast. In the foreground is an anime man with blue hair, one of the people is a pencil sketch, another is a claymation person
其實整體體驗下來,盡管官方博客將 Nano Banana 2(Gemini 3.1 Flash Image)吹的天花亂墜,但實際體感中,生成的質量效果和速度并未得到肉眼可見的提升,甚至在部分場景中還不及前代模型。
真正讓 Nano Banana 2 站穩腳跟的,其實是它極其接地氣的性價比。
今天起,在 Gemini 應用和 Google 搜索框里,你都能順手用上它。沒有訂閱方案的普通用戶,24 小時內也能白嫖 100 張;而 Pro 訂閱用戶的額度則高達 1000 張。
對于開發者而言,API 的價格更是直接腰斬,僅為上一代 Pro 模型的一半。折算下來,生成一張 4K 高清圖的成本被硬生生打到了 0.15 美元左右。
![]()
附上地址:https://ai.google.dev/gemini-api/docs/pricing#gemini-3.1-flash-image-preview
當然,當 AI 能夠以極低的成本、極快的速度批量生產高清圖片時,大家心里其實越沒底。現在網上的假圖滿天飛,「眼見為實」這句話早就靠不住了。如果任何人都能在一秒鐘內生成一張幾可亂真的照片,我們該如何分辨圖片?
Google 自己也十分清楚這一點,所以他們也一并升級了防偽技術。Nano Banana 2 繼續加深了對 SynthID 數字水印和 C2PA 內容憑證的支持,能夠更清楚地看到一張圖到底是不是 AI 畫的,以及它是怎么被修改的。
據統計,自去年 11 月以來,Gemini 里的這個驗證功能已經被調用了超過 2000 萬次。
AI 繪圖這兩年的發展,確實快得讓人眼花繚亂。我們經歷過 Nano Banana Pro 的一眼驚艷,也經歷過繁瑣的調教與漫長的等待。
Nano Banana 2 的出現,則嘗試進一步把好和快揉在一起,你腦子里的一個靈感,不用再經過反復的修改和焦躁的等待。自然、簡單,且立等可取,這件事聽起來平常,但能邁出一小步,其實已經是 AI 生圖的一大步了。
歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關鏈接)
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.