![]()
文:王智遠 | ID:Z201440
Google 新出的 Banana Pro 模型上線了。
玩到很晚,跑了不少案例。整體感覺這次確實有點質變,有些地方明顯升級了。
當然,也還有些細節不夠穩。下面是我親自測出來的案例,你可以看一下它到底強在哪、弱在哪。
先上一個日常最剛需的測試。
這個提示詞主要考:模型有沒有「專業設計師」的那種審美;推理是否準確;排版穩不穩;美術風格會不會亂;特別是中文文字處理有沒有拉胯。
提示詞:
Create a4:3 course covertitled “AI for Beginners”.Minimal layout, bold typography, soft geometric shapes, calm blue palette.Clear Chinese subtitle:「零基礎也能學會的人工智能入門課」.Keep the design clean and professional.
![]()
我測的第二個案例,是給模型一張自拍,讓它把我生成成「同一個人、不同時期的假日照片」,從小時候一直到 80 歲,用一個九宮格給我排出來。
Please generate a 3×3 photo grid showing this person on holiday at different ages, from childhood up to 80 years old. The same identity, consistent face.
![]()
你別說,還挺像。但話說回來,我老了以后怎么還能謝頂呢?
下面這個提示詞,難度就上來了:
獲取一個數據集(CSV);在 Datasette 的瀏覽器界面中探索數據;使用 Datasette 的插件生成可視化圖表;發布一篇可交互的數據新聞故事;請使用一個友好的人物角色來引導敘事。
這個提示詞考驗模型能不能把一件復雜的事,說清楚、畫明白。
還有幾個小考點,比如:能不能理解產品界面長什么樣?能不能畫出類似 UI 的東西但不亂?有沒有能力讓一個小角色出來講故事,把流程講得更好懂?
![]()
我覺得,確實有點難,尤其在文字這塊,基本直接翻車了。但好歹它也把流程硬生生拆成了四步,這點已經不容易了。
好吧,那我們再換一個,來點更亂的。
我給了它一個把《孫子兵法》《易經》《黑客帝國》《三體》全糅在一起的任務,想看看它能不能把這些亂七八糟的東西拼成一個畫面。
這是我的提示詞:
把《易經》的哲學、《孫子兵法》的戰略、《黑客帝國》的世界觀、《三體》的文明邏輯融合成一個“宇宙級隱喻故事”,要求:三幕式結構、每幕一句箴言、結尾反轉。
它當時的反應也挺有意思,先認真給我解釋了一大段,說這是一個非常宏大、也非常有趣的任務,它會嘗試把這些深邃的元素融合起來,給我講一個「宇宙級」的故事。
結果嘛……它又翻車了。
![]()
然后,它立刻自救,說「我沒辦法用一張圖片完整表達一個復雜的故事,但我能給你畫一張概念圖,把這些元素盡可能擠進一個視覺里」。
第一張圖文字確實有點拉胯。我跟它說:「你再盡量把文字弄清楚點。」然后,它給出了下面這張最終版。
不得不說,細節是有點粗糙……但好歹能看出來它想表達啥,對吧。
那就換個簡單點的吧。
做一張特別干凈、特別克制、現代極簡風的海報——不要熱鬧、不要夸張,要那種安安靜靜、淡淡的、舒服的感覺。
提示詞如下:
Create a minimalist modern poster with a clean layout.Theme:“Quiet Energy”.Large empty spaces, soft gradients, one geometric shape as the central element.Use only two colors.Title placed in the lower-left corner in thin sans-serif type.Mood: calm, atmospheric, contemporary.
![]()
我覺得這張圖出來,很舒服。本身我對它也沒抱著「驚艷」的預期,所以,達到這個程度就 OK 了。
但如果你想看點更震撼的,那就看下一個:
Create a poster titled “Gravity in Silence”: a giant floating stone sphere above a calm dawn ocean, cool blues + warm golds, soft mist and ripples, minimal title, surreal and majestic mood.
這條提示詞的核心意思是:做一張非常震撼的概念海報:一顆巨大的石頭球漂浮在海面上,有光、有霧、有漣漪,整個畫面夢幻、史詩、安靜但很有力量。
![]()
還可以。接下來我們再試試流程圖吧:
生成一張傳統茶葉制作工藝流程圖,中文,9:16 豎版;內容含:采青、曬青、搖青 、殺青、揉捻、烘焙;要求:流程清晰、色調自然、有點科普視覺感。
流程圖測完之后,我又想看看它的科普能力怎么樣。
Make a9:16 educational infographicinChinese, topic:「moon phase changes」. Show the cycle: new moon → first quarter → full moon → last quarter;Use simple icons, arrows, and labeled diagrams. Keep layout organized。
意思是讓模型畫一張中文的「月相變化」科普豎版圖,用小圖標、箭頭、標簽,把「新月到滿月」整個過程清清楚楚講出來。
![]()
好吧,光玩科普也有點無聊,那就換個更實用的,讓它來做一張電商海報。提示如下:
Create a clean, modern 9:16 e-commerce poster for the “Fresh Brew Coffee Maker”: product large and centered with soft studio lighting; bold Chinese headline 「今日限時特惠」 and smaller sub-text 「新鮮萃取 · 一鍵享受」; warm beige + dark brown palette; minimal layout with simple price-tag accents.
一張標準的電商海報,產品居中、字體清晰、有主標題、有賣點、有價格感,顏色干凈,整體構圖就是天貓、京東那種專業范兒。
![]()
我自認要求挺高,它這張電商海報做出來還真是不用改,直接能上架那種。
接下來,想測測它的「用戶旅程圖」能力。
想到這個測試,我瞬間想起好幾年前,我讓公司設計老師給我們做用戶旅程圖,結果整整搞了好幾天,差點崩潰。
Generate a 4:3 Chinese UX journey map titled 「用戶使用 AI 助理的一天」. Include 5 stages with icons and short labels. Make the flow clear and visually structured.
![]()
這個結果咋說呢?
從細節來看,我滿意的,只是它有點那種「AI 生成式 PPT」的味道,但我也沒在這一步要求它有審美,你自己試一下就知道了。
下面這個主要看他夠不夠震撼:
9:16 cinematic visual “The Rising Monolith”: huge black monolith in a dawn desert, long shadow, tiny human, golden light + dust, edge glow, black/sand palette, caption 「寂靜中的崛起」。
![]()
我覺得這張還可以,有點「沙漠探險電視劇」的味道,仿佛下一秒就要走進古埃及遺跡了。你說是不是?
看完這些震撼的,我又讓他給我做了一個抽象的:
Comic scene in “A Thousand Li of Rivers and Mountains”: Li Bai & Du Fu selling “AI Poetry Tutorials” with a 「十秒學會五言律詩」 banner; Chang’e walking by with “Moonlight Brew”; style mixing Chinese painting + colorful comic vibe.
這條英文提示詞是讓模型在古畫里畫一個荒誕漫畫場景:李白和杜甫在賣「AI 寫詩教程」,嫦娥路過攤位買酒,整幅畫統一成國風彩繪漫畫的風格。
![]()
你別說,還真有點抽象,但理解得還挺準的。
接著我又玩了幾個搞怪的小任務。比如,深夜餓了,讓它給我「畫餅充饑」一下,來一個烤雞流程圖:
Create a simple9:16 funny flowcharttitled“How to Roast a Chicken”.UseChinese labels.Include 3–4 playful steps with cute icons, like preparing the chicken, adding spices, putting it in the oven, and celebrating when it’s done.Keep it humorous, light, and easy to understand.
這個提示詞的意思,是做一個搞怪夸張的烤雞步驟圖,越無厘頭越好,但排版要能看懂。
![]()
玩到這兒,我又想到一個更好玩的:
Create a funny horizontal illustration (4:3) titled “The Daily Life of Office Cattle & Horses”: cartoon cows and horses in a modern office onedrowning in paperwork, one carrying five laptops, another making coffee with a broken machine; add Chinese joke labels; style: colorful, humorous, exaggerated
讓它畫一張牛馬們在辦公室上班、被文件淹、抱著五臺電腦、咖啡機壞了還要泡咖啡的搞笑橫圖。
![]()
這些是我隨手測的幾組案例,后面還有一堆,我就不全貼了。你自己去玩兩下就知道,在 Gemini AI 助理里直接就能試,就是每天有點額度限制。
這兩天谷歌真把我的注意力牢牢抓住了。
新模型確實好用,當然還有不少地方能繼續提升。接下來壓力大概就要輪到 OpenAI、grok,還有國內這些大模型了。
好卷。說真的,如果 AI 不是未來,那什么是未來呢?
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.