網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

我的注意力被Google Banana Pro抓住了

2025-11-21 12:49:28　來源: 智遠(yuǎn)同學(xué)

北京舉報(bào)

分享至

文：王智遠(yuǎn) | ID:Z201440

Google 新出的 Banana Pro 模型上線了。

玩到很晚，跑了不少案例。整體感覺這次確實(shí)有點(diǎn)質(zhì)變，有些地方明顯升級(jí)了。

當(dāng)然，也還有些細(xì)節(jié)不夠穩(wěn)。下面是我親自測出來的案例，你可以看一下它到底強(qiáng)在哪、弱在哪。

先上一個(gè)日常最剛需的測試。

這個(gè)提示詞主要考：模型有沒有「專業(yè)設(shè)計(jì)師」的那種審美；推理是否準(zhǔn)確；排版穩(wěn)不穩(wěn)；美術(shù)風(fēng)格會(huì)不會(huì)亂；特別是中文文字處理有沒有拉胯。

提示詞：

Create a4:3 course covertitled “AI for Beginners”.Minimal layout, bold typography, soft geometric shapes, calm blue palette.Clear Chinese subtitle:「零基礎(chǔ)也能學(xué)會(huì)的人工智能入門課」.Keep the design clean and professional.

我測的第二個(gè)案例，是給模型一張自拍，讓它把我生成成「同一個(gè)人、不同時(shí)期的假日照片」，從小時(shí)候一直到 80 歲，用一個(gè)九宮格給我排出來。

Please generate a 3×3 photo grid showing this person on holiday at different ages, from childhood up to 80 years old. The same identity, consistent face.

你別說，還挺像。但話說回來，我老了以后怎么還能謝頂呢？

下面這個(gè)提示詞，難度就上來了：

獲取一個(gè)數(shù)據(jù)集（CSV）；在 Datasette 的瀏覽器界面中探索數(shù)據(jù)；使用 Datasette 的插件生成可視化圖表；發(fā)布一篇可交互的數(shù)據(jù)新聞故事；請(qǐng)使用一個(gè)友好的人物角色來引導(dǎo)敘事。

這個(gè)提示詞考驗(yàn)?zāi)Ｐ湍懿荒馨岩患?fù)雜的事，說清楚、畫明白。

還有幾個(gè)小考點(diǎn)，比如：能不能理解產(chǎn)品界面長什么樣？能不能畫出類似 UI 的東西但不亂？有沒有能力讓一個(gè)小角色出來講故事，把流程講得更好懂？

我覺得，確實(shí)有點(diǎn)難，尤其在文字這塊，基本直接翻車了。但好歹它也把流程硬生生拆成了四步，這點(diǎn)已經(jīng)不容易了。

好吧，那我們?cè)贀Q一個(gè)，來點(diǎn)更亂的。

我給了它一個(gè)把《孫子兵法》《易經(jīng)》《黑客帝國》《三體》全糅在一起的任務(wù)，想看看它能不能把這些亂七八糟的東西拼成一個(gè)畫面。

這是我的提示詞：

把《易經(jīng)》的哲學(xué)、《孫子兵法》的戰(zhàn)略、《黑客帝國》的世界觀、《三體》的文明邏輯融合成一個(gè)“宇宙級(jí)隱喻故事”，要求：三幕式結(jié)構(gòu)、每幕一句箴言、結(jié)尾反轉(zhuǎn)。

它當(dāng)時(shí)的反應(yīng)也挺有意思，先認(rèn)真給我解釋了一大段，說這是一個(gè)非常宏大、也非常有趣的任務(wù)，它會(huì)嘗試把這些深邃的元素融合起來，給我講一個(gè)「宇宙級(jí)」的故事。

結(jié)果嘛……它又翻車了。

然后，它立刻自救，說「我沒辦法用一張圖片完整表達(dá)一個(gè)復(fù)雜的故事，但我能給你畫一張概念圖，把這些元素盡可能擠進(jìn)一個(gè)視覺里」。

第一張圖文字確實(shí)有點(diǎn)拉胯。我跟它說：「你再盡量把文字弄清楚點(diǎn)。」然后，它給出了下面這張最終版。

不得不說，細(xì)節(jié)是有點(diǎn)粗糙……但好歹能看出來它想表達(dá)啥，對(duì)吧。

那就換個(gè)簡單點(diǎn)的吧。

做一張?zhí)貏e干凈、特別克制、現(xiàn)代極簡風(fēng)的海報(bào)——不要熱鬧、不要夸張，要那種安安靜靜、淡淡的、舒服的感覺。

提示詞如下：

Create a minimalist modern poster with a clean layout.Theme:“Quiet Energy”.Large empty spaces, soft gradients, one geometric shape as the central element.Use only two colors.Title placed in the lower-left corner in thin sans-serif type.Mood: calm, atmospheric, contemporary.

我覺得這張圖出來，很舒服。本身我對(duì)它也沒抱著「驚艷」的預(yù)期，所以，達(dá)到這個(gè)程度就 OK 了。

但如果你想看點(diǎn)更震撼的，那就看下一個(gè)：

Create a poster titled “Gravity in Silence”: a giant floating stone sphere above a calm dawn ocean, cool blues + warm golds, soft mist and ripples, minimal title, surreal and majestic mood.

這條提示詞的核心意思是：做一張非常震撼的概念海報(bào)：一顆巨大的石頭球漂浮在海面上，有光、有霧、有漣漪，整個(gè)畫面夢(mèng)幻、史詩、安靜但很有力量。

還可以。接下來我們?cè)僭囋嚵鞒虉D吧：

生成一張傳統(tǒng)茶葉制作工藝流程圖，中文，9:16 豎版；內(nèi)容含：采青、曬青、搖青、殺青、揉捻、烘焙；要求：流程清晰、色調(diào)自然、有點(diǎn)科普視覺感。

流程圖測完之后，我又想看看它的科普能力怎么樣。

Make a9:16 educational infographicinChinese, topic:「moon phase changes」. Show the cycle: new moon → first quarter → full moon → last quarter；Use simple icons, arrows, and labeled diagrams. Keep layout organized。

意思是讓模型畫一張中文的「月相變化」科普豎版圖，用小圖標(biāo)、箭頭、標(biāo)簽，把「新月到滿月」整個(gè)過程清清楚楚講出來。

好吧，光玩科普也有點(diǎn)無聊，那就換個(gè)更實(shí)用的，讓它來做一張電商海報(bào)。提示如下：

Create a clean, modern 9:16 e-commerce poster for the “Fresh Brew Coffee Maker”: product large and centered with soft studio lighting; bold Chinese headline 「今日限時(shí)特惠」 and smaller sub-text 「新鮮萃取 · 一鍵享受」; warm beige + dark brown palette; minimal layout with simple price-tag accents.

一張標(biāo)準(zhǔn)的電商海報(bào)，產(chǎn)品居中、字體清晰、有主標(biāo)題、有賣點(diǎn)、有價(jià)格感，顏色干凈，整體構(gòu)圖就是天貓、京東那種專業(yè)范兒。

我自認(rèn)要求挺高，它這張電商海報(bào)做出來還真是不用改，直接能上架那種。

接下來，想測測它的「用戶旅程圖」能力。

想到這個(gè)測試，我瞬間想起好幾年前，我讓公司設(shè)計(jì)老師給我們做用戶旅程圖，結(jié)果整整搞了好幾天，差點(diǎn)崩潰。

Generate a 4:3 Chinese UX journey map titled 「用戶使用 AI 助理的一天」. Include 5 stages with icons and short labels. Make the flow clear and visually structured.

這個(gè)結(jié)果咋說呢？

從細(xì)節(jié)來看，我滿意的，只是它有點(diǎn)那種「AI 生成式 PPT」的味道，但我也沒在這一步要求它有審美，你自己試一下就知道了。

下面這個(gè)主要看他夠不夠震撼：

9:16 cinematic visual “The Rising Monolith”: huge black monolith in a dawn desert, long shadow, tiny human, golden light + dust, edge glow, black/sand palette, caption 「寂靜中的崛起」。

我覺得這張還可以，有點(diǎn)「沙漠探險(xiǎn)電視劇」的味道，仿佛下一秒就要走進(jìn)古埃及遺跡了。你說是不是？

看完這些震撼的，我又讓他給我做了一個(gè)抽象的：

Comic scene in “A Thousand Li of Rivers and Mountains”: Li Bai & Du Fu selling “AI Poetry Tutorials” with a 「十秒學(xué)會(huì)五言律詩」 banner; Chang’e walking by with “Moonlight Brew”; style mixing Chinese painting + colorful comic vibe.
這條英文提示詞是讓模型在古畫里畫一個(gè)荒誕漫畫場景：李白和杜甫在賣「AI 寫詩教程」，嫦娥路過攤位買酒，整幅畫統(tǒng)一成國風(fēng)彩繪漫畫的風(fēng)格。

你別說，還真有點(diǎn)抽象，但理解得還挺準(zhǔn)的。

接著我又玩了幾個(gè)搞怪的小任務(wù)。比如，深夜餓了，讓它給我「畫餅充饑」一下，來一個(gè)烤雞流程圖：

Create a simple9:16 funny flowcharttitled“How to Roast a Chicken”.UseChinese labels.Include 3–4 playful steps with cute icons, like preparing the chicken, adding spices, putting it in the oven, and celebrating when it’s done.Keep it humorous, light, and easy to understand.

這個(gè)提示詞的意思，是做一個(gè)搞怪夸張的烤雞步驟圖，越無厘頭越好，但排版要能看懂。

玩到這兒，我又想到一個(gè)更好玩的：

Create a funny horizontal illustration (4:3) titled “The Daily Life of Office Cattle & Horses”: cartoon cows and horses in a modern office onedrowning in paperwork, one carrying five laptops, another making coffee with a broken machine; add Chinese joke labels; style: colorful, humorous, exaggerated

讓它畫一張牛馬們?cè)谵k公室上班、被文件淹、抱著五臺(tái)電腦、咖啡機(jī)壞了還要泡咖啡的搞笑橫圖。

這些是我隨手測的幾組案例，后面還有一堆，我就不全貼了。你自己去玩兩下就知道，在 Gemini AI 助理里直接就能試，就是每天有點(diǎn)額度限制。

這兩天谷歌真把我的注意力牢牢抓住了。

新模型確實(shí)好用，當(dāng)然還有不少地方能繼續(xù)提升。接下來壓力大概就要輪到 OpenAI、grok，還有國內(nèi)這些大模型了。

好卷。說真的，如果 AI 不是未來，那什么是未來呢？

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.