從昨晚到早上大家應(yīng)該看了很多 Gemini 3 的相關(guān)信息了,藏師傅這里就不廢話了。
簡單說一下它有多強(qiáng),從測試基準(zhǔn)來看直接在幾乎所有基準(zhǔn)上都達(dá)到了 SOTA,同時(shí)相當(dāng)一部分大幅領(lǐng)先第二名,當(dāng)然除了 SWE-Bench 這個(gè)。
用來驗(yàn)證 AI 是否脫離了“概率模仿”并開始產(chǎn)生“真正思考”的測試集 ARC-AGI v2 的得分上,甚至超過了現(xiàn)在最強(qiáng)模型的兩倍以上,看看 Gemini 3 孤零零在的位置。
從昨晚發(fā)布開始我就用 Gemini 3 做了相當(dāng)多的測試。
同時(shí)測試內(nèi)容依舊秉承藏師傅一貫的觀點(diǎn),除了測試能力以外也盡可能都是對(duì)大家有用的。
我也會(huì)開放這些提示詞,由于谷歌一貫的財(cái)大氣粗,所以你幾乎在 AI Studio 和谷歌新發(fā)布的 AI IDE Antigravity上可以免費(fèi)用 Gemini 3,只有你自己的看法才是最客觀的,建議多試試。
Gemini 剛發(fā)布的時(shí)候我最關(guān)注的還是多模態(tài)的理解能力,畢竟這個(gè)一直是谷歌的看家本事,先拿了兩個(gè)視頻試了一下。
第一個(gè)是 AI 藝術(shù)家 852話 做的 AI MV 視頻,里面有相當(dāng)多的快閃效果,分鏡變化也很頻繁,非常適合用來分析模型對(duì)于視頻細(xì)節(jié)的分析能力。
提示詞是:幫我詳細(xì)分析這個(gè)視頻的每個(gè)分鏡內(nèi)容,確保我可以讓設(shè)計(jì)師復(fù)刻它
可以看到他幾乎按每秒鐘說了每個(gè)動(dòng)畫效果表現(xiàn)的細(xì)節(jié)和畫面主體內(nèi)容,前面加上了總的風(fēng)格描述,最后加上了如果要用 AE 做的話用哪些插件才行,非常細(xì)了。
接下來剛好要發(fā)谷歌新發(fā)布的 AI IDE 的介紹,索性直接把他們的宣傳視頻扔給了 Gemini 3,讓他幫我總結(jié)。
整體非常有條理,產(chǎn)品的核心定位、宣傳主題以及產(chǎn)品的詳細(xì)功能都分析到了,我直接就發(fā)了,結(jié)果數(shù)據(jù)還行。
提示詞為:幫我詳細(xì)總結(jié)視頻內(nèi)容,介紹這個(gè)產(chǎn)品。
然后就來到了我們的重頭戲,編碼能力上,現(xiàn)在 AI Studio 里面的 Build 模式是真的頂,居然生成的網(wǎng)頁也可以直接調(diào)用谷歌所有 AI 能力。
于是就想能不能讓他幫我直接實(shí)現(xiàn)一個(gè)設(shè)計(jì) Agent 產(chǎn)品,可以幫我思考設(shè)計(jì)方案,完善之后自己寫提示詞作圖。
提示詞:幫我實(shí)現(xiàn)一個(gè)功能完整的視頻和圖片Agent 平臺(tái),支持自主完成圖像編輯和設(shè)計(jì)任務(wù)
沒想到真的可以,支持對(duì)話,他詳細(xì)詢問你的需求,然后幫你用 Nano 生成設(shè)計(jì)圖,真的一句話一次就搞定了,我甚至沒說什么是設(shè)計(jì) Agent 以及應(yīng)該如何實(shí)現(xiàn)這些能力。
這個(gè) Logo 設(shè)計(jì)圖和基于 Logo 設(shè)計(jì)的月餅包裝袋都是它幫忙設(shè)計(jì)的,以前哪敢想啊,朋友們,需求和實(shí)現(xiàn)方案都不管,一句話需求,說句不好聽的,實(shí)習(xí)生肯定搞不定。
然后我們來試一下 Gemini 3 的設(shè)計(jì)稿還原能力。
我找了一張自己收藏夾里相對(duì)復(fù)雜的設(shè)計(jì)圖,里面細(xì)節(jié)挺多的,讓他完美還原這個(gè)設(shè)計(jì)稿,圖片可以用占位圖。
沒想到直出效果這么好,尤其是頭部這部分的排版細(xì)節(jié),比如字號(hào)、字體顏色以及行間距等。
而且右邊那本書他找不到圖片,直接自己用代碼寫了一本,還補(bǔ)全了設(shè)計(jì)稿中不存在的的內(nèi)容。
昨天有朋友說,這個(gè)細(xì)節(jié)還是有問題,我還開玩笑說,沒 AI 的時(shí)候一些大廠程序員拿著 figma 設(shè)計(jì)稿第一版能做到這個(gè)水平,我就已經(jīng)燒高香了。
然后我就想,圖片 Agent 做了,那要不整一個(gè)視頻 Agent?
但是 AI Studio 里面沒有內(nèi)置 Veo 3.1 視頻模型,于是我就到 Youware 用 Gemini 3 試了一下,也是簡單說了一下。
提示詞:幫我做一個(gè)設(shè)計(jì) Agent 網(wǎng)頁工具,它可以幫我自動(dòng)地迭代和優(yōu)化,并且生成設(shè)計(jì)圖和設(shè)計(jì)視頻,調(diào)用所有相關(guān)的設(shè)計(jì) AI API。
第一次他生成的視頻只有一個(gè)分鏡,于是又讓他加了多個(gè)分鏡編排的能力,讓他調(diào)用 LLM 生成提示詞和劇本。
然后搞定了,真離譜啊,選擇故事模式后他會(huì)自己生成劇本以及每個(gè)分鏡的提示詞然后調(diào)用 Veo 生成多段視頻。
然后我才反應(yīng)過來,我這不是做了一個(gè) Krea 那種 AI 聚合應(yīng)用嗎,基本功能都有了,于是直接把 Krea 的界面截圖扔給他,連界面也復(fù)刻了,哈哈。
早上起來刷到一個(gè),那種宣傳產(chǎn)品功能的用 AE 做的快閃動(dòng)畫,然后就想這里面都是前端界面的元素嗎,能不能讓 Gemini 3 用代碼給我整一個(gè)。
整理了一下提示詞之后,他還真的整了一個(gè)出來,現(xiàn)在會(huì)以之前非常流行的滾動(dòng)敘事網(wǎng)頁的形式表現(xiàn),如果你想做自己的產(chǎn)品網(wǎng)站的話可以參考這個(gè)提示詞,還是很吸睛的。
Gemini 3 滾動(dòng)敘事網(wǎng)頁生成提示詞:
請(qǐng)你扮演一位擅長創(chuàng)意交互的前端開發(fā)專家。我要做一個(gè)類似 Apple 產(chǎn)品頁風(fēng)格的“Scrollytelling(滾動(dòng)敘事)”網(wǎng)頁 Demo。
技術(shù)棧要求:
使用 HTML、CSS 和 GSAP (GreenSock) 配合 ScrollTrigger 插件。
交互邏輯:
頁面高度要設(shè)置得很長(如 5000px),建立一個(gè)全屏固定的視口(Pinned Container)。用戶的滾動(dòng)動(dòng)作不移動(dòng)頁面,而是作為進(jìn)度條(Scrub: 1)直接控制整個(gè)動(dòng)畫的時(shí)間軸播放。
視覺與動(dòng)畫流程(請(qǐng)按順序?qū)崿F(xiàn)以下 Timeline):
開場: 屏幕中心只有簡潔的文字 Slogan,隨著滾動(dòng),文字放大并漸隱消失。
UI 演示: 隨后,模擬“手機(jī)通知彈窗”和“郵件列表卡片”從不同方向平滑飛入屏幕中心。
堆疊特效: 繼續(xù)滾動(dòng),這些分散的卡片要通過 3D 變換,自動(dòng)吸附堆疊在一起(Stacking Effect)。
高潮: 出現(xiàn)一個(gè)“Unsubscribe All”的按鈕,當(dāng)滾動(dòng)經(jīng)過它時(shí),堆疊的所有卡片瞬間向四周炸開/飛走(Explosion Effect)。
結(jié)尾: 露出最后的 Logo。
風(fēng)格要求:
極簡主義、圓角卡片設(shè)計(jì)、陰影柔和、動(dòng)畫曲線要非常有彈性(Elastic/Spring)。請(qǐng)直接給我可運(yùn)行的完整代碼文件
從三秒開始的動(dòng)畫真的很頂,這個(gè)3D 卡片的旋轉(zhuǎn)懸浮然后再排列整齊的動(dòng)畫非常的流暢而且豐富。
而且美學(xué)表現(xiàn)也很強(qiáng),標(biāo)題的漸變色、描邊以及后面卡片的細(xì)節(jié),你真的可以用這套邏輯讓 Gemini 幫你用前端寫一個(gè)宣傳視頻出來,這是一個(gè)很大的機(jī)會(huì),可以填補(bǔ)目前的 AI 視頻模型做不了的部分。
上面的離譜嗎?還有更離譜的,早上看見朋友向陽喬木想用 Gemini 生成短劇點(diǎn)子,于是優(yōu)化了一下,看看能不能讓 Gemini 3 直接生成互動(dòng)式游戲。
沒想到在 AI Studio 里面簡單調(diào)整了兩次就搞定了,Gemini 3 會(huì)根據(jù)你提供的文本生成互動(dòng)式游戲,很像 GalaGame 常見的形式。
區(qū)別就是里面所有的素材都是隨著劇情的推進(jìn)實(shí)時(shí)生成的,包括:對(duì)話文案、語音對(duì)話、人物頭像、畫面背景以及章節(jié)信息。
上面這是個(gè)很好的機(jī)會(huì),人人只要有好劇本會(huì)打字就可以做互動(dòng)內(nèi)容和互動(dòng)游戲,再搭配蘋果前幾天給類似小程序這種產(chǎn)品松綁和降低分成,里面可能醞釀著一個(gè)新的頂級(jí)內(nèi)容消費(fèi)平臺(tái)的機(jī)會(huì)。
你用下面這個(gè)提示詞在 AI Studio 里面的 Build 模式可以直接生成類似游戲,記得在第四步把文案放進(jìn)去,老板以后靠這個(gè)提示詞發(fā)財(cái)了,可千萬記得點(diǎn)我。
Gemini 3 互動(dòng)漫劇生成提示詞:
Act as a World-Class Frontend Engineer and UI/UX Designer.
Create a "High-Fidelity Interactive Visual Novel" web application using React (es6 modules), Tailwind CSS, and the Google Gemini API (@google/genai).
1. Design Philosophy & UI Style (Crucial)
The UI must strictly follow a "Japanese Commercial Galgame (Visual Novel)" aesthetic.
- Vibe: Dark Fantasy, Cyberpunk, Polish, High-End.
- Art Style for AI Generation: Enforce "Japanese Celluloid Anime Style (賽洛魯/平涂)" for all generated images.
- Dialogue Box: NOT a simple rectangle. It must feature:
- A "Glassmorphism" background (dark, blurred).
- Decorative Tech/Fantasy borders (double lines, glowing neon accents in Cyan/Gold).
- A dedicated, stylized "Nameplate" attached to the top-left of the box.
- A large, rectangular Character Avatar (3:4 ratio) on the left side with a decorative frame.
- Typography: Clean, readable serif or sans-serif with typing writer effects.
- Animations: Smooth fade-ins for backgrounds/characters, shake effects for intense scenes, flash effects for combat.
- 1.Story Engine: Iterate through a predefined script (I will provide the story content below).
- 2.AI Image Generation (Gemini Nano/Flash):
- Backgrounds: Automatically generate scene backgrounds based on the current plot location using gemini-2.5-flash-image.
- Character Tachie (Portraits): Automatically generate character standees. Apply a "Card" style frame (rounded corners, inner shadow, border) so they look like polished assets, not raw photos.
- Prompt Engineering: Automatically append "Japanese Celluloid Anime Style, masterpiece, flat color" to all image prompts to ensure consistency.
- 3.Text-to-Speech (TTS): Use the Web Speech API to read dialogue. Assign different pitch/rate to different characters (e.g., Deep/Slow for the Monster, Normal for the Protagonist).
- 4.Gemini Insight: A button to analyze the current scene's sentiment and lore using gemini-2.5-flash.
- Use a constant file to store the Story Script.
- Define Characters with properties: id, name, visualDescription (for AI generation), voicePitch, voiceRate.
- Define Backgrounds with properties: type, visualDescription.
Please parse the following novel content into the structured script.
[在此處粘貼你的小說正文內(nèi)容]
5. Technical Requirements
- Use process.env.API_KEY for Gemini.
- Handle async image generation gracefully (show a "Generating..." loader in the UI).
- Single file structure preferred or standard modular structure (App, components, services).
- Ensure the layout is responsive but optimized for Landscape viewing.
Generate the complete code now.
最后是一個(gè)很好玩的案例,可以同時(shí)表現(xiàn) Gemini 3 的多模態(tài)能力以及代碼能力,它可以直接從一張圖片幫你生成 3D 的體素圖像動(dòng)畫,還原度很高。
提示詞:I have provided an image. Code a beautiful voxel art scene inspired by this image. Write threejs code as a single-page
剛好刷到一個(gè)很好看的賽博風(fēng)格圣誕樹圖片就扔個(gè) Gemini 3 了。
沒想到它這么懂,帶縮放動(dòng)畫的星星、閃光特效和旋轉(zhuǎn)的點(diǎn)狀發(fā)光絲帶,給整個(gè)動(dòng)畫增加了非常多的表現(xiàn)力。順便用這玩意提前祝大家圣誕快樂了。
好了這期內(nèi)容就這樣了,希望這些玩法和測試能給你帶來一些啟發(fā)。
DeepMind 的人說今晚還有大的,不知道是不是昨天試的 Nano Banana Pro 模型,谷歌怕不是要熬死我們這幫人。
如果你覺得這些內(nèi)容對(duì)你有幫助的話,可以幫我點(diǎn)個(gè)贊或者,也可以轉(zhuǎn)發(fā)??給你需要的朋友們,我們?cè)u(píng)論區(qū)見。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.