先讓我插入幾個巨牛逼的例子,都是來源上一篇的評論區:
![]()
![]()
![]()
本文全部信息,來自谷歌官方
![]()
今天,Nano Banana Pro 正式發布(不叫 Banana2)
這東西,可通過 Google AI Studio 中的 Gemini API 和企業級 Vertex AI 平臺,構建新一代智能多模態應用。該模型能解鎖高保真圖像,在文本渲染方面具有更高準確性,并擁有強大的世界知識
![]()
Gemini 3 Pro Image excels on Text to Image AI benchmarks
核心能力概覽 1. 高保真度與專業級控制
對于需要高精度的專業工具,Nano Banana Pro 提供了對物理效果(如光照、相機、焦點、色彩分級)和圖像構圖的精細控制,確保輸出達到專業品質。模型支持 2K 和 4K 分辨率,滿足專業制作的清晰度標準。此外,它支持強大的局部編輯功能,例如替換體積光為散景效果。
![]()
Prompt: Replace volumetric lighting with bokeh
在圖像合成方面,Nano Banana Pro 可以輕松地將產品圖片、標志和參考圖等多種元素組合成連貫的廣告。它能在一個合成圖像中保持多達 5 個人的面部一致性,或融合最多 6 張高保真照片及 14 個標準輸入。
通過增強的創意能力,您可以將草圖轉化為產品,或將藍圖變為逼真的 3D 結構,輕松地將期望的視覺風格應用于模型,確保品牌在每個觸點上保持無縫和一致。
![]()
Prompt: Combine these images into one appropriately arranged cinematic image in 16:9 format and change the dress on the mannequin to the dress in the image
2. 改進的文本渲染與本地化
與 2.5 Flash Image 相比,Nano Banana Pro 在文本渲染方面實現了顯著飛躍,能夠生成清晰、準確的嵌入文本,無論是短標語還是長段落。它擅長處理邏輯和語言,可生成包含多種紋理、字體和書法風格的文本,將抽象的圖像生成轉變為功能性資產,非常適合制作營銷材料、教育內容等。
![]()
Prompt: Make 8 sophisticated minimalistic logos, each is a fun food word, and make letters from realistic food to express the meaning of this word. composition: a rendering of all logos on a single solid white background
模型還打破了圖像生成與本地化邏輯之間的壁壘。憑借 Gemini 的多語言推理能力,它能理解圖像的語義上下文,輕松地對菜單、標志或文檔上的元素進行多語言文本生成或翻譯,同時保持原有的藝術風格和布局。
![]()
Prompt: Translate to French
3. 聯通世界知識與實時信息
基于 Gemini 3 Pro 的 Nano Banana Pro 連接了龐大的知識庫,能夠生成比以往模型更具事實性的內容。啟用后,通過 Google 搜索進行 grounding,可將模型與實時網絡內容連接,實現數據驅動的輸出。這對于需要精確表示的應用(如生物圖解、歷史地圖或實時天氣信息圖表)尤其有價值。你可以用它來創建關于任何主題的定制化信息圖表。
![]()
Prompt: Create an infographic about this plant focusing on interesting information.
![]()
Prompt: Create an infographic about this plant focusing on interesting information.
如何體驗 Nano Banana Pro
- 消費者和學生:
在 Gemini 應用中選擇“創建圖像”并使用“思考”模型,即可在全球范圍內使用。免費用戶將有有限的免費配額,之后會恢復為原版 Nano Banana 模型。Google AI Plus, Pro 和 Ultra 訂閱者將獲得更高的配額。
- 專業人士:
Google Ads 中的圖像生成功能已升級至 Nano Banana Pro。它也已開始向 Workspace 用戶的 Google Slides 和 Vids 中推出。
- 開發者和企業:
已開始在 Gemini API、Google AI Studio 和 Google Antigravity 中推出。企業用戶今日起可在 Vertex AI 中開始構建,并將很快登陸 Gemini Enterprise。
- 創意工作者:
已開始向 Flow(AI 電影制作工具)中的 Google AI Ultra 訂閱者推出。
關于 AI 生成圖像的識別
所有由 Google 工具生成的媒體都嵌入了不易察覺的 SynthID 數字水印。現在,用戶可以直接在 Gemini 應用中上傳圖片,并詢問它是否由 Google AI 生成。該功能目前支持圖片,并將很快擴展到音頻和視頻。
此外,免費和 Google AI Pro 等級用戶生成的圖片上會保留可見的 Gemini 星形水印。為滿足專業工作的視覺純凈需求,Google AI Ultra 訂閱者以及在 Google AI Studio 中生成的圖片將去除此可見水印。
7個使用技巧助你玩轉 Nano Banana Pro
為了獲得最佳效果和更精細的創意控制,以下是一些編寫專業提示詞的技巧:
- 生成帶有清晰文本的視覺效果:
利用其卓越的文本渲染能力創作海報、圖表等。
- 利用真實世界知識進行創作:
借助 Gemini 3 Pro 的知識和推理能力,獲得精確、豐富的圖像結果。
- 翻譯和本地化你的想法:
在圖像內部生成或翻譯文本,以適應不同市場。
- 使用工作室級別的控制進行編輯:
直接控制光照、相機角度、焦點、色彩等參數。
- 精確調整尺寸:
嘗試不同的寬高比,并生成高達 4K 的清晰圖像。
- 融合圖像并保持多角色一致性:
將多達 14 個輸入融合,并保持多個角色的一致性。
- 創建并保持品牌視覺風格:
將圖案、標志等無縫應用到 3D 對象上,保持自然的質感。
![]()
Change the look and feel of an image for a range of platforms by adapting the aspect ratio.
當前的局限性
目前仍有一些領域需要改進:
- 視覺和文本保真度:
渲染小文本、精細細節和精確拼寫可能不完美。
- 數據和事實準確性:
請務必核實如圖表等數據驅動型視覺內容的事實準確性。
- 翻譯和本地化:
多語言文本生成可能存在語法錯誤或文化細微差異。
- 復雜編輯和圖像融合:
高級編輯任務有時可能產生不自然的偽影。
- 角色特征:
角色一致性雖通常可靠,但跨編輯時可能會有變化。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.