財(cái)聯(lián)社2月27日訊(編輯 史正丞)北京時(shí)間周五凌晨,美國(guó)科技公司谷歌宣布上架新一代圖像生成模型Nano Banana 2,使得高質(zhì)量圖像的生成更快、更便宜、更容易。
![]()
作為背景,谷歌于去年8月底首發(fā)Nano Banana(Gemini 2.5 Flash圖像模型)。由于其超級(jí)逼真的角色一致性,以及突出的自然語(yǔ)言理解和3D建模能力,引發(fā)全球網(wǎng)友狂熱追捧,一舉奠定谷歌在AI應(yīng)用領(lǐng)域的江湖地位。
去年11月,谷歌趁熱推出Nano Banana Pro(Gemini 3 Pro圖像模型),允許用戶(hù)生成更加精細(xì)、更高質(zhì)量的圖片,并提供“工作室級(jí)別的創(chuàng)作控制”。
根據(jù)谷歌的說(shuō)法,Nano Banana 2(即Gemini 3.1 Flash圖像模型)能夠兼具Nano Banana Pro的圖像生成質(zhì)量、推理能力和先進(jìn)世界知識(shí),以及Flash模型的“閃電生成速度”。
這意味著一系列曾經(jīng)專(zhuān)屬于“Pro”系列模型的功能下放到最基礎(chǔ)的版本。Nano Banana 2同樣支持最多5個(gè)角色的相貌一致及14個(gè)物體的忠實(shí)呈現(xiàn)。自然語(yǔ)言理解能力的提升,使得模型更精準(zhǔn)地捕捉復(fù)雜提示詞的細(xì)微差別,從而生成更貼近想法的圖像。
![]()
(Nano Banana 2生成示例,來(lái)源:谷歌博客)
新一代產(chǎn)品支持設(shè)置各種縱橫比和最高4K分辨率,并能提供更生動(dòng)的光照、更豐富的紋理和更清晰的細(xì)節(jié)。
![]()
(來(lái)源:谷歌博客)
Pro圖像模型的精準(zhǔn)文本呈現(xiàn)和多語(yǔ)種翻譯能力也得到繼承。此前該功能僅限于Gemini訂閱用戶(hù)使用,隨著Nano Banana 2上架,免費(fèi)版Gemini用戶(hù)也能使用該功能。
![]()
(來(lái)源:谷歌博客)
據(jù)“大模型競(jìng)技場(chǎng)”Arena.ai披露,Nano Banana 2上架后即刻登頂文生圖榜單的第一位。同時(shí)每張圖像的成本只有0.067美元,約為Nano Banana Pro的一半。
![]()
即日起,Nano Banana 2已經(jīng)成為谷歌Gemini、搜索和視頻編輯工具Flow中的默認(rèn)圖像模型。Nano Banana 2模型將取代Gemini應(yīng)用中Fast、Thinking和Pro生成功能里的Nano Banana Pro選項(xiàng)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.