這是蒼何的第 484 篇原創(chuàng)!
大家好,我是蒼何。
要說(shuō)近兩天最火的是什么,那就是元寶派了,我的幾十個(gè)群,從早到晚在發(fā)紅包鏈接,導(dǎo)致我的未讀消息直接飆到了上萬(wàn)條,好家伙。
昨天也分享了幾百個(gè)邀請(qǐng)碼,建了不少元寶派,我發(fā)現(xiàn)大家在派里,經(jīng)常會(huì)用元寶來(lái)生圖,動(dòng)不動(dòng)就是好幾個(gè)人同時(shí)@元寶,發(fā)現(xiàn)元寶生圖還挺快的。
![]()
而且效果也比之前好了不少,我估摸著是升級(jí)了混元模型的生圖能力了,不然扛不住元寶派友們的熱情,噼里啪啦兩下卡住,體驗(yàn)就不好了。
稍微查了下,果然不出所料,「騰訊悄悄發(fā)布并開(kāi)源了混元圖像 3.0-Instruct 模型」,現(xiàn)在元寶上生圖,用的就是這個(gè)最新的混元模型。
我看了官方說(shuō)明,混元圖像 3.0-Instruct 模型有以下的能力提升:
支持圖片編輯和多圖融合能力,指令遵循效果穩(wěn)定,生成的圖片一致性高、真實(shí)感強(qiáng)、情緒表現(xiàn)力佳,生成速度獲得明顯提升.
為了驗(yàn)證下真假,我也對(duì)該模型進(jìn)行了一輪拷打測(cè)試,下面開(kāi)整。
除了元寶里面,我發(fā)現(xiàn),在騰訊混元官網(wǎng)也已經(jīng)上線了這個(gè)新模型,我就先在官網(wǎng)開(kāi)始吧。
![]()
既然是圖生圖模型,熟門熟路,那就直接開(kāi)測(cè)吧。
提示詞:將這張張“白天拍攝的枯樹(shù)”轉(zhuǎn)變?yōu)椤耙雇戆l(fā)光的阿凡達(dá)風(fēng)格生命之樹(shù)”
![]()
很快就生成了一張效果不錯(cuò)的「生命之樹(shù)」:
![]()
光影的烘托和表現(xiàn)力上還是非常到位的。
接下來(lái)繼續(xù)給提示詞:將奔跑的人轉(zhuǎn)變?yōu)橛闪魉M成的半透明人影
![]()
提示詞:轉(zhuǎn)換為吉普力風(fēng)格
![]()
基本上生成最快十幾秒就生成了,生成速度上和表現(xiàn)力確實(shí)提升很大。
不像pro,生成最少也得等個(gè)幾十秒,等待的過(guò)程非常痛苦。
再來(lái)了一個(gè)小馬連環(huán)畫,同樣也是很快就生成出來(lái),一致性保持的不錯(cuò)。
提示詞:以這個(gè)小馬為主角,創(chuàng)作一個(gè)具有9張圖片的繪本故事,適合三歲小朋友閱讀,需要有簡(jiǎn)單的文字,方便家長(zhǎng)給小朋友講故事
![]()
![]()
前幾天去橫道河子被美哭了,拍了一些照片,里面有路人,讓它幫我P掉并美化一下
![]()
提示詞:幫我把這張圖片中的人P掉,并讓整個(gè)圖片看起來(lái)像有陽(yáng)光照射的感覺(jué)
![]()
去磚石海的時(shí)候想拍一個(gè)落日時(shí)分的圖片,趕時(shí)間沒(méi)拍到,于是讓它P一下:
提示詞:這張人躺在冰塊堆中的照片,幫我把這張圖轉(zhuǎn)化為遠(yuǎn)景俯拍,在人物周圍散落著成片的冰塊,營(yíng)造人躺在冰塊群的感覺(jué),黃昏中藍(lán)調(diào)的磚石海的感覺(jué)
![]()
瞬間就有那種感覺(jué)了好吧。
![]()
接下來(lái)又測(cè)試了一下風(fēng)格變換能力
給它一個(gè)美女,讓它幫忙變換風(fēng)格
提示詞:請(qǐng)給這個(gè)女生畫上四種不同的妝容,并匹配相應(yīng)的穿搭風(fēng)格和環(huán)境
![]()
人物一致性保持的不錯(cuò)。
![]()
再讓它針對(duì)一些服裝單品,給出三套穿搭,給老婆看了,直呼牛掰,再也不用發(fā)愁怎么搭配單品了。
提示詞:這件白色的毛衣,毛衣拉鏈拉下來(lái)一些可變成翻領(lǐng)毛衣,請(qǐng)幫我想三個(gè)穿搭方案,女生
![]()
![]()
再來(lái)個(gè)萌萌噠的小企鵝吧
提示詞:以這個(gè)萌萌的企鵝為原型,設(shè)計(jì)三個(gè)Q版的企鵝圖像,分別為毛線風(fēng)格、像素風(fēng)格、吉普力風(fēng)格
![]()
![]()
我喜歡鳴人,想試試圖片變手辦的感覺(jué)
提示詞:把鳴人的這張圖做成3D手辦
![]()
![]()
再來(lái)試試人物畫像變真人
提示詞:請(qǐng)把XXX的畫像變成立體的真人
![]()
![]()
![]()
![]()
讓他們來(lái)個(gè)合照吧
提示詞:讓圖1和圖2的人物自拍,風(fēng)格換成真人寫實(shí)風(fēng)格,背景換成在故宮大殿里面拍攝,有自拍的模糊感
![]()
![]()
![]()
再來(lái)試試多圖融合的能力
提示詞:給圖一小貓穿上圖二,圖三喜慶的衣服和圍巾,背景是中式的溫馨家庭客廳
![]()
![]()
![]()
![]()
一通測(cè)下來(lái),還挺興奮的。
首先,在文字理解能力上面,有了很大的進(jìn)步,我的提示詞很口語(yǔ)化也不專業(yè),基本上一次就能成功;
第二,在生成速度上,非常快速,簡(jiǎn)單一點(diǎn)的,十幾秒甚至幾秒鐘就能生成出來(lái),復(fù)雜一點(diǎn)的不到一分鐘也能出來(lái);
第三,圖片可用性很高,不用重復(fù)抽卡;
最重要的是目前還免費(fèi)免費(fèi),這就非常爽了。
騰訊這一波,也是攢足了勁兒,發(fā)了 10 個(gè)億的紅包,讓更多人進(jìn)來(lái)元寶,生圖是最重要的場(chǎng)景。
對(duì)于 C 端用戶來(lái)說(shuō),最不能接受的就是等待,騰訊必須在生圖速度上下苦功夫,不然,辛辛苦苦拉的用戶,卻因?yàn)樯鷪D慢,效果差,而不斷吐槽,就得不償失了。
至少目前,我在我的十幾個(gè)派群里,還沒(méi)看到有人吐槽生圖慢或者不好的。
大家也在探索更多的玩法了。
最后總結(jié)下,混元圖像 3.0-Instruct 模型在指令遵循,圖像一致性,生成速度上表現(xiàn)不錯(cuò)。
好了,感謝你喜歡我的文章,我們下一期見(jiàn)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.