又來一個(gè)頂著Veo3.1和Sora2出山的壓力怪,
阿里剛上線的Wan2.6已經(jīng)可以做到單次生成的嚴(yán)格一致性和多鏡頭敘事了,
也可以很輕松的一次生成創(chuàng)意產(chǎn)品展示,
除了視頻質(zhì)感的提升,這把還更新了幾個(gè)新功能,可以指定??演出,支持多鏡頭智能調(diào)度,音畫同步生成。
來看看他們的宣傳片,從切換鏡頭到角色一致到開口唱歌,整體來說完成度極高,我當(dāng)然要來測(cè)試一把。
長話短說,
內(nèi)測(cè)了兩天的使用感受是,一致性比我想象中的強(qiáng),有種Sora2剛上線時(shí)候的既視感,提示語遵循能力比上一代強(qiáng)很多,能完成多鏡頭的生成。
老規(guī)矩啊,提示語和生成視頻也打包好了,公眾號(hào)回復(fù)“wan2.6”就行
先來看看角色扮演功能,上傳一段2-5秒的視頻,
![]()
我的建議是使用正臉無遮擋的視頻來制定角色,
![]()
當(dāng)然,這個(gè)角色不只局限于寫實(shí)的人物,卡通、寵物、道具等等都可以,

來到視頻生成頁面,目前一次最多可以生成10s的視頻,可以調(diào)用兩個(gè)角色進(jìn)行合拍。
比如我這里用我的角色和我家小貓做了一個(gè)平時(shí)的日常,選擇角色扮演模式,提示語直接通過@角色的方式去寫就可以。
![]()
每次鏡頭切到我自己的時(shí)候根本就忍不住笑,
我要做100條我和小貓的日常,有人想看嗎?
我還做了一個(gè)小貓說話了的版本,貓咪嘴部的動(dòng)作也很自然。而且這次碰到杯子的物理接觸也更加真實(shí)了。
目前萬相2.6對(duì)于單一角色的參考是非常穩(wěn)定的,能夠高清還原人物角色的細(xì)節(jié),比如做日常拍攝經(jīng)常會(huì)遇到的單人的不同景別切換,
現(xiàn)在一條提示語就能搞定,
鏡頭一,中景描繪 @卡爾 背對(duì)鏡頭, @卡爾 站在巴黎公寓的落地窗前俯瞰著夜晚的埃菲爾鐵塔;鏡頭二,轉(zhuǎn)為手部特寫, @卡爾 的手拿起一把吉他;鏡頭三,人物的表情特寫, @卡爾 坐在巴黎公寓的落地窗抱著吉他做出深情的表情
景別切換自然,人物的動(dòng)作和環(huán)境整體沒有bug,清晰度也夠高。人臉的一致性延續(xù)是很難做的,尤其要做到復(fù)刻自己,以前一次性生成真人風(fēng)格的鏡頭恐怖谷效應(yīng)特別嚴(yán)重,眼睛都是完全無神的。
但這次我覺得萬相2.6做出來的角色人臉和我是超級(jí)像,至少我有感覺是我自己的樣子,眼神是有感情在里面的。
PS,現(xiàn)在sora2限制真人的圖生視頻,wan2.6就沒這煩惱。
雙人對(duì)話的互動(dòng)場(chǎng)景穩(wěn)定的也很高,還能做出不同的音色,我就實(shí)現(xiàn)了和大圣一邊烤串一邊聊天,
@卡爾 和 @大圣 坐在燒烤店里一邊吃燒烤一邊聊天, @卡爾 說:“猴哥,最近怎么樣,工作還那么忙嗎?” @大圣 說:“別提了,天天跑展子,這周去了仨了,都說我cos的太真了。”
從角色扮演的功能中就已經(jīng)展示了萬相2.6在使用角色扮演的同時(shí)就能夠?qū)崿F(xiàn)多鏡頭切換和音畫同步的效果了,
除了真人效果的生成之外,我還測(cè)試了萬相2.6其他方面的質(zhì)量,比如,這個(gè)煎荷包蛋的效果,從黃油放進(jìn)鍋中,到打雞蛋下鍋,再到蛋慢慢煎熟,就最后一個(gè)鏡頭這個(gè)蛋清煎熟的過程,我夢(mèng)回veo3剛出做真實(shí)物理的場(chǎng)景。
晚上想吃夜宵了可以做這樣一條消磨時(shí)間,說不定就不想吃了(才怪)
除了寫實(shí)之外,萬相2.6做風(fēng)格化的視頻效果也很不錯(cuò),比如這個(gè)粘土風(fēng)格的小人效果,人物動(dòng)作,畫面風(fēng)格和音效都挺統(tǒng)一的,看不出什么違和感。
又或者我可以只告訴萬相2.6一句,
制作一個(gè)有趣的“Wan”炸雞廣告和表情包版本的廣告,帶有對(duì)話,其中有一個(gè)擬人小貓角色
它也能做到制作一個(gè)完整的15秒廣告視頻,分鏡和臺(tái)詞都自動(dòng)給我匹配好,小貓的動(dòng)作絲毫不崩,這效果我說實(shí)話不輸sora2,清晰度還更好。
我還可以指定角色出演指定產(chǎn)品廣告,
比如讓我給這瓶wan可樂拍個(gè)廣告,全程我和產(chǎn)品都保持著一致性,wan2.6自己也有很強(qiáng)的廣告思維,設(shè)計(jì)的臺(tái)詞和分鏡都符合廣告的特點(diǎn)。
如果我是品牌方想要保持我的短視頻帳號(hào)日更,還真可以用這個(gè)了,成本又低,劇情又有意思,每天roll幾個(gè)視頻發(fā)一發(fā)保持粉絲黏度,爽爽爽
最后的最后,
目前在百煉和萬相官網(wǎng)上都可以使用啦,地址我就貼這了。
bailian.console.aliyun.com/?tab=model#/model-market/all?providers=wan
tongyi.aliyun.com/wan/
不知道大家有沒有感受到,
現(xiàn)在AI視頻都朝著多鏡頭,多參考角色,音畫同步這三個(gè)方向集體補(bǔ)課。
我用下來會(huì)覺得這三條進(jìn)化方向,
本質(zhì)上都在解決同一個(gè)問題,
就是把視頻生成從能出片推進(jìn)到能交付。
因?yàn)樽鯝I做單個(gè)鏡頭的天花板已經(jīng)很高了,
而在真正的影視行業(yè)中,
真實(shí)內(nèi)容的最小單位是鏡頭組,不是鏡頭,
短視頻,廣告,短劇,MV,產(chǎn)品演示,
本質(zhì)上是剪輯語言的表達(dá),
遠(yuǎn)景交代空間、中景推進(jìn)動(dòng)作、特寫傳遞情緒,再用轉(zhuǎn)場(chǎng)把節(jié)奏打出來。
以前AI只會(huì)生成一個(gè)鏡頭的結(jié)果就是,
我們還是要回到剪輯軟件里把故事拼起來,
交付鏈路會(huì)斷在最后一步。
所以,大家可能會(huì)感覺到能做出好作品的,
還是之前懂影視知識(shí),會(huì)動(dòng)手剪輯的那一波人。
但現(xiàn)在,
多鏡頭+參考角色+音畫同步,
這三條線糅合在一起后,
生成模型更像是一個(gè)導(dǎo)演系統(tǒng)了,
這就是在無限縮小普通人和技術(shù)人之間的差距,
人人都能做1分鐘導(dǎo)演,
這牛已經(jīng)不需要吹了。
@ 作者 / 阿湯 & 卡爾
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點(diǎn)贊|在看|轉(zhuǎn)發(fā)|評(píng)論
如果想要第一時(shí)間收到推送,不妨給我個(gè)星標(biāo)
如果你有更有趣的玩法,歡迎在評(píng)論區(qū)和我聊聊
更多的內(nèi)容正在不斷填坑中……
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.