![]()
當(dāng)AI視頻不再只像過(guò)去那樣比拼高清像素,而是開始進(jìn)入“飆演技”階段,AI視頻才算正式邁入內(nèi)容生產(chǎn)的最高級(jí)形式——影視級(jí)敘事新階段。
9月25日,生數(shù)科技新一代圖生視頻大模型Vidu Q2正式全球上線,打破了原有AI生成的表情太假,動(dòng)作飄忽不定,運(yùn)動(dòng)幅度不夠大,無(wú)法指哪打哪的行業(yè)問(wèn)題,實(shí)現(xiàn)從“視頻生成”到“演技生成”,從“動(dòng)態(tài)流暢”到“情感表達(dá)”的革命性跨越,標(biāo)志著AI視頻生成技術(shù)正式從追求“形似”進(jìn)入追求“神似”的新紀(jì)元,將為內(nèi)容創(chuàng)作、影視產(chǎn)業(yè)、廣告營(yíng)銷等領(lǐng)域帶來(lái)全新升級(jí)。Vidu Q2圖生視頻功能不僅能勝任復(fù)雜表情變化的文戲,常見的多人打斗場(chǎng)景的武戲,而且還能完美呈現(xiàn)大片中的炫酷特效。
據(jù)了解,相比于今年上半年發(fā)布的Vidu Q1模型,此次發(fā)布的Vidu Q2圖生視頻功能在極致細(xì)微表情生成、推拉運(yùn)鏡、語(yǔ)義理解、生成速度與時(shí)長(zhǎng)選擇方面都有了大幅提升,主要有4大亮點(diǎn):
1、AI演技更生動(dòng)——不僅能生成視頻,更有生動(dòng)演技
2、鏡頭語(yǔ)言更豐富——運(yùn)鏡自然流暢,創(chuàng)作更顯張力
3、語(yǔ)義理解更準(zhǔn)確——?jiǎng)?chuàng)意直達(dá)畫面,想象即刻成真
4、時(shí)長(zhǎng)選擇更自由——時(shí)長(zhǎng)選擇靈活,滿足更多場(chǎng)景
此外,為了滿足用戶對(duì)于生成速度和生成質(zhì)量的不同需求,Vidu Q2圖生視頻分為閃電模式和電影大片模式。閃電模型下20秒就能生成 5秒 1080P視頻片段,滿足極速出片的需求;電影大片模式則主要滿足對(duì)于復(fù)雜表演、運(yùn)鏡等有更高要求的用戶。
目前,Vidu Q2圖生視頻功能已同步在其Web 端、APP端以及API上線。
1.AI演技更生動(dòng)
前不久的威尼斯電影節(jié),辛芷蕾以極其精湛的演技獲得了威尼斯國(guó)際電影節(jié)最佳女主角獎(jiǎng)。對(duì)于演技派來(lái)說(shuō),最高的褒獎(jiǎng)是演什么像什么,看了讓人產(chǎn)生共鳴和代入感。而這種代入感往往是通過(guò)演員的細(xì)微情緒變化實(shí)現(xiàn)的,在短短幾秒中突顯人物情緒張力,表達(dá)人物性格,推動(dòng)故事發(fā)展。
此前AI生成的短劇、長(zhǎng)片或多或少都存在人物表情僵硬、不自然,演技浮夸的情形,很難表現(xiàn)角色復(fù)雜細(xì)膩的情緒。而此次發(fā)布的Vidu Q2圖生視頻則突破“最后一道壁壘”,在細(xì)微表情生成中的技術(shù)被成功攻克,使數(shù)字角色能夠展現(xiàn)出生動(dòng)且充滿感染力的演技,賦予了AI角色以生命力。
我們可以讓AI演員和電影演員同臺(tái)PK演技,復(fù)刻《甜蜜蜜》張曼玉經(jīng)典片段,短短5秒時(shí)間呈現(xiàn)從微笑——委屈——難過(guò)三種復(fù)雜情緒。左邊是電影原片段,右邊是Vidu Q2圖生視頻生成的,人物演技非常自然,三種情緒之間的轉(zhuǎn)換很有呼吸感,即使努力壓抑,但是仍然流露出委屈和難過(guò),對(duì)比來(lái)看AI 生成的視頻與原視頻并無(wú)顯著差別。
真正的老戲骨每一個(gè)細(xì)胞都在演戲。這次Vidu Q2圖生視頻相比于Q1,在細(xì)膩的情緒表達(dá)上有了明顯提升,即使一個(gè)眼神也能述說(shuō)故事。
![]()
輸入圖片

Vidu Q2圖生視頻
上述例子中,特寫聚焦于一個(gè)金發(fā)碧眼老人的半邊臉,周圍的火焰將老人的臉照得通紅,他輕輕地眨了眨眼,眼淚中飽含淚水,一滴眼淚從右眼中緩緩流下。即使沒(méi)有任何言語(yǔ)和環(huán)境渲染,也讓人對(duì)戰(zhàn)爭(zhēng)的殘酷感同身受,AI人的演技足可以媲美真人。
在動(dòng)漫場(chǎng)景中,Vidu Q2的表現(xiàn)也相當(dāng)驚艷,表情惟妙惟肖更有代入感。在小狐貍的案例中,從瞪大眼睛的驚喜,到躲在石頭后面的驚訝和害怕,耳朵豎了起來(lái),再到稍微放松警惕后的無(wú)奈,表情的變化似乎在告訴觀眾好像有什么突如其來(lái)的大事發(fā)生。小狐貍靈動(dòng)的演技有迪士尼動(dòng)畫那味了。

在多個(gè)角色互動(dòng)場(chǎng)景中,Vidu Q2的表現(xiàn)也可圈可點(diǎn)。下面案例中,一男一女笑得合不攏嘴,之后女生捂著嘴笑,男生低頭笑著擦了擦眼睛,兩人再互相對(duì)視,真實(shí)得仿佛進(jìn)入了某個(gè)播客的錄制現(xiàn)場(chǎng)。
再拿Vidu Q2圖生視頻和其他AI視頻產(chǎn)品作對(duì)比。下面案例中,Vidu Q2生成的視頻每個(gè)表情都表現(xiàn)非常精準(zhǔn),從淡淡地微笑到嘴唇微張,眼神從微微向下看到望向遠(yuǎn)方。其他AI 視頻則完全沒(méi)有表現(xiàn)出細(xì)微表情的變化,視線僅表現(xiàn)了看向遠(yuǎn)方。
提示詞:視線微偏鏡頭下方,嘴角輕上揚(yáng)但不露齒,下巴略收。隨后瞳孔微放大,眼神越過(guò)鏡頭遠(yuǎn)點(diǎn),嘴唇濕潤(rùn)輕啟。
下面古裝戲場(chǎng)景中,其他家雖然也表現(xiàn)了表情凝重,但是演技比較單一,僅是完成了提示詞要求,最后抬手也沒(méi)有碰到額頭,給人不真實(shí)的感覺(jué)。對(duì)比來(lái)看,Vidu Q2的表情層次更加豐富,不僅嚴(yán)格遵循了提示詞,而且AI自動(dòng)設(shè)計(jì)了眼神和動(dòng)作的變化,表演上“更為走心”,首先男人邊喘著粗氣邊表情凝重地看向遠(yuǎn)方,緊接著視線收回,嘴巴微閉,抬起手擦了擦額頭,把凝重又疲憊的感覺(jué)演繹得非常到位。
提示詞:這是一個(gè)美麗的夕陽(yáng)場(chǎng)景,陽(yáng)光照著古戰(zhàn)場(chǎng),空氣中有著漂浮的灰塵,男人喘著粗氣進(jìn)行簡(jiǎn)單的休息,表情凝重,最后用手擦了一下額頭
從“AI木頭”到“AI演技派”,從浮夸演技到內(nèi)心戲,Vidu Q2 新一代AI演技的誕生,預(yù)測(cè)未來(lái)將在影視短劇、數(shù)字人、廣告營(yíng)銷等多個(gè)領(lǐng)域有廣泛應(yīng)用。
不僅如此,Vidu Q2還是個(gè)能文能武的全能型演技派,在武打戲上也是個(gè)“老戲骨”。
此前AI視頻普遍存在的問(wèn)題是,運(yùn)動(dòng)飄忽不定,就連現(xiàn)實(shí)生活中常見的跑步和打籃球場(chǎng)景都很難實(shí)現(xiàn),多人打戲更是需要依靠超高的提示詞技巧和多次生成,即使這樣打戲也是軟弱無(wú)力,像是自動(dòng)放了2倍慢速,毫無(wú)看點(diǎn)。
Vidu Q2圖生視頻在運(yùn)動(dòng)幅度上有明顯提升,即使是比較有挑戰(zhàn)的連續(xù)運(yùn)動(dòng)(比如打架、打拳等)場(chǎng)面也能精準(zhǔn)還原,實(shí)現(xiàn)真正的“拳拳到肉”。
下面雙人拳擊場(chǎng)景中,紅方迅速出拳,藍(lán)方快速躲避并迅速來(lái)了個(gè)左勾拳,紅方連續(xù)出拳后,紅藍(lán)方稍作停頓,雙方都發(fā)起反攻,藍(lán)方用雙手防備后開啟猛攻,連續(xù)三次攻打紅方腹部后退回原地,瞬間帶入拳擊比賽現(xiàn)場(chǎng),緊張氣氛拉滿。

如果把真實(shí)場(chǎng)景中的人物換成動(dòng)畫中的小林和悟空,效果也同樣驚人。悟空跳躍后放出大招沖擊波,之后與小林連續(xù)多次出拳過(guò)招,雙方打斗的同時(shí)也伴隨著炫酷的動(dòng)畫特效,生成的視頻兼具速度和力量感,讓人看得十分過(guò)癮。
Vidu Q2 甚至不需要復(fù)雜的提示詞也能呈現(xiàn)非常精彩的打戲。
如下面案例中,長(zhǎng)發(fā)女生手持光劍與周圍的多個(gè)小型機(jī)器人進(jìn)行激烈對(duì)戰(zhàn),女生奔跑,蹲下,站起來(lái)用光劍與迎面而來(lái)的小型機(jī)器人對(duì)抗,一躍而起后轉(zhuǎn)而被其他機(jī)器人打擊退回原地。如此復(fù)雜的打戲,提示詞卻相當(dāng)簡(jiǎn)單,“流暢的奔跑,爽快的打斗,合理安排不同鏡頭,自由運(yùn)鏡”,這也意味著Vidu Q2 對(duì)于動(dòng)作的理解和生成能力已經(jīng)進(jìn)化到Next level了。

更為值得一提的是,Vidu Q2圖生視頻即使在如此大幅度的運(yùn)動(dòng)下,仍然能保持角色較高的一致性,不會(huì)出現(xiàn)人物模糊或者變臉的情況。這對(duì)于影視、動(dòng)漫制作來(lái)說(shuō)至關(guān)重要,背后得益于Vidu在一致性上的投入。去年Vidu在全球首個(gè)推出了參考生視頻功能,將AI視頻的可控一致性拉到了新的高度,而此次推出的Vidu Q2則延續(xù)了其作為一致性開創(chuàng)者的優(yōu)勢(shì)。
2.鏡頭語(yǔ)言更豐富
當(dāng)其他家都在鼓吹好萊塢級(jí)別運(yùn)鏡時(shí),一向低調(diào)務(wù)實(shí)的Vidu 已經(jīng)直接讓新手小白做影視大片了。據(jù)了解,Vidu Q2 可輕松實(shí)現(xiàn)從宏觀全景到微觀特寫的快速切換,以營(yíng)造更具沖擊力的視覺(jué)效果。
為了讓AI視頻更能滿足廣告電商、影視動(dòng)漫等較為復(fù)雜的運(yùn)鏡需求,Vidu Q2圖生視頻在復(fù)雜運(yùn)鏡上做到了秒級(jí)精準(zhǔn)可控。
如下面的動(dòng)畫案例中,俠客揮舞著劍到變身閃電狼,中間有6個(gè)鏡頭切換,包括從特寫直接切到大全景,同時(shí)還需要配合俠客轉(zhuǎn)身同時(shí)騰空而起等動(dòng)作,即使在現(xiàn)實(shí)拍攝場(chǎng)景中挑戰(zhàn)也很大,但從實(shí)際生成效果來(lái)看, Q2 生成的畫面鏡頭和AI人物配合默契,整個(gè)動(dòng)作一氣呵成,非常絲滑。

在極速運(yùn)動(dòng)場(chǎng)景下的大幅度鏡頭切換非常考驗(yàn)空間理解能力和主體穩(wěn)定性,對(duì)于AI視頻來(lái)說(shuō)極具挑戰(zhàn),但是Vidu Q2的表現(xiàn)卻非常完美。從全景到賽車手眼神特寫再到?jīng)_線后的觀眾席特寫,Vidu Q2在整個(gè)過(guò)程中對(duì)于推拉搖移鏡頭的調(diào)度極為流暢,跟隨鏡頭下突顯了賽車手全力沖刺的緊張感和速度感,同時(shí)也反映了賽場(chǎng)周圍的熱鬧氣氛。
提示詞:顛簸鏡頭跟隨
鏡頭一:全景推進(jìn)跟隨FI賽車前景
鏡頭二:切換戴F1賽車頭盔的駕駛員緊張駕駛F1賽車眼神
鏡頭三:特寫F1賽車加速儀表
鏡頭四:F1賽車駕駛員第一人稱視角,賽車加速前進(jìn)
鏡頭五:F1賽車快速行駛?cè)耙暯牵瑳_向終點(diǎn)
鏡頭六,F(xiàn)1賽車沖線后,看臺(tái)上歡呼慶祝的觀眾特寫視角
3.語(yǔ)義理解更準(zhǔn)確
無(wú)論是AI演技的提升還是運(yùn)鏡的精準(zhǔn)拿捏,其實(shí)質(zhì)上是Vidu Q2 在動(dòng)作理解、表情理解和鏡頭語(yǔ)言理解上的飛升。據(jù)了解,由于Vidu Q2 在上下文推理、圖像及語(yǔ)義理解和物理仿真能力上的提升,使其在提示詞遵從上有了質(zhì)的飛躍,有創(chuàng)作者評(píng)價(jià)為言出法隨,指哪打哪。內(nèi)容創(chuàng)作者不再需要像過(guò)去一樣反復(fù)抽卡、反復(fù)調(diào)整提示詞和輸入畫面,大幅減少了視頻生成次數(shù),可直接將創(chuàng)意轉(zhuǎn)化為想要的視頻畫面。
在實(shí)際測(cè)試中發(fā)現(xiàn),Vidu Q2像是一位嚴(yán)格聽話同時(shí)又具備合理想象力的“AI 導(dǎo)演”。
下面的案例中,提示詞要求在8秒中精確切換4個(gè)不同的鏡頭,完成從貓貓?jiān)诮诸^彈古箏,到從古箏中飛出邪惡的骷髏戰(zhàn)士的復(fù)雜敘事,可以看到生成的視頻中不僅嚴(yán)格遵循了復(fù)雜的提示詞的所有要求,而且骷髏戰(zhàn)士從一團(tuán)白氣中突然出現(xiàn)的畫面非常驚艷,鏡頭切換也很流暢。
提示詞:
1-2s:坐著的貓輕輕撫動(dòng)古琴琴弦,鏡頭快速推近;
3-4s:近距離大特寫貓邪惡詭異的一笑,然后突然變得兇狠,鏡頭先推近拍攝同時(shí)向右環(huán)繞運(yùn)鏡拉遠(yuǎn)到側(cè)面;
5s:貓用力撥動(dòng)琴弦;
6-8s:琴弦釋放出白色亮光魔法靈氣,靈氣向左沖刺,然后靈氣幻化形成一個(gè)拿著刀的氣態(tài)邪惡骷髏戰(zhàn)士向左高速飛行,鏡頭高速跟蹤拍攝同時(shí)推近運(yùn)鏡

Vidu Q2 在語(yǔ)義理解上質(zhì)的突破,將過(guò)去因反復(fù)生成帶來(lái)的時(shí)間、人力、成本以及效果的不確定性,變?yōu)楦哔|(zhì)量穩(wěn)定輸出的確定性,預(yù)計(jì)影視短劇、廣告行業(yè)即將迎來(lái)AI視頻大規(guī)模商業(yè)化拐點(diǎn)。
4.時(shí)長(zhǎng)選擇更自由
除了性能提升之外,一向?qū)κ袌?chǎng)需求敏感的Vidu 也推出了新功能,賦予創(chuàng)作者更多自由發(fā)揮的空間。
此前業(yè)內(nèi)AI視頻產(chǎn)品更多以5秒時(shí)長(zhǎng)偏多,無(wú)法讓內(nèi)容創(chuàng)作者自由選擇,具有一定的局限性。Vidu Q2圖生視頻此次推出的2-8秒時(shí)長(zhǎng)隨心選,無(wú)論是1秒的特寫鏡頭,還是8秒的連續(xù)長(zhǎng)鏡頭或多個(gè)切換鏡頭,都可以任意選擇,滿足創(chuàng)作者不同場(chǎng)景的敘事需求。
![]()
此外,作為內(nèi)容生產(chǎn)力工具,這次Vidu Q2的發(fā)布仍然繼承了Vidu的優(yōu)良傳統(tǒng),做到了極高性價(jià)比、極致畫面質(zhì)量、極快生成速度的平衡。
在同等畫質(zhì)和時(shí)長(zhǎng)上,Vidu Q2在生成速度上做到了行業(yè)領(lǐng)先。Vidu Q2圖生視頻閃電模式下1080P 5秒視頻僅為20秒,實(shí)現(xiàn)了高質(zhì)量畫面的極速生成。
當(dāng)以Vidu Q2為代表的產(chǎn)品開始談?wù)揂I演技時(shí),我們知道下一個(gè)AI 時(shí)代的內(nèi)容新世界即將到來(lái)。
(封面圖及文中視頻、圖片來(lái)源:生數(shù)科技)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.