<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      滅霸帶著復(fù)聯(lián)放煙花!16秒,讓手搓 AI 視頻擁有大片即視感

      0
      分享至


      超越 Sora 2,Vidu Q3 位居全球第二、中國第一。

      作者丨王曉然

      編輯丨馬曉寧


      快過春節(jié)了,來整一個花活兒,想看滅霸和復(fù)仇者聯(lián)盟成員一起放煙花。

      這段視頻是在 Vidu Q3 中,僅用一段 Prompt 一次生成得來,不僅能夠聲畫同步,高清直出,而且還能轉(zhuǎn)換多個鏡頭,完成一個場景敘事。

      Sora 之后,AI 視頻生成在拼命卷時長。Sora 剛發(fā)布的時候,只能生成 5 秒左右的視頻,而 Vidu 最近發(fā)布了全球首個支持音視頻直出的模型 Vidu Q3 ,能實現(xiàn)16秒聲畫同出,并且敘事能力更強(qiáng),在鏡頭控制、文字渲染、多國語言上都有所突破。

      在國際權(quán)威AI基準(zhǔn)測試機(jī)構(gòu)Artificial Analysis最新公布的榜單中,生數(shù)科技的 Vidu Q3 憑借其在一致性、敘事性和音畫同步上的極致表現(xiàn),位居全球第二、中國第一。它不僅在評分上硬剛馬斯克的 xAI Grok,更是超越了 Runway Gen-4.5、Google Veo 3.1 和 OpenAI Sora 2,成為了領(lǐng)跑視頻生成下半場的關(guān)鍵變量。


      在生數(shù)科技的產(chǎn)品生態(tài)中,Vidu Q3 聚焦于漫劇、短劇、影視劇行業(yè),其生成能力到底水平如何,我們用幾個 Prompt 試試就知道。

      01
      16s,完成宮斗劇中的一次訣別

      過去,AI 視頻生成由于壓縮能力導(dǎo)致的一大深層痛點在于敘事斷裂,一次只能生成5-8 秒的時長,這使得生成內(nèi)容更像是毫無靈魂的“素材碎片”而非邏輯完整的“敘事內(nèi)容”。

      基于此,創(chuàng)作者為了拼湊出一段30秒的劇情,不得不頻繁開盲盒式地生成多個素材,再面對不同批次間光影失真、人物走形、邏輯錯亂等致命傷進(jìn)行后期“縫補(bǔ)”。

      而 Vidu 不僅將單次生成時長拓展至 16 秒,更關(guān)鍵的是通過底層架構(gòu)的革新,保證了這 16 秒內(nèi)角色、場景、光影、聲音、畫面與敘事邏輯的高度一致性。

      16 秒,在影視語言中已足以構(gòu)建一個完整的敘事單元,比如一個角色從疑惑到恍然大悟的表情轉(zhuǎn)變、一次從平靜到?jīng)_突的對話交鋒,或是一個關(guān)鍵道具被揭示并引發(fā)懸念的經(jīng)典橋段。

      為了驗證 Vidu Q3 「16s音視頻直出」的功力,我們重點考察它在復(fù)雜場景中能否把畫面情緒、角色對白、環(huán)境音效這幾股線自然地結(jié)合在一起。

      拿最經(jīng)典的宮斗場景為例,宮斗劇對古裝場景畫面、人物情緒、固定時間內(nèi)的敘事節(jié)奏要求都比較高,因此輸入的 prompt 了包含特寫、對白和具體環(huán)境音的提示詞:


      生成的結(jié)果還算到位,女子眼眶泛紅、聲音凄厲顫抖的質(zhì)問,與臉上滑落的淚珠完全同步,情緒是頂上去的。

      背景里,窗外的風(fēng)聲和遠(yuǎn)方的喪鐘聲不是簡單的鋪底,而是隨著她話音落下才隱隱浮現(xiàn),把悲涼又壓抑的氛圍烘托了出來。對面男子冰冷的回答,其聲音等語調(diào)和畫面里他漠然的表情嚴(yán)絲合縫。

      光有劇情還不夠,我們想知道它在更寫實、信息更嘈雜的環(huán)境里會如何表現(xiàn)。

      因此,第二個場景來到「雨夜的倫敦火車站」,這里要求的聲音元素多且密:清晰的英語對白、突出的火車汽笛、零碎的雨打頂棚聲、還有作為背景模糊處理的廣播。


      生成效果可以說是沒有瑕疵,西裝男焦急的腳步聲始終保持在最前面且十分清晰,而汽笛聲隨著火車駛進(jìn)站內(nèi)開始由遠(yuǎn)及近響起,淅淅瀝瀝的雨聲很輕沒有搶戲。并且其中London 站牌的名字居然都拼對了,這個也是 Vidu Q3 的重要能力,具體測評渲染能力的案例稍后展示。

      這一條視頻的細(xì)節(jié)可以說是令人驚喜的,可以見得,Vidu Q3 的聲音分層與空間感構(gòu)建能力、主次音源處理能力、模擬出的真實環(huán)境混響能力都很頂。

      對于節(jié)奏極快、音畫切換頻繁的現(xiàn)代音樂內(nèi)容,我們采用圖生視頻的方式測試紐約街頭的說唱。


      結(jié)果生成的視頻讓人很有代入感,rapper 激昂的說唱嘴型與鼓點、貝斯的節(jié)奏卡得非常準(zhǔn),每個重音都砸在了剪輯點上。鏡頭在手勢、表情和面部特寫間的快速切換,也完美踩在了音樂的律動上。

      02
      大師級運鏡,短劇中巴掌扇得更絲滑

      AI視頻生成中,最常遇到的一個穿幫點就是鏡頭語言。

      許多模型能生成一段幾秒的穩(wěn)定畫面,但一旦涉及鏡頭切換、視角轉(zhuǎn)換、景別變化,問題就會出現(xiàn)??赡茉谶\鏡過程中出現(xiàn)畫面主體扭曲、場景撕裂,更常見的是,多鏡頭之間缺乏敘事節(jié)奏和情緒連貫性,看起來像幾段獨立視頻的生硬拼接。

      可以說,「多鏡頭運鏡」是區(qū)分「會動的畫」和「有敘事感的視頻」的核心能力,它考驗的是模型對空間連續(xù)性、時間邏輯和視覺敘事語法的綜合理解。

      先測試看一個快節(jié)奏短劇中的鏡頭切換,選用短劇中常見的咖啡廳決裂戲碼:


      這個片段最驚艷的地方在于節(jié)奏感抓得很準(zhǔn)很舒服。特寫鏡頭里戒指的反光細(xì)節(jié)很真實,切到近景時,男士說話的口型跟臺詞對得很嚴(yán),女士站起來后的頭發(fā)的飄動很自然,扇巴掌的動作、聲音也足夠絲滑。

      接下來測試最考驗節(jié)奏感的動作場景。提示詞明確要求了“特寫→遠(yuǎn)景→中景”的快速切換。


      整個片段可以說是一氣呵成了。特寫鏡頭中驚恐的雙眼和汗珠極具張力;切至遠(yuǎn)景時,黑影在巷尾的閃動自然且位置連貫;切回中景時,主角朝向鏡頭的奔跑與之前的空間關(guān)系完全吻合。

      更出色的是,音效與鏡頭實現(xiàn)了精準(zhǔn)配合:特寫時喘息聲很近,切遠(yuǎn)景時聲音隨之拉遠(yuǎn)并突出腳步回聲,切回中景時喘息聲再次迫近。

      第二個場景側(cè)重視角轉(zhuǎn)換,第一人稱→全景→特寫,也伴隨氛圍變化的運鏡。


      從實際表現(xiàn)來看,切換到鏡頭二的全景時,人物與石門的巨大比例對比震撼,且視角轉(zhuǎn)換無比自然,沒有出現(xiàn)「跳幀」或場景重置;鏡頭三對石門圖騰的特寫,可以看作是全景鏡頭的自然推進(jìn)與聚焦。

      03
      渲染能力出色,漫劇輕松拿捏

      對于生成式 AI 視頻而言,能否穩(wěn)定、精準(zhǔn)地生成與畫面風(fēng)格融合的文字,往往是其能否勝任“專業(yè)級制作”的硬性門檻。

      過往很多模型在渲染文字時,容易出現(xiàn)筆畫錯亂、字符閃爍、風(fēng)格撕裂,或者與畫面光影嚴(yán)重不符的情況,這使得生成的內(nèi)容很難直接用于對細(xì)節(jié)有要求的商業(yè)短片、漫劇或劇情向內(nèi)容。

      Vidu Q3 具有較強(qiáng)的文字渲染能力,可精準(zhǔn)渲染中、英、日三種文字。先從一個相對靜態(tài)但要求極高的場景開始:產(chǎn)品展示,要求生成一架無人機(jī),機(jī)翼上需清晰呈現(xiàn)具有金屬蝕刻感的英文「Vidu Q3」。


      效果表現(xiàn)中,無人機(jī)的極簡設(shè)計感十足,而機(jī)翼側(cè)面的“Vidu Q3”字樣并非簡單“貼”上去,而是真正模擬出了金屬蝕刻的質(zhì)感和深度。隨著無人機(jī)緩緩旋轉(zhuǎn),文字表面的反光與外殼一同折射出細(xì)膩的夕陽余暉,光影變化自然統(tǒng)一。

      接下來,挑戰(zhàn)一下風(fēng)格化與動態(tài)渲染:一個熱血日漫風(fēng)格的場景,包含動態(tài)的日語喊話。


      這個案例綜合展示了 Vidu Q3 的綜合能力,一是對特定藝術(shù)風(fēng)格(日漫)的精準(zhǔn)把握,二是在極限動態(tài)場景中,保持畫面、音效超高同步性與表現(xiàn)力。

      最后測試一個充滿張力的古裝武俠場景,包含中文對白和激烈的動作戲。


      Vidu Q3 的這個畫面美感是超出預(yù)期。在激烈的武打動作中,能夠很好地保持畫面的穩(wěn)定和連貫,證明了其對中文對白字幕的專業(yè)化處理能力,并且在這一效果中,字幕成為了增強(qiáng)敘事沉浸感的一部分,而非后期生硬的添加。這種生成程度已經(jīng)可以應(yīng)用于短劇、漫劇制作等場景中了。

      04
      結(jié)語

      2024 年,AI 視頻生成行業(yè)嶄露頭角,經(jīng)過兩年時間的發(fā)展,整個行業(yè)則會向更成熟的方向發(fā)展。

      Vidu Q3 的意義不僅僅在于“16秒的音視頻直出”和“中國第一”,也許其更廣泛的意義在于,在降低視頻制作門檻的同時還增加了精準(zhǔn)的控制程度。

      「控制」二字似乎從未遠(yuǎn)離過影視制作行業(yè),從演員對神態(tài)、語言的控制,到導(dǎo)演對畫面、風(fēng)格的控制,再到到攝影師對鏡頭、畫面的控制,這是貫穿視頻制作始終的二字。

      而要實現(xiàn)內(nèi)容的完美呈現(xiàn)和控制,過去這需要包括導(dǎo)演、攝影師、后期特效等一個專業(yè)團(tuán)隊反復(fù)打磨才能精準(zhǔn)實現(xiàn)。

      現(xiàn)在來看,Vidu Q3 能讓專業(yè)的內(nèi)容創(chuàng)作者直接“調(diào)度”角色姿態(tài)、運鏡方式、場景細(xì)節(jié)乃至情緒氛圍,實現(xiàn)精細(xì)化的“導(dǎo)演級”控制,腦海中抽象的創(chuàng)意可以快速、精準(zhǔn)地轉(zhuǎn)化為高質(zhì)量的視頻片段。

      除此之外,影視行業(yè)中常常受限于實拍成本、演員檔期、特效預(yù)算或特殊場地。這些傳統(tǒng)的問題也能被有效彌合,Vidu Q3 極大地降低了高質(zhì)量視覺內(nèi)容的制作門檻,作者可以無成本地生成現(xiàn)實中難以拍攝或造價高昂的場景。

      不僅如此,Vidu Q3 讓普通的門外漢,也能制作出有審美、有品味的大片。回想當(dāng)時抖音的出現(xiàn),降低了人們進(jìn)行內(nèi)容表達(dá)的門檻,讓即使受教育程度不高的人,只需點一下「錄制」的圓形按鈕,就能自由地使用視頻這種去表達(dá)自己的觀點和內(nèi)容。

      而如今的Vidu Q3正在做著類似的事情。 Vidu Q3 不再是束之高閣的AI玩具,而是有能力真正深入到了漫劇、短劇、影視劇的制作核心。

      Vidu Q3體驗地址:https://www.vidu.cn

      Vidu API地址:https://platform.vidu.cn

      登陸 Vidu.cn 注冊,使用 AI 科技評論邀請碼:AIKJPL,即可獲得500積分。

      未經(jīng)「AI科技評論」授權(quán),嚴(yán)禁以任何方式在網(wǎng)頁、論壇、社區(qū)進(jìn)行轉(zhuǎn)載!

      公眾號轉(zhuǎn)載請先在「AI科技評論」后臺留言取得授權(quán),轉(zhuǎn)載時需標(biāo)注來源并插入本公眾號名片。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      撿漏了!全球純電SUV續(xù)航650km,從近20萬降到13萬多,放棄比亞迪

      撿漏了!全球純電SUV續(xù)航650km,從近20萬降到13萬多,放棄比亞迪

      隔壁說車?yán)贤?/span>
      2026-03-27 07:39:17
      7旬男子陪老伴住院,醫(yī)生看了他一眼發(fā)現(xiàn)其面部有猝死先兆,將其從死亡邊緣拉回

      7旬男子陪老伴住院,醫(yī)生看了他一眼發(fā)現(xiàn)其面部有猝死先兆,將其從死亡邊緣拉回

      觀威海
      2026-03-26 09:55:04
      以軍“大規(guī)模打擊”伊朗首都中心地帶設(shè)施

      以軍“大規(guī)模打擊”伊朗首都中心地帶設(shè)施

      新華社
      2026-03-27 09:38:03
      24 分鐘 23 分洛佩斯破局,遼籃外援終驗貨,硬仗方定最終真成色

      24 分鐘 23 分洛佩斯破局,遼籃外援終驗貨,硬仗方定最終真成色

      云隱南山
      2026-03-27 17:31:55
      94歲王心剛現(xiàn)狀:跟兒子赴美,晚年回北京養(yǎng)老,證明王鐵成沒說錯

      94歲王心剛現(xiàn)狀:跟兒子赴美,晚年回北京養(yǎng)老,證明王鐵成沒說錯

      查爾菲的筆記
      2026-03-23 18:04:49
      懷孕傳聞?wù)嫦啻蟀缀?,翁帆突傳“喜訊”,楊振寧終于可以放心了!

      懷孕傳聞?wù)嫦啻蟀缀螅谭粋鳌跋灿崱?,楊振寧終于可以放心了!

      丁丁鯉史紀(jì)
      2026-03-25 16:35:13
      廁所里丟一把食鹽,真的太實用了,一年省下好幾百,學(xué)會一定試試

      廁所里丟一把食鹽,真的太實用了,一年省下好幾百,學(xué)會一定試試

      妙招酷
      2026-01-18 00:08:23
      人這一輩子,一定要去一趟老家河南!

      人這一輩子,一定要去一趟老家河南!

      中國網(wǎng)
      2026-03-27 16:09:10
      越南著急了!想修高鐵,中國就是不出手,無奈只能去找新的冤大頭

      越南著急了!想修高鐵,中國就是不出手,無奈只能去找新的冤大頭

      墜入二次元的海洋
      2026-03-26 18:16:02
      蘋果用戶7年不換機(jī),電池崩了后ChatGPT給了個反常識解法

      蘋果用戶7年不換機(jī),電池崩了后ChatGPT給了個反常識解法

      硬核玩家2哈
      2026-03-26 14:27:05
      大家斷崖式衰老都是在多少歲? 網(wǎng)友的回答很扎心了,滿是無奈

      大家斷崖式衰老都是在多少歲? 網(wǎng)友的回答很扎心了,滿是無奈

      另子維愛讀史
      2025-12-26 16:31:13
      山東女子造出“天眼導(dǎo)彈”,突破中國導(dǎo)彈50年難關(guān),坐擁26項專利

      山東女子造出“天眼導(dǎo)彈”,突破中國導(dǎo)彈50年難關(guān),坐擁26項專利

      策略述
      2026-03-26 13:44:30
      中伊外交部長剛掛斷電話,不到24小時,中方宣布恢復(fù)海灣國家業(yè)務(wù)

      中伊外交部長剛掛斷電話,不到24小時,中方宣布恢復(fù)海灣國家業(yè)務(wù)

      興史興談
      2026-03-27 18:12:08
      玩火必自焚!以色列空襲伊朗化工,卻忘自家致命軟肋已被全球知曉

      玩火必自焚!以色列空襲伊朗化工,卻忘自家致命軟肋已被全球知曉

      創(chuàng)造精彩劇情
      2026-03-27 10:06:53
      油價降了!3月26日全國油價下調(diào)85元噸,4月7日油價將迎下跌!

      油價降了!3月26日全國油價下調(diào)85元噸,4月7日油價將迎下跌!

      沙雕小琳琳
      2026-03-26 15:31:42
      馮鞏在人民日報發(fā)文,揭開喜劇圈臟亂內(nèi)幕,點破岳云鵬尷尬處境

      馮鞏在人民日報發(fā)文,揭開喜劇圈臟亂內(nèi)幕,點破岳云鵬尷尬處境

      杰絲聊古今
      2026-03-27 18:15:22
      廣州警方:已刑拘73人

      廣州警方:已刑拘73人

      番禺臺
      2026-03-27 18:39:19
      國乒倫敦世乒賽已定9人名單!男隊需3選1,樊振東回歸概率趨近于0

      國乒倫敦世乒賽已定9人名單!男隊需3選1,樊振東回歸概率趨近于0

      八斗小先生
      2026-03-27 18:29:35
      癡呆癥的風(fēng)險降低35%!哈佛追蹤13萬人:每天2-3杯,讓大腦衰老踩剎車

      癡呆癥的風(fēng)險降低35%!哈佛追蹤13萬人:每天2-3杯,讓大腦衰老踩剎車

      王二哥老搞笑
      2026-03-26 13:56:44
      廣汽集團(tuán),你瘋了嗎?

      廣汽集團(tuán),你瘋了嗎?

      汽車K線
      2026-03-26 09:20:19
      2026-03-27 19:04:49
      AI科技評論 incentive-icons
      AI科技評論
      點評學(xué)術(shù),服務(wù)AI
      7151文章數(shù) 20742關(guān)注度
      往期回顧 全部

      科技要聞

      楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

      頭條要聞

      美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應(yīng)

      頭條要聞

      美方稱在美軍事基地裝爆炸物的男子逃往中國 中方回應(yīng)

      體育要聞

      邵佳一:足球就像一場馬拉松

      娛樂要聞

      張雪峰靈堂內(nèi)景曝光,四周擺滿了鮮花

      財經(jīng)要聞

      我在小吃培訓(xùn)機(jī)構(gòu)學(xué)習(xí)“科技與狠活”

      汽車要聞

      與眾08,金標(biāo)大眾不能輸?shù)囊粦?zhàn)

      態(tài)度原創(chuàng)

      手機(jī)
      教育
      時尚
      藝術(shù)
      旅游

      手機(jī)要聞

      消息稱某廠新機(jī)測試2K+185Hz顯示屏,預(yù)計為榮耀

      教育要聞

      重拳出擊,整治教育內(nèi)卷,中考徹底變天了

      從50塊到5w,她們過去一年最愛的包是這些

      藝術(shù)要聞

      張大千:形成于未畫之先,神留于既畫之后

      旅游要聞

      春滿京城 | 日壇玉蘭,紅墻一隅的春日清雅

      無障礙瀏覽 進(jìn)入關(guān)懷版