網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

中國(guó)AI視頻大模型Vidu驚艷亮相，性能堪比Sora，引領(lǐng)AI視頻生成進(jìn)入新紀(jì)元

2024-05-01 11:02:12　來(lái)源: 商道童言

廣東舉報(bào)

分享至

Vidu，中國(guó)首款具備長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)的視頻大模型，驚艷亮相中關(guān)村論壇。由生數(shù)科技與清華大學(xué)聯(lián)合研發(fā)，Vidu可輕松生成16秒、1080P超清視頻，支持一鍵高清視頻生成，視覺(jué)效果媲美頂尖AI生成模型Sora。

Vidu展現(xiàn)了卓越的多鏡頭敘事能力、時(shí)間空間連貫性及對(duì)物理規(guī)律的遵循，并能創(chuàng)造出超越現(xiàn)實(shí)世界的超現(xiàn)實(shí)主義畫(huà)面。短短兩個(gè)月，Vidu突破傳統(tǒng)GIF局限，技術(shù)水平令人驚嘆。對(duì)此，數(shù)字經(jīng)濟(jì)應(yīng)用實(shí)踐專家駱仁童博士表示，Vidu的出現(xiàn)不僅是技術(shù)的突破，更是中國(guó)AI視頻大模型創(chuàng)新的一次革命。它將算法與藝術(shù)的邊界模糊化，讓我們看到了一個(gè)全新的可能性。

在視頻創(chuàng)作領(lǐng)域，鏡頭語(yǔ)言的運(yùn)用至關(guān)重要。傳統(tǒng)的AI視頻生成方法在鏡頭語(yǔ)言的應(yīng)用上往往顯得單調(diào)且缺乏創(chuàng)新，鏡頭運(yùn)動(dòng)通常僅限于簡(jiǎn)單的推、拉、移等操作。這主要是由于現(xiàn)有的視頻內(nèi)容生成技術(shù)存在局限性，這種技術(shù)手段使得長(zhǎng)時(shí)序的連貫預(yù)測(cè)變得異常困難，導(dǎo)致視頻中只能呈現(xiàn)微小的動(dòng)態(tài)變化。

相比之下，Vidu技術(shù)在鏡頭語(yǔ)言的應(yīng)用上取得了顯著突破。Vidu能夠一次性生成包含多個(gè)鏡頭的連貫片段，從近景到遠(yuǎn)景，整個(gè)過(guò)程流暢自然。更令人贊嘆的是，Vidu還能直接生成轉(zhuǎn)場(chǎng)、追焦、長(zhǎng)鏡頭等復(fù)雜效果，在提升視頻畫(huà)面整體敘事感方面表現(xiàn)出色。

除了鏡頭語(yǔ)言的豐富性外，Vidu還注重保持時(shí)間和空間的一致性。在視頻制作中，確保畫(huà)面的連貫和流暢性至關(guān)重要，這需要保持人物和場(chǎng)景的時(shí)空一致性。

值得一提的是，Vidu還具備模擬真實(shí)物理世界的能力。這一特性使得生成的視頻在細(xì)節(jié)表現(xiàn)上更加逼真動(dòng)人，能夠準(zhǔn)確地呈現(xiàn)出汽車輪胎揚(yáng)起的灰塵、樹(shù)林中的光影以及車行駛過(guò)程中的陰影變化等細(xì)節(jié)。

Sora和Vidu在走路鏡頭的模擬上可謂旗鼓相當(dāng)，兩者各有千秋。視頻中的角色行走自如，尤其是環(huán)境渲染方面，霓虹燈在濕漉漉的路面上的倒影，為畫(huà)面增色不少，使得逼真度大幅提升。Vidu不僅能夠生成人物，甚至能模擬出走路的熊，人物一致性讓人驚艷。

在處理復(fù)雜鏡頭和多角度切換方面，Vidu也毫不遜色，雖然畫(huà)面細(xì)節(jié)仍需打磨，但其流暢的鏡頭轉(zhuǎn)換宛如真人導(dǎo)演的巧妙構(gòu)思。

在畫(huà)面創(chuàng)意方面，Vidu同樣令人贊嘆，如畫(huà)室中的船隨浪起伏，木制玩具船在地毯上航行等場(chǎng)景，充分展示了其想象力。

在理解和呈現(xiàn)中國(guó)文化元素方面，Sora在國(guó)外唐人街舞龍環(huán)節(jié)表現(xiàn)出色，畫(huà)面細(xì)節(jié)豐富，文化氛圍濃郁。而Vidu生成的“龍”則更接近西方世界的龍形象。

生數(shù)科技，清華大學(xué)聯(lián)合孵化的人工智能創(chuàng)業(yè)公司，以驚人的速度推出了全新大模型——Vidu。僅用時(shí)兩個(gè)半月，便在業(yè)界掀起了一場(chǎng)技術(shù)風(fēng)暴。Vidu不僅代表著生數(shù)科技的最新成果，更是團(tuán)隊(duì)多年技術(shù)積累的結(jié)晶。

在朱軍副院長(zhǎng)的領(lǐng)導(dǎo)下，生數(shù)科技的核心團(tuán)隊(duì)匯聚了清華大學(xué)人工智能研究院的精英力量。他們致力于生成式人工智能和貝葉斯機(jī)器學(xué)習(xí)的研究，深耕行業(yè)二十余載。在擴(kuò)散模型領(lǐng)域，團(tuán)隊(duì)更是國(guó)內(nèi)先行者，取得了一系列令人矚目的成果。

在AI視頻生成技術(shù)的賽道上，生數(shù)科技的Vidu已然成為國(guó)內(nèi)最具競(jìng)爭(zhēng)力的大模型之一。雖然騰訊等科技巨頭也推出了類似產(chǎn)品，但Vidu憑借其卓越的性能和創(chuàng)新性，展現(xiàn)出了追趕甚至超越的潛力。

Vidu的誕生，標(biāo)志著生數(shù)科技在多模態(tài)大模型賽道上邁出了堅(jiān)實(shí)的一步。該模型基于U-ViT融合架構(gòu)，具備強(qiáng)大的長(zhǎng)視頻表示與處理能力。無(wú)論是文本到圖像、文本到視頻，還是圖像到視頻、視頻到視頻，Vidu都能輕松應(yīng)對(duì)，滿足各種生成需求。更值得一提的是，Vidu支持任意寬高比和分辨率的視頻生成，為用戶帶來(lái)前所未有的創(chuàng)作體驗(yàn)。

商道童言（Innovationcases）歡迎點(diǎn)贊和分享哦！~~

免費(fèi)電子書(shū)： | | | |

數(shù)字經(jīng)濟(jì)應(yīng)用實(shí)踐專家駱仁童主講課程

人工智能：

數(shù)字應(yīng)用：

數(shù)字中國(guó)：

數(shù)字化轉(zhuǎn)型：》

產(chǎn)業(yè)數(shù)字化：《》

宏觀與趨勢(shì)：

思維與技能：》

創(chuàng)新與創(chuàng)業(yè)：

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.