Vidu,中國(guó)首款具備長(zhǎng)時(shí)長(zhǎng)、高一致性、高動(dòng)態(tài)的視頻大模型,驚艷亮相中關(guān)村論壇。由生數(shù)科技與清華大學(xué)聯(lián)合研發(fā),Vidu可輕松生成16秒、1080P超清視頻,支持一鍵高清視頻生成,視覺(jué)效果媲美頂尖AI生成模型Sora。
Vidu展現(xiàn)了卓越的多鏡頭敘事能力、時(shí)間空間連貫性及對(duì)物理規(guī)律的遵循,并能創(chuàng)造出超越現(xiàn)實(shí)世界的超現(xiàn)實(shí)主義畫(huà)面。短短兩個(gè)月,Vidu突破傳統(tǒng)GIF局限,技術(shù)水平令人驚嘆。對(duì)此,數(shù)字經(jīng)濟(jì)應(yīng)用實(shí)踐專家駱仁童博士表示,Vidu的出現(xiàn)不僅是技術(shù)的突破,更是中國(guó)AI視頻大模型創(chuàng)新的一次革命。它將算法與藝術(shù)的邊界模糊化,讓我們看到了一個(gè)全新的可能性。
在視頻創(chuàng)作領(lǐng)域,鏡頭語(yǔ)言的運(yùn)用至關(guān)重要。傳統(tǒng)的AI視頻生成方法在鏡頭語(yǔ)言的應(yīng)用上往往顯得單調(diào)且缺乏創(chuàng)新,鏡頭運(yùn)動(dòng)通常僅限于簡(jiǎn)單的推、拉、移等操作。這主要是由于現(xiàn)有的視頻內(nèi)容生成技術(shù)存在局限性,這種技術(shù)手段使得長(zhǎng)時(shí)序的連貫預(yù)測(cè)變得異常困難,導(dǎo)致視頻中只能呈現(xiàn)微小的動(dòng)態(tài)變化。

相比之下,Vidu技術(shù)在鏡頭語(yǔ)言的應(yīng)用上取得了顯著突破。Vidu能夠一次性生成包含多個(gè)鏡頭的連貫片段,從近景到遠(yuǎn)景,整個(gè)過(guò)程流暢自然。更令人贊嘆的是,Vidu還能直接生成轉(zhuǎn)場(chǎng)、追焦、長(zhǎng)鏡頭等復(fù)雜效果,在提升視頻畫(huà)面整體敘事感方面表現(xiàn)出色。
除了鏡頭語(yǔ)言的豐富性外,Vidu還注重保持時(shí)間和空間的一致性。在視頻制作中,確保畫(huà)面的連貫和流暢性至關(guān)重要,這需要保持人物和場(chǎng)景的時(shí)空一致性。
值得一提的是,Vidu還具備模擬真實(shí)物理世界的能力。這一特性使得生成的視頻在細(xì)節(jié)表現(xiàn)上更加逼真動(dòng)人,能夠準(zhǔn)確地呈現(xiàn)出汽車輪胎揚(yáng)起的灰塵、樹(shù)林中的光影以及車行駛過(guò)程中的陰影變化等細(xì)節(jié)。

Sora和Vidu在走路鏡頭的模擬上可謂旗鼓相當(dāng),兩者各有千秋。視頻中的角色行走自如,尤其是環(huán)境渲染方面,霓虹燈在濕漉漉的路面上的倒影,為畫(huà)面增色不少,使得逼真度大幅提升。Vidu不僅能夠生成人物,甚至能模擬出走路的熊,人物一致性讓人驚艷。

在處理復(fù)雜鏡頭和多角度切換方面,Vidu也毫不遜色,雖然畫(huà)面細(xì)節(jié)仍需打磨,但其流暢的鏡頭轉(zhuǎn)換宛如真人導(dǎo)演的巧妙構(gòu)思。

在畫(huà)面創(chuàng)意方面,Vidu同樣令人贊嘆,如畫(huà)室中的船隨浪起伏,木制玩具船在地毯上航行等場(chǎng)景,充分展示了其想象力。

在理解和呈現(xiàn)中國(guó)文化元素方面,Sora在國(guó)外唐人街舞龍環(huán)節(jié)表現(xiàn)出色,畫(huà)面細(xì)節(jié)豐富,文化氛圍濃郁。而Vidu生成的“龍”則更接近西方世界的龍形象。

生數(shù)科技,清華大學(xué)聯(lián)合孵化的人工智能創(chuàng)業(yè)公司,以驚人的速度推出了全新大模型——Vidu。僅用時(shí)兩個(gè)半月,便在業(yè)界掀起了一場(chǎng)技術(shù)風(fēng)暴。Vidu不僅代表著生數(shù)科技的最新成果,更是團(tuán)隊(duì)多年技術(shù)積累的結(jié)晶。
在朱軍副院長(zhǎng)的領(lǐng)導(dǎo)下,生數(shù)科技的核心團(tuán)隊(duì)匯聚了清華大學(xué)人工智能研究院的精英力量。他們致力于生成式人工智能和貝葉斯機(jī)器學(xué)習(xí)的研究,深耕行業(yè)二十余載。在擴(kuò)散模型領(lǐng)域,團(tuán)隊(duì)更是國(guó)內(nèi)先行者,取得了一系列令人矚目的成果。
在AI視頻生成技術(shù)的賽道上,生數(shù)科技的Vidu已然成為國(guó)內(nèi)最具競(jìng)爭(zhēng)力的大模型之一。雖然騰訊等科技巨頭也推出了類似產(chǎn)品,但Vidu憑借其卓越的性能和創(chuàng)新性,展現(xiàn)出了追趕甚至超越的潛力。
Vidu的誕生,標(biāo)志著生數(shù)科技在多模態(tài)大模型賽道上邁出了堅(jiān)實(shí)的一步。該模型基于U-ViT融合架構(gòu),具備強(qiáng)大的長(zhǎng)視頻表示與處理能力。無(wú)論是文本到圖像、文本到視頻,還是圖像到視頻、視頻到視頻,Vidu都能輕松應(yīng)對(duì),滿足各種生成需求。更值得一提的是,Vidu支持任意寬高比和分辨率的視頻生成,為用戶帶來(lái)前所未有的創(chuàng)作體驗(yàn)。
商道童言(Innovationcases)歡迎點(diǎn)贊和分享哦!~~
免費(fèi)電子書(shū): | | | |
數(shù)字經(jīng)濟(jì)應(yīng)用實(shí)踐專家 駱仁童主講課程
人工智能:
數(shù)字應(yīng)用:
數(shù)字中國(guó):
數(shù)字化轉(zhuǎn)型:》
產(chǎn)業(yè)數(shù)字化:《》
宏觀與趨勢(shì):
思維與技能:》
創(chuàng)新與創(chuàng)業(yè):
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.