2025年12月26日,極新主辦的【想象·2025極新AIGC峰會(huì)】在上海浦東浦軟大廈成功召開(kāi)。生數(shù)科技商業(yè)化總監(jiān)陳鶴天先生在會(huì)上做了題為《視頻生成模型沖破內(nèi)容產(chǎn)能焦慮》的演講。重點(diǎn)分享了漫劇賽道的發(fā)展現(xiàn)狀、AI視頻生成技術(shù)的創(chuàng)新應(yīng)用以及生數(shù)科技在賦能產(chǎn)業(yè)方面的助力作用。
![]()
生數(shù)科技商業(yè)化總監(jiān)陳鶴天
陳鶴天重點(diǎn)提到以下幾點(diǎn):
“多參模型加上主體庫(kù),可以快速的完成整個(gè)的商業(yè)的閉環(huán)。”
“Vidu Q2模型非常適合漫劇生產(chǎn)”
“通過(guò)參考生視頻,可以提效大概40%左右。”
以下內(nèi)容為陳鶴天演講原文,經(jīng)極新整理:
非常開(kāi)心在峰會(huì)上與大家交流。今天想和大家分享AI領(lǐng)域的熱門(mén)應(yīng)用賽道——漫劇產(chǎn)業(yè)。我們經(jīng)過(guò)慎重斟酌確定這一方向,核心在于通過(guò)多參模型結(jié)合主體庫(kù),能夠快速完成商業(yè)閉環(huán)。接下來(lái),為大家拆解為何Vidu能打造漫劇穩(wěn)定輸出的數(shù)字生產(chǎn)線。01多模態(tài)儼然成為必選項(xiàng)
“多參模型加上主體庫(kù),可以快速的完成整個(gè)的商業(yè)的閉環(huán)”
首先看2025年漫劇賽道,市場(chǎng)規(guī)模突破200億元,超過(guò)10萬(wàn)家企業(yè)入局,同時(shí)頭部玩家大概可以月產(chǎn)100部作品,行業(yè)月產(chǎn)量以千計(jì)。同時(shí)AI加漫劇領(lǐng)域面臨幾個(gè)問(wèn)題:產(chǎn)能依賴AI能力效率和人效比;質(zhì)量需要?jiǎng)”九c技術(shù)結(jié)合;人才儲(chǔ)備不足,如何快速擴(kuò)充百人級(jí)團(tuán)隊(duì)是關(guān)鍵。
為什么是用Vidu來(lái)做?首先簡(jiǎn)單介紹一下我們公司的情況,生數(shù)科技其實(shí)是23年成立的,雖然只成立了兩年多的時(shí)間,但是我們其實(shí)所有的底層大模型都是全部自研的,在自研的底層的模型的不斷的迭代的過(guò)程當(dāng)中,就會(huì)出現(xiàn)不同的一些適配和適用。
其次在音視頻直出方面領(lǐng)先,例如Vidu Q2模型。公司團(tuán)隊(duì)以清華系為核心,包括清華大學(xué)人工智能研究院副院長(zhǎng)朱軍教授,成員來(lái)自清北、帝國(guó)理工等,80%為產(chǎn)研人員。
生數(shù)科技的優(yōu)勢(shì)點(diǎn)核心有兩個(gè):首先是全球首個(gè)提出并開(kāi)源U-VIP架構(gòu),為AI音視頻能力底層架構(gòu),被多家企業(yè)采用;其次是與清華大學(xué)聯(lián)合發(fā)布的開(kāi)源框架,將視頻生成加速200倍。例如,生成高清5秒視頻僅需1.9秒,視頻生成進(jìn)入實(shí)時(shí)過(guò)程,算力需求降低。
02質(zhì)量趨向于劇本加技術(shù)
“Vidu Q2模型非常適合漫劇生產(chǎn)”
首先多模態(tài)大模型AI發(fā)展跨越兩層技術(shù)基點(diǎn):商業(yè)化和音視頻直出。不同模型匯聚到焦點(diǎn),語(yǔ)言模型、生圖模型和生視頻模型交織,多模態(tài)成為必選項(xiàng)。生數(shù)科技近期發(fā)布生圖模型,與主流技術(shù)持平,多模態(tài)朝聚合方向推動(dòng)。
從互動(dòng)娛樂(lè)到專業(yè)級(jí)制作,模型應(yīng)用涵蓋多個(gè)領(lǐng)域。最初圍繞互動(dòng)娛樂(lè),如特效變身,逐步到商單廣告和影視級(jí)創(chuàng)作。漫劇爆發(fā)因?yàn)槟P瓦_(dá)到制作量級(jí)。生數(shù)科技服務(wù)全球3000多家開(kāi)發(fā)者和1萬(wàn)多家B端客戶,多個(gè)爆款漫劇使用維度模型。
Vidu Q2模型適合漫劇生產(chǎn),因其表演情緒和表情變化突出。AI生成的人物表情、頭發(fā)微動(dòng)和眼神神態(tài)接近真人,人味增強(qiáng)。生數(shù)科技與Sora、可靈處于行業(yè)第一梯隊(duì),首創(chuàng)“參考生活性”技術(shù),通過(guò)人物、道具和場(chǎng)景聯(lián)動(dòng),讓視頻動(dòng)起來(lái)。
03產(chǎn)能依賴于AI能力效率
“通過(guò)參考生視頻,可以提效40%左右”
首先漫劇方案通過(guò)參考生視頻簡(jiǎn)化流程,無(wú)需分鏡圖,直接進(jìn)行資產(chǎn)迭代。通過(guò)圖生和參考性應(yīng)用,效率提升約40%。例如,輸入主體如人物、背景和道具,視頻即可動(dòng)起來(lái),真人感強(qiáng)。目前我們Vidu Q2是支持生成2~8秒時(shí)長(zhǎng)的視頻,同時(shí)支持無(wú)限擴(kuò)寫(xiě),無(wú)限擴(kuò)寫(xiě)的意思就是可以無(wú)限延長(zhǎng)。視頻可以持續(xù)性的往前去推動(dòng),主體里面最核心的能力其實(shí)是它的資產(chǎn)可以復(fù)用,同時(shí)能夠更好的保持長(zhǎng)期的一致性。
參考生視頻支持多個(gè)參考,如主體人物、環(huán)境、道具、色調(diào)、線稿和姿態(tài)。例如,變換衣服材質(zhì)、色調(diào)調(diào)整為夕陽(yáng)感,或轉(zhuǎn)換宮崎駿風(fēng)格,都容易實(shí)現(xiàn)。情緒變化和復(fù)雜招式如降龍十八掌也可固定時(shí)間關(guān)系。
AI生成內(nèi)容已達(dá)到高水平,例如預(yù)審短片由AI生成。所以說(shuō)Vidu的AI讓想象發(fā)生是一件很重要的事情。我們也看到,未來(lái)AI肯定會(huì)從漫劇走向真人短劇,整個(gè)市場(chǎng)規(guī)模其實(shí)是一個(gè)更高的千億級(jí)市場(chǎng),所以說(shuō)機(jī)會(huì)其實(shí)是無(wú)限的。
更多干貨分享敬請(qǐng)注我們的公眾號(hào)與視頻號(hào)~超多精彩對(duì)話內(nèi)容等待您的解鎖!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.