新腕兒 報(bào)道
2026年春季,AI短劇行業(yè)正處于一個(gè)微妙的臨界點(diǎn)。
一邊是產(chǎn)能的井噴。根據(jù)行業(yè)測(cè)算,2025年AI漫劇市場(chǎng)規(guī)模預(yù)計(jì)達(dá)到168億元,同比增長(zhǎng)超過(guò)80%,月度內(nèi)容供給量從2024年的約0.3萬(wàn)部激增至約1.8萬(wàn)部。AI技術(shù)在漫劇生產(chǎn)環(huán)節(jié)的滲透率已提升至60%到85%,制作成本下降了50%到75%,生產(chǎn)周期縮短至傳統(tǒng)模式的三分之一。
另一邊則是技術(shù)的陣痛。角色變臉、動(dòng)作稀碎、場(chǎng)景失控,這些底層硬傷讓無(wú)數(shù)號(hào)稱(chēng)全AI制作的作品止步于短視頻平臺(tái)的濾鏡里,難以真正進(jìn)入主流影視的工業(yè)化殿堂。
通用視頻模型難以滿(mǎn)足漫劇對(duì)角色一致性、動(dòng)態(tài)效果、鏡頭語(yǔ)言的精細(xì)化需求,行業(yè)缺乏統(tǒng)一的生產(chǎn)標(biāo)準(zhǔn)與SOP體系。產(chǎn)能狂飆之下,從業(yè)者心里清楚:大部分內(nèi)容依然停留在“能看”而非“好看”的水平。
就在這個(gè)節(jié)點(diǎn),剛拿到阿里巴巴戰(zhàn)略融資的生數(shù)科技,聯(lián)合AI新榜發(fā)布了《AI漫劇視頻模型行業(yè)白皮書(shū)V1.0》,并同步亮出了迭代后的核心產(chǎn)品Vidu Q3。在最新的SuperCLUE全球測(cè)評(píng)中,Vidu Q3以斷層領(lǐng)先的成績(jī)強(qiáng)勢(shì)登頂。
![]()
這不僅僅是一款工具的升級(jí),更是一場(chǎng)關(guān)于AI視頻工業(yè)化生產(chǎn)范式的權(quán)力交接。
資本與標(biāo)準(zhǔn)的雙重加持:AI短劇的底座爭(zhēng)奪戰(zhàn)
在AI圈,融資往往是技術(shù)風(fēng)向標(biāo)。
2026年4月,生數(shù)科技宣布完成近20億元人民幣B輪融資,由阿里云領(lǐng)投,投后估值超過(guò)120億元,正式躋身獨(dú)角獸行列。這是繼2月超6億元A+輪融資之后,公司兩個(gè)月內(nèi)拿到的第二筆大額融資,累計(jì)公開(kāi)融資總額已超過(guò)25億元。據(jù)《科創(chuàng)板日?qǐng)?bào)》多方求證,生數(shù)科技最快于2026年上半年啟動(dòng)港股IPO,有望成為全球首個(gè)專(zhuān)注于AI視頻生成與世界模型的獨(dú)立上市主體。
阿里巴巴的戰(zhàn)略入局,不僅為生數(shù)科技提供了雄厚的彈藥,更向行業(yè)傳遞了一個(gè)明確信號(hào):AI視頻的競(jìng)爭(zhēng)已經(jīng)從單純比拼參數(shù)轉(zhuǎn)向了垂直場(chǎng)景的生產(chǎn)力落地。阿里云領(lǐng)投B輪后,Vidu全系列模型也正式登陸阿里云百煉模型廣場(chǎng),支持文生視頻、圖生視頻、參考生視頻等全功能API調(diào)用,并發(fā)處理能力提升數(shù)倍。這種“自研+投資”的雙軌戰(zhàn)略,背后是阿里對(duì)AI視頻賽道商業(yè)化爆發(fā)的前瞻判斷。
與此同時(shí),生數(shù)科技聯(lián)合AI新榜發(fā)布的《AI漫劇視頻模型行業(yè)白皮書(shū)V1.0》,更像是一份行業(yè)的診斷書(shū)與手術(shù)方案。
這份白皮書(shū)的首次意義在于,它是業(yè)內(nèi)第一份系統(tǒng)性地從“技術(shù)+流程+組織”三維度定義AI漫劇工業(yè)化生產(chǎn)標(biāo)準(zhǔn)的文件。白皮書(shū)精準(zhǔn)指出了當(dāng)前行業(yè)的三大核心瓶頸:模型缺乏垂直場(chǎng)景優(yōu)化、場(chǎng)景化配套能力不足、缺乏統(tǒng)一生產(chǎn)標(biāo)準(zhǔn)與SOP體系。這解釋了為什么很多團(tuán)隊(duì)在用通用模型做短劇時(shí),總有一種拿著手術(shù)刀劈柴的違和感——工具不對(duì),流程不對(duì),組織架構(gòu)更不對(duì)。
白皮書(shū)首次系統(tǒng)提出了基于Vidu多模態(tài)模型的六層全棧技術(shù)架構(gòu),從模型能力層、增強(qiáng)組件層、場(chǎng)景方案層、服務(wù)層、平臺(tái)層到用戶(hù)層,實(shí)現(xiàn)了技術(shù)能力與行業(yè)需求的深度適配。這套架構(gòu)的核心價(jià)值在于,它不僅提供了底層模型能力,更通過(guò)增強(qiáng)組件和場(chǎng)景方案,將通用模型能力轉(zhuǎn)化為專(zhuān)屬于漫劇場(chǎng)景的生產(chǎn)力工具,真正打通了技術(shù)到創(chuàng)作的最后一公里。
![]()
生數(shù)科技副總裁王川在白皮書(shū)中表示,AI漫劇的工業(yè)化不能僅靠單一模型的迭代,更需要一套從底層能力到上層應(yīng)用、從技術(shù)到組織架構(gòu)的完整解決方案。這正是白皮書(shū)發(fā)布的初衷,為行業(yè)提供可復(fù)用的技術(shù)底座加行業(yè)方案,加速AI漫劇從分散式生產(chǎn)向精品工業(yè)化模式轉(zhuǎn)型。
這意味著,生數(shù)科技不再只是賣(mài)模型種子的人,而是開(kāi)始提供一整套自動(dòng)化農(nóng)場(chǎng)的搭建方案。這種角色轉(zhuǎn)變,從底層技術(shù)能力提供者向行業(yè)標(biāo)準(zhǔn)共建者與生態(tài)賦能者的全面升級(jí),正是阿里等大廠(chǎng)看重其在電商、短劇等垂直賽道爆發(fā)潛力的核心邏輯。
定義參考生范式:Vidu為什么能解決實(shí)質(zhì)性問(wèn)題
在短劇行業(yè),最讓創(chuàng)作者頭疼的環(huán)節(jié)就是角色一致性。為了讓主角不中途變臉,創(chuàng)作者往往要經(jīng)歷生成角色圖、生成環(huán)境圖、海量分鏡融圖、圖片調(diào)整、圖生視頻、選片配音剪輯的六步線(xiàn)性流程,每一步都高度依賴(lài)人工操作,效率和成本都受人力規(guī)模限制。
生數(shù)科技在白皮書(shū)中首次定義的參考生視頻模式,則是對(duì)傳統(tǒng)邏輯的降維打擊。
這套模式構(gòu)建了生成角色資產(chǎn)、生成場(chǎng)景圖片、參考生加主體庫(kù)、選片配音剪輯的四步閉環(huán)。與傳統(tǒng)圖生視頻相比,分鏡融圖工作量減少約80%,產(chǎn)能較傳統(tǒng)模式提升4到5倍。白皮書(shū)明確指出,參考生模式與圖生模式并非相互替代,而是通過(guò)場(chǎng)景化分工形成能力互補(bǔ),兩者組合使用可實(shí)現(xiàn)效率與品質(zhì)的雙重優(yōu)化。
具體到Vidu Q3的技術(shù)能力,這套參考生模式的落地體現(xiàn)在多個(gè)層面。
從精準(zhǔn)控制來(lái)看,傳統(tǒng)的圖生視頻像抽盲盒,生成結(jié)果不可控。而Vidu的參考生模式通過(guò)萬(wàn)物可參考技術(shù),可以精準(zhǔn)提取主體的人臉、服飾,場(chǎng)景的建筑、光影,甚至是特定道具的核心特征。
對(duì)于短劇導(dǎo)演來(lái)說(shuō),這意味著主角在每一集、每一個(gè)鏡頭里都能保持同一張臉、同一套衣服,徹底解決了連續(xù)敘事的硬傷。白皮書(shū)中提到的“主體庫(kù)”功能,正是這一能力的組織化落地,將生產(chǎn)過(guò)程中驗(yàn)證有效的優(yōu)質(zhì)資產(chǎn)沉淀至主體庫(kù),形成團(tuán)隊(duì)專(zhuān)屬資產(chǎn)壁壘,在后續(xù)項(xiàng)目中直接調(diào)取復(fù)用,實(shí)現(xiàn)一次創(chuàng)作、多次復(fù)用的價(jià)值最大化。
![]()
從動(dòng)態(tài)表現(xiàn)來(lái)看,短劇之所以吸引人,靠的是激烈的沖突和緊湊的運(yùn)鏡。Vidu Q3針對(duì)打斗、追逐等強(qiáng)節(jié)奏場(chǎng)景進(jìn)行了底層優(yōu)化。它不再是讓畫(huà)面動(dòng)起來(lái),而是理解了物理規(guī)律。無(wú)論是粒子特效、流體動(dòng)力學(xué)還是光影轉(zhuǎn)場(chǎng),Vidu Q3都能在參考的基礎(chǔ)上實(shí)現(xiàn)專(zhuān)業(yè)級(jí)影視特效,讓AI視頻告別PPT動(dòng)畫(huà)的尷尬質(zhì)感。白皮書(shū)中提到的六大特效能力,粒子、流體、動(dòng)力學(xué)、運(yùn)鏡、轉(zhuǎn)場(chǎng)、光影特效,以及五大音效能力,環(huán)境、動(dòng)態(tài)、氛圍、擬音、情緒,共同構(gòu)成了Vidu Q3在視聽(tīng)語(yǔ)言上的完整表達(dá)力。
從組織變革來(lái)看,白皮書(shū)中最具現(xiàn)實(shí)指導(dǎo)意義的部分是關(guān)于組織轉(zhuǎn)型的拆解。一個(gè)典型的13人傳統(tǒng)AI團(tuán)隊(duì),往往有10個(gè)人在苦哈哈地抽圖執(zhí)行,人力結(jié)構(gòu)嚴(yán)重失衡,創(chuàng)意價(jià)值被執(zhí)行事務(wù)稀釋。
而通過(guò)Vidu的參考生生產(chǎn)架構(gòu),團(tuán)隊(duì)可以轉(zhuǎn)型為3個(gè)標(biāo)準(zhǔn)化制作組加1個(gè)專(zhuān)項(xiàng)支撐圖生組的多線(xiàn)并行戰(zhàn)隊(duì),形成高效協(xié)同的工業(yè)化生產(chǎn)單元。這種轉(zhuǎn)型讓創(chuàng)意人員百分之百聚焦創(chuàng)意策劃與品質(zhì)把控,產(chǎn)能實(shí)現(xiàn)數(shù)倍提升,同時(shí)構(gòu)建了團(tuán)隊(duì)專(zhuān)屬的資產(chǎn)庫(kù),實(shí)現(xiàn)了從項(xiàng)目制到資產(chǎn)驅(qū)動(dòng)的模式升級(jí)。這驗(yàn)證了AI技術(shù)對(duì)生產(chǎn)關(guān)系的真實(shí)重塑。
Vidu Q3的斷層式霸榜與硬實(shí)力
數(shù)據(jù)從不說(shuō)謊。
2026年4月,全球首個(gè)參考生視頻模型測(cè)評(píng)基準(zhǔn)SuperCLUE-R2V發(fā)布首期榜單。這個(gè)基準(zhǔn)立足于中文語(yǔ)境,涵蓋國(guó)內(nèi)外13個(gè)具有代表性的參考生視頻模型,從多圖參考和單圖參考兩大模塊進(jìn)行深度評(píng)估。
![]()
在多圖參考總榜上,Vidu Q3以70.89分的成績(jī)強(qiáng)勢(shì)登頂,同門(mén)模型Vidu Q2以64.01分位居第二。相比之下,Google的Veo-3.1-Generate-001僅獲得55.43分,位列中下游。在單圖參考的人物還原度總榜上,Vidu Q3同樣以72.43分霸榜。在中文語(yǔ)境和復(fù)雜多圖參考的任務(wù)下,國(guó)產(chǎn)模型已經(jīng)實(shí)現(xiàn)了對(duì)海外巨頭的全面反超。
最值得關(guān)注的是,在主體一致性這一核心能力項(xiàng)上,Vidu Q3斬獲了100分的滿(mǎn)分成績(jī)。這意味著在極其復(fù)雜的三張以上參考圖輸入下,它依然能做到對(duì)主體元素的像素級(jí)保持。
對(duì)于追求商業(yè)交付的廣告商和短劇機(jī)構(gòu)來(lái)說(shuō),這種穩(wěn)定性就是生產(chǎn)力。測(cè)評(píng)報(bào)告指出,主體一致性上模型間的極差高達(dá)90分,標(biāo)準(zhǔn)差達(dá)到23.15,表明少數(shù)頭部模型如Vidu Q3在多圖特征的精準(zhǔn)融合上已建立起深厚的壁壘。
![]()
在應(yīng)用能力層面,Vidu Q3同樣以70.80分位列第一,在影視創(chuàng)作、商業(yè)廣告、電商運(yùn)營(yíng)和泛互娛四大核心場(chǎng)景中均表現(xiàn)不俗。國(guó)內(nèi)模型在影視創(chuàng)作、商業(yè)廣告等垂直領(lǐng)域的得分普遍在60到80分區(qū)間,而海外代表模型僅獲得51.05分。這說(shuō)明國(guó)內(nèi)模型在貼近實(shí)際業(yè)務(wù)的設(shè)計(jì)上更具競(jìng)爭(zhēng)力,深度賦能行業(yè)生產(chǎn)的能力已經(jīng)形成。
此外,Vidu Q3最大支持高達(dá)7張圖片的參考輸入,在多元素輸入繁雜的情況下仍能保持主體一致性滿(mǎn)分,表明其模型具備強(qiáng)勁的信息提取與組合能力。同時(shí),在多場(chǎng)景、多維度的復(fù)雜測(cè)試環(huán)境中,Vidu Q3保持了100%的模型回復(fù)率,穩(wěn)定性拉滿(mǎn),可滿(mǎn)足主流應(yīng)用的核心訴求。
![]()
在一項(xiàng)專(zhuān)為漫劇生成場(chǎng)景下的專(zhuān)項(xiàng)評(píng)測(cè)權(quán)威榜單SuperCLUE-ComicShorts發(fā)布的最新AI評(píng)測(cè)榜單中,Vidu Q3以高分位居榜首
測(cè)評(píng)報(bào)告給出的結(jié)論很直接:在參考生視頻領(lǐng)域,國(guó)內(nèi)頭部模型已實(shí)現(xiàn)對(duì)國(guó)際頂尖模型的全面超越。Vidu Q3在基礎(chǔ)能力和應(yīng)用能力上雙雙位列第一,展現(xiàn)了全方位領(lǐng)先的強(qiáng)勁實(shí)力。
結(jié)語(yǔ):AI短劇的下半場(chǎng)怎么玩
生數(shù)科技Vidu Q3的爆發(fā),給短劇行業(yè)留下了三條深刻的啟示。
垂直深度大于通用廣度。通用大模型能寫(xiě)詩(shī)、能畫(huà)畫(huà),但在短劇這種對(duì)一致性要求極高的場(chǎng)景里,必須有像Vidu這樣針對(duì)參考生模式深度優(yōu)化的垂直底座。白皮書(shū)中提出的漫劇專(zhuān)屬訓(xùn)練數(shù)據(jù)與標(biāo)注體系建設(shè)、垂直場(chǎng)景專(zhuān)屬評(píng)測(cè)體系搭建、行業(yè)統(tǒng)一生產(chǎn)SOP與標(biāo)準(zhǔn)體系構(gòu)建三大標(biāo)準(zhǔn)化建設(shè)方向,正是將垂直深度轉(zhuǎn)化為行業(yè)壁壘的關(guān)鍵路徑。
![]()
資產(chǎn)化是核心競(jìng)爭(zhēng)力。以后短劇團(tuán)隊(duì)比拼的不僅是創(chuàng)意,還有主體庫(kù)的沉淀。誰(shuí)能在Vidu的框架下沉淀出高質(zhì)量的角色資產(chǎn)、場(chǎng)景資產(chǎn)、特效資產(chǎn),誰(shuí)就能在短劇出海、漫劇聯(lián)動(dòng)的浪潮中占據(jù)先機(jī)。
白皮書(shū)中強(qiáng)調(diào)的資產(chǎn)閉環(huán),生產(chǎn)過(guò)程中驗(yàn)證有效的優(yōu)質(zhì)資產(chǎn)沉淀至主體庫(kù),形成團(tuán)隊(duì)專(zhuān)屬資產(chǎn)壁壘,正是將單次項(xiàng)目制升級(jí)為IP資產(chǎn)驅(qū)動(dòng)工業(yè)化模式的核心邏輯。
工業(yè)化是唯一的出路。AI短劇已經(jīng)過(guò)了秀肌肉的獵奇階段,現(xiàn)在要看的是誰(shuí)能穩(wěn)定地產(chǎn)出高品質(zhì)的內(nèi)容。生數(shù)科技通過(guò)白皮書(shū)制定的標(biāo)準(zhǔn),實(shí)際上是為行業(yè)建立了一個(gè)及格線(xiàn)。從六層全棧技術(shù)架構(gòu)到參考生生產(chǎn)模式,從組織轉(zhuǎn)型方案到資產(chǎn)沉淀體系,這套完整的解決方案讓AI短劇生產(chǎn)從人海戰(zhàn)術(shù)轉(zhuǎn)向技術(shù)驅(qū)動(dòng)成為可能。
從拿到阿里融資到發(fā)布行業(yè)首份白皮書(shū),再到Vidu Q3在測(cè)評(píng)中展現(xiàn)出的斷層統(tǒng)治力,生數(shù)科技正在完成從技術(shù)極客到行業(yè)領(lǐng)航者的蛻變。
對(duì)于短劇創(chuàng)作者而言,Vidu Q3的出現(xiàn)意味著工具鏈的成熟,參考生模式解決了角色一致性痛點(diǎn),聲畫(huà)同出技術(shù)實(shí)現(xiàn)了最長(zhǎng)16秒音視頻同步生成,六大特效和五大音效讓AI視頻具備了專(zhuān)業(yè)影視級(jí)的視聽(tīng)語(yǔ)言。
對(duì)于行業(yè)而言,這份白皮書(shū)的發(fā)布標(biāo)志著AI漫劇從野蠻生長(zhǎng)進(jìn)入了標(biāo)準(zhǔn)化、工業(yè)化的新階段。生數(shù)科技聯(lián)合AI新榜梳理了行業(yè)發(fā)展規(guī)律、拆解了核心痛點(diǎn)、輸出了可落地的生產(chǎn)模式與組織轉(zhuǎn)型方案,為全行業(yè)參與者提供了清晰的實(shí)踐參考。
AI不會(huì)取代創(chuàng)作者,但那些掌握了像Vidu Q3這樣工業(yè)化利器的創(chuàng)作者,注定將在這場(chǎng)百億級(jí)市場(chǎng)的盛宴中,坐上主桌。
新腕兒渠道專(zhuān)屬邀請(qǐng)碼:8SK3MI23JN
登錄網(wǎng)站領(lǐng)取積分:
https://platform.vidu.cn/account-overview —賬號(hào)總覽—使用邀請(qǐng)碼,即可獲取 2000積分。
![]()
了解短劇,請(qǐng)關(guān)注新腕兒。
加入新腕兒社群請(qǐng)掃碼。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶(hù)上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.