依托“央視聽媒體大模型2.0”的影像生成能力,數(shù)字人首次實(shí)現(xiàn)與真人演員在擴(kuò)展現(xiàn)實(shí)(XR)舞臺(tái)上的無縫互動(dòng)。在戲曲節(jié)目《龍鳳呈祥》中,數(shù)字人化身古代名角,其水袖翻飛的動(dòng)態(tài)精度達(dá)到毫米級(jí),配合三維聲場(chǎng)技術(shù)營造的立體音效,使觀眾仿佛置身戲臺(tái)。這種技術(shù)突破不僅讓傳統(tǒng)劇目煥發(fā)新生,更通過虛實(shí)交融的敘事方式,讓年輕觀眾在科技奇觀中感知文化血脈的延續(xù)。
技術(shù)瓶頸致交互與成本制約發(fā)展
盡管數(shù)字人在舞臺(tái)呈現(xiàn)上取得突破,其技術(shù)短板仍然顯著。
情感交互存壁壘成為首要難題。多數(shù)數(shù)字人依賴預(yù)設(shè)程序運(yùn)行,在即興互動(dòng)環(huán)節(jié)表現(xiàn)生硬。往屆晚會(huì)中,數(shù)字主持人應(yīng)對(duì)觀眾提問時(shí)出現(xiàn)的應(yīng)答延遲、表情僵化等問題,根源在于語義理解與情感計(jì)算能力不足。例如當(dāng)現(xiàn)場(chǎng)觀眾即興提出祝福請(qǐng)求時(shí),數(shù)字人往往只能機(jī)械重復(fù)預(yù)設(shè)臺(tái)詞,缺乏自然的情感反饋。
制作成本筑高墻制約技術(shù)普及。超寫實(shí)數(shù)字人需百萬級(jí)多邊形建模,配合專業(yè)光學(xué)動(dòng)捕系統(tǒng)(單套設(shè)備價(jià)值超百萬元),加之每幀數(shù)小時(shí)的渲染耗時(shí)。某省級(jí)衛(wèi)視數(shù)字偶像項(xiàng)目顯示,僅角色毛發(fā)物理模擬就占據(jù)整體預(yù)算30%,高昂成本使中小制作團(tuán)隊(duì)望而卻步。
版權(quán)歸屬陷迷霧引發(fā)法律隱憂。2025年某虛擬歌手版權(quán)糾紛案中,原畫師、技術(shù)公司、運(yùn)營平臺(tái)對(duì)數(shù)字人衍生品收益分成產(chǎn)生爭議,凸顯法律滯后性。更存在未經(jīng)授權(quán)使用公眾人物形象生成數(shù)字人進(jìn)行商演的現(xiàn)象,亟待建立規(guī)范體系。
大模型構(gòu)建數(shù)字人進(jìn)化新路徑
面對(duì)發(fā)展瓶頸,行業(yè)正通過三重變革開辟新局。
智能內(nèi)核升級(jí)成為破局關(guān)鍵。“央視聽媒體大模型2.0”通過千億級(jí)多模態(tài)數(shù)據(jù)訓(xùn)練,賦予數(shù)字人情境化交互能力。這項(xiàng)技術(shù)突破使數(shù)字表演者從“提線木偶”進(jìn)化為具有臨場(chǎng)智慧的舞臺(tái)伙伴。
制作流程革新降低技術(shù)門檻。輕量化建模技術(shù)正改變行業(yè)生態(tài),基于神經(jīng)輻射場(chǎng)(NeRF)的AI建模方案,將數(shù)字人制作周期從月級(jí)壓縮至天級(jí),成本降低70%。深圳某工作室采用消費(fèi)級(jí)攝像頭配合AI動(dòng)捕算法,成功實(shí)現(xiàn)單人數(shù)千元級(jí)數(shù)字人直播方案,為技術(shù)普及打開通路。
法律規(guī)范筑基保障健康發(fā)展。《數(shù)字人版權(quán)認(rèn)定指南》試行方案確立“三權(quán)分置”原則:形象權(quán)歸創(chuàng)作者、表演權(quán)屬運(yùn)營者、人格權(quán)由被模擬者保留。北京互聯(lián)網(wǎng)法院新設(shè)數(shù)字資產(chǎn)合議庭,已成功調(diào)解多起數(shù)字人侵權(quán)糾紛,為產(chǎn)業(yè)筑牢法律根基。
當(dāng)《難忘今宵》的旋律響起,數(shù)字人演員眼中流轉(zhuǎn)的溫暖光影,映照的不僅是技術(shù)的突破,更是人類拓展情感表達(dá)邊界的永恒追求。這場(chǎng)科技賦能下的文化盛宴,正讓團(tuán)圓之夜綻放出跨越時(shí)空的藝術(shù)光芒,為中國傳統(tǒng)文化的創(chuàng)新傳承開辟全新維度。