![]()
![]()
編輯|+0
最近,一段「威爾·史密斯吃意面」的今昔對比視頻在社交媒體刷屏,引發了無數感慨。
![]()
兩年前,初出茅廬的 AI 視頻還是「抽象鬼畜」的代名詞,五官亂飛、邏輯崩壞;僅僅兩年過去,當同一主題再次被演繹,從吞咽時肌肉的牽動,到光影在面部的細膩流轉,AI 已進化至「惟妙惟肖」的真·智能水準。
這兩年,濃縮了 AI 視頻生成行業翻天覆地的技術躍遷。然而,行業并未止步于畫質的內卷。在各家廠商競逐「可控性」高地的當下,AI 視頻正站在一個關鍵轉折點:從解決「有沒有」,到追求「精不精」
回顧 Vidu 的進化之路:2025 年 9 月,Vidu Q2 全球首發,以驚艷的圖生視頻、參考生視頻能力技驚四座;12 月,Q2「生圖全家桶」上線,首日突破 50 萬次的使用量,印證了市場對高質量生成的渴望。
昨天,Vidu Q2 參考生 Pro 正式發布。
登陸Vidu.cn或 Vidu API:platform.vidu.cn,體驗最新產品功能。
短短數月,它完成了從「生成」到「編輯」的閉環,更推出了全球首個「萬物可參考」的視頻模型,將參考模態從靜態圖像一舉擴展至動態視頻與多維元素。其全新 Slogan「視頻參考,創想無限」,不再是一句營銷口號,而是對 AI 視頻生產流的一次底層重構。
此次更新帶來了兩大功能亮點,重新定義了 AI 的「模仿」與「創造」:
- 視頻參考:特效與演技的「萬能格式刷」
Vidu Q2 參考生 Pro 不僅極大豐富了參考類型(涵蓋人物、場景、特效、表情、動作、材質紋理等),更在模態上實現了質的飛躍。
作為全球首個「萬物可參考」的視頻模型,它打破了圖片的束縛,能同時處理多段視頻素材。只需輸入參考視頻,無論是百萬級的電影特效、細膩的微表情,還是復雜的流體紋理,都能實現一鍵遷移。它能精準拿捏細微情緒,讓演技自然可信,讓特效落地生根。
- 視頻編輯:不再「牽一發而動全身」
基于強大的視頻參考能力,Vidu 讓視頻編輯告別了不可預測的抽卡。
Vidu Q2 參考生 Pro 支持對視頻內元素的精準增、刪、改、減:從改變人物站位、調整畫幅比例,到更換背景、美顏美發,甚至進行復合編輯,均可通過參考指令一鍵達成。得益于支持 2 個視頻 + 4 張圖片的多模態高并發輸入能力,即便歷經多次復合編輯,視頻的核心元素與畫面一致性依然穩如磐石。
話不多說,我們直接上手體驗。
從「抽卡」到「精修」,
這回是真的嗎?
Slogan 里的「視頻參考」到底成色幾何?為了驗證它是否真能讓人一鍵化身「AI 影帝」并擁有隨心所欲的控制力,我們設計了三個測試場景,實測它在多視頻參考與細節增刪上的真實表現。
場景一:一鍵復刻,演技與特效的「神形合一」
動作捕捉和百萬特效并不是新鮮事,還記得《阿凡達》拍攝時,卡梅隆是用怎樣復雜的設備與調度才完美呈現了納美人的世界嗎?此前 AI 往往只能捕捉大概的肢體動作,一旦涉及到人物外觀的劇烈變形或特效加載,一直是災難現場(參考兩年前的威爾·史密斯)。
先看官方演示:讓指定人物完美復刻《X 戰警》中魔形女的變身過程。
輸入:

![]()
輸出:

這效果,只能說「百萬特效一鍵白嫖」真不是吹的。這不僅是視覺層面的「高保真」,更是對傳統特效制作邏輯的降維打擊。
以往需要專業團隊耗時數周、燃燒經費才能實現的流體變形與高精特效,如今被 Vidu Q2 參考生 Pro 壓縮至邊際成本幾近歸零。這種生產力的躍遷,意味著影視創作將告別「唯預算論」的舊時代。當工業級特效不再是昂貴的奢侈品,創作者的想象力,將成為衡量作品價值的唯一天花板。
那 AI 的演技如何呢?我們玩個大的,讓 Vidu 挑戰張曼玉在《甜蜜蜜》中的經典哭戲。
我們上傳了原片作為參考,要求生成的虛擬角色復刻這一瞬間:

![]()
輸出:
![]()
有一說一,AI 復刻得相當傳神,眉眼間的情緒流轉非常到位。
這種高精度的神態捕捉與生成能力,若應用到具體產業,將極大拓展制作流程的想象空間。對于短劇市場而言,這意味著創意的可視化門檻被進一步降低。創作者可以利用技術手段,將抽象的劇本快速轉化為情緒飽滿的視覺素材,讓好的故事不再受限于初期制作條件的簡陋。
在影視制作前期,它能升級為更直觀的 Previz(預演)工具,讓導演在開機前就能看到帶有情緒色彩的動態分鏡,輔助藝術決策;而在動漫領域,這種技術或許能成為傳統轉描工藝的智能化升級,將真人表演的細膩韻律轉化為特定畫風的動畫,助力跨次元創作更高效地落地。
接下來是「多視頻參考」的整活時間,我們同時上傳沈騰老師和怪盜基德的經典片段。


讓 Vidu 給人物換上沈騰老師的衣服并模仿他的動作,再配上怪盜基德的眼鏡和帽子,看看喜劇之王和二次元男神會碰撞出什么火花:
![]()
輸出:
![]()
效果肉眼可見的絲滑,手部動作完美復刻,鏡片高光隨著人物的頭部晃動產生符合物理規律的動態反射,帽子邊緣的遮擋關系也處理得嚴絲合縫,整體的服飾光影以及人物的神韻都維持了極高的統一度。
通過以上測試我們發現,這一次 AI 不僅「接住了戲」,更自帶了百萬級的特效光環。它不再只是機械地復制骨骼點位,而是展現了一種驚人的「表演-特效」同步率:在完美駕馭魔形女變身這種極高難度的流體與紋理形變的同時,它還能讀懂參考視頻中眉頭微蹙、眼神流轉等情緒代碼。
對于創作者而言,這意味著你能同時驅動虛擬角色的皮囊與靈魂,跳過繁瑣后期,真正實現「一人就是一支特效劇組」。
場景二:一鍵換紋理,萬物皆可「換皮」
前面展示了 AI 對動態表演的駕馭,接下來看看視頻生成的另一個核心命題:質感。
紋理本質上決定了視頻畫面的「味道」。在 Vidu Q2 參考生 Pro 中,參考生視頻中的材質紋理遷移,意味著 AI 已經不再停留于簡單的像素模仿,而是開始真正習得了一門「質感語言」。
它不是將一張貼圖生硬地包裹在物體表面,而是理解了光線如何在不同材質上折射、粗糙度如何影響視覺反饋。這種能力的涌現,讓 AI 視頻從「看起來像」進化到了「感覺是真的」。
先看官方如何處理復雜的紋理:將一個普通的杯子瞬間「燒制」成青花瓷。


可以看到,青花瓷特有的釉面反光與杯身曲面嚴絲合縫,毫無懸浮的「貼圖感」,仿佛 AI 在數字世界里重新進行了一次物理建模。
切換整體風格也不在話下,比如瞬間變為粘土風:


那如果是我隨手在宜家拍的一只毛絨小狗呢,Vidu 能否打破次元壁,隨意改變它的世界?
![]()
我們先把這張靜態照片交給 Vidu,讓它生成一段基礎視頻:
![]()
可以看到,Vidu 不僅讓小狗動了起來,更關鍵的是,它精準構建了畫面的 3D 空間關系,不僅完美還原了周圍環境,還保持了毛絨質感的穩定性。這為我們接下來的「魔改」打好了底子。
接著,我們嘗試把小狗面前最大的碗換成藍色的:
![]()
效果可以說是非常驚艷。AI 真正理解了物體的 3D 結構和光影關系,讓這種「換皮」不再是簡單的濾鏡疊加,而是物理層面的重構。
場景三:一鍵精準修改,完美主義的救星
視頻生成的構圖和光影都很完美,偏偏主角沒戴墨鏡,或者背景里亂入了一個垃圾桶。
以前的解決辦法?只能把 Prompt 改了又改,重跑 10 次模型,祈禱 AI 下一次能「蒙」對。Vidu Q2 參考生 Pro 這次更新的視頻編輯功能直擊痛點。
還是用前面宜家小狗的視頻,我們試著要求刪掉綠色的餐具,然后在藍色碗里放一個蘋果,看看效果怎么樣:
![]()
可以看到,綠色的餐具被完美消除,藍色碗中增加了一個看起來非常新鮮的蘋果。
而在官方演示中,這種能力表現得更為驚人:


手指和手掌的結構一直是 AI 視頻生成的「阿喀琉斯之踵」。在這個案例中,Vidu 不僅完美抹去了手機,更「腦補」出了被手機遮擋的手指細節和掌紋。這種感覺,就像是把 Photoshop 里的「橡皮擦」和「內容識別填充」搬進了視頻里。
當然,客觀地說,在實測中我們也發現,面對極度復雜的畫面或混亂背景時,AI 偶爾也會出現變形或修補痕跡,但相比以前「這也變了、那也歪了」的崩潰體驗,現在的可用性已經實現了從 0 到 1 的質變。
對于必須摳細節的創作者來說,這不僅是技術的進步,更是直接省掉了無數次「重新抽卡」的垃圾時間。
結語
小時候,我們都聽過神筆馬良的故事,那是人類最早關于「筆尖即現實」的浪漫幻想。而今,隨著 AI 的進化,這個跨越千年的寓言正在我們指尖完成某種數字化的降臨。
如果說過去兩年的 AI 視頻生成是一場憑運氣拆盲盒的「概率游戲」,那么今天,這種充滿隨機性的浪漫正在退場。就像威爾·史密斯那碗意面終于變得優雅得體,技術正在從「野蠻生長」走向「顆粒度掌控」。
Vidu Q2 參考生 Pro 給出了一個很明確的信號:AI 視頻的下半場,拼的不是運氣,而是控制力。
當我們能夠精準地拿捏情緒、增刪元素,這支筆才真正算握在了創作者自己手中。這不僅僅是技術的進步,更是創作自由的回歸:讓機器服務于直覺,讓每一個像素都聽從大腦。
最后,馬年快到了,給大家送上一個小「彩蛋」:讓 Vidu Q2 參考生 Pro 請出《塞爾達傳說》里的人馬老師和林克,給大家拜個早年~

福利時刻:登錄 Vidu.cn,輸入邀請碼:JQZX,注冊即送 500 積分,開啟你的「神筆」之旅!
文中視頻鏈接:https://mp.weixin.qq.com/s/JwHBqS5JQ6H-FNV1vHbpZQ
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.