網易首頁 > 網易號 > 正文申請入駐

AI 視頻生成也有 Skills了，@ 一下就能調用整個好萊塢劇組

2026-01-29 19:05:27　來源: 愛范兒

廣東舉報

分享至

Claude Skills 最近在社交媒體上刷屏。它讓 AI 從會聊天變成會干活。把專業能力打包成模塊，用戶只用斜杠 / 一下就能選擇對應的 Skills。

想做數據分析？/DataAnalyst。想寫代碼？/Coding Expert。AI 不再是猜我們想要什么的黑盒，變成了一個按需加載的工具箱。這個模塊化的思路，現在也來到了 AI 視頻生成領域。

Vidu 新上線的主體社區，把運鏡、特效、氛圍、表演、構圖、敘事、風格、場景、招式等等，這八大類型打包成「主體庫」，我們只需要在輸入框里 @ 一下，就能調用。

▲在參考生視頻中，輸入 @，會自動彈出選擇框，我們可以直接找到需要的主體

想要推鏡頭？@鏡頭庫。想要賽博朋克氛圍？@氛圍庫。想要粒子特效？@特效庫。

我們甚至可以像 Claude Skills 那樣疊加使用：@鏡頭 + @氛圍 + @特效 + 角色圖，一次性搞定導演、攝影師、特效師、美術指導的活兒。

以前都說 AI 要搶走好萊塢演員的飯碗，現在 Vidu 直接給每個創作者配了一個 AI 好萊塢制片廠。演員、導演、攝像全部都是 AI，只要我們 @ 一下。

這也是全球第一個 AI 視頻主體社區，一個可分享、可交易、可互動的主體社區。

體驗地址：https://www.vidu.cn ｜Vidu API：http://platform.vidu.cn/

APPSO 第一時間拿到了 Vidu 主體社區的測試資格，把里面的 8 大主體類型都體驗了一遍，我們一起來看看它的實際表現如何。

還有給大家也準備了福利，登錄 vidu.cn，輸入邀請碼：APPSON，注冊即送 500 積分，快一起來體驗吧

AI 終于學會了「演戲」

在傳統 AI 視頻中，最難描述的就是畫面感。稍微多寫幾個形容詞，AI 就容易產生幻覺。尤其是人物表情的僵硬，簡直就是 AI 視頻的硬傷。

Vidu 主體社區的表演和表情庫，把這些復雜的情緒描述和動作設計，都做到了標準化。現在包括癲狂大笑、驚恐、悲傷、歡快等表演和表情主體，能夠直接生成對應角色的表情和情緒狀態；還有雙人對打、群像對峙、浪漫依戀等招式主體，更是把角色的具體動作都安排好了。

一鍵@表情，我們甚至不需要用多余的提示詞，就能完美復刻主體社區里面各種表情。同時，還能兼顧到視頻的完整統一性。

我們輸入一張小丑的圖片，使用癲狂大笑這一主體，既讓小丑有更豐富的表情和動作，同時小丑的模樣也沒有被改變，整體畫面的氣氛也保持在恐怖驚悚中。

▲組合公式：@雷暴不止的@城市廢墟，@圖1站在街道上，正對著鏡頭作出@癲狂大笑，結合劇烈的@急搖鏡頭，營造出強烈的@恐怖驚悚氛圍

能笑，當然也能哭，使用@夸張大眼哭哭這個主體，就可以直接讓畫面里的角色，哭得撕心裂肺。這些表情和表演主體，能真的讓 AI 視頻里的角色「活」過來。

▲ 組合公式：@圖1站在鏡子前，鏡子里顯示著她展現出@夸張大眼哭哭的表情，結合強烈的@悲傷氛圍，她的哭泣越來越悲痛，同時使用@側逆光，顯示她的輪廓和鏡子中清晰的哭泣表情。

不只表情控制準確，動作上，有了主體庫的預設，我們可以輕輕松松地就讓角色放大招。不只是角色的動作，就連視頻特效，我們也是直接@主體社區里面的對應主體，就自動添加上。

我們先在招式里面，選了一個@百花繚亂的分身。

▲組合公式：@角色3使用@百花繚亂分身

效果還是很不錯的，即使是比較復雜的@冰雨術、鎖鏈等招式，Vidu 也基本上都能駕馭得很好。

▲組合公式：@劍圣使用@冰雨術攻擊@蒼玄，冰雨快要掉到@蒼玄身上時，@蒼玄快速使用@金鐘罩來抵抗攻擊

這些招式和特效，對于短劇漫劇創作者來說，簡直是最佳利器。

不同的主體也能多個疊加組合，Vidu 就能給我一個精彩的玄幻武打大片。

▲組合公式：@星野仙尊面向@鬼怪打出@降龍十八掌，場景是@戰場，@智能運鏡

近距離的雙人對打，行云流水的動作也能復刻黑客帝國了。

@ 幾下就能出片，我也能做百萬運鏡了

解決了人物的表情和動作，接著就是畫面的設計。

能控制視角，掌握觀眾的眼睛的鏡頭，是視頻內容呈現當之無愧的重要部分。其中的運鏡和構圖，運鏡能決定攝影機的運動方式，向來就是電影鏡頭語言的基礎；而構圖更是決定了畫面的景別和視角。

在 Vidu 主體社區，景別包括特寫、全景、鳥瞰、360 度展示等，構圖也有群像對峙、三分構圖、荷蘭角構圖等，鏡頭則更加豐富，包含推鏡頭、搖鏡頭、環繞鏡頭、探針鏡頭等多種運鏡方式。

我們先是從主體庫里，按照人物+風格+場景+氛圍+運鏡的方式，隨機選擇了一組提示詞，中間甚至沒有太多的連接詞，用來把這些主體連起來。最后一次性呈現出來的效果，也很有好萊塢大片的風格。

▲組合公式：@緊張壓抑氛圍，@小李子站在@停車場，鏡頭先@360度展示，再拉遠到@全景展示空蕩蕩的停車場

其中小李子就是我們自己創建的主體，上傳 1-3 張圖片，選擇對應的聲音，然后確定風格和提示詞，就能得到一個可以重復使用的人物主體。

配合 @360度展示的環繞，進一步凸顯緊張壓抑的氛圍，到鏡頭拉遠，使用@全景展示，把這種視覺沖擊力做到更強；短短五秒，充滿了戲劇張力。

除了在這種封閉空間的運鏡，Vidu 主體社區的鏡頭配置方案，在露天的無限空間里，表現同樣優秀。

▲組合公式：@背后視角@活力少女坐在摩天大樓邊緣，@無人機拉遠，@全景展現@南京城市天際線和@敬畏崇高氛圍

此外，Vidu 主體社區還提供了像@探針鏡頭這樣的特殊鏡頭軌跡，很難用自然語言描述清楚攝像機的運動路徑，現在直接直接調用主體就能幫我們快速實現微距穿梭。

▲組合公式：@鄭開開@科幻風格@太空艙場景@科技感氛圍@探針鏡頭

很多 AI 視頻往往畫質很美，動起來很假。Vidu 主體社區新增的豐富運鏡，確實比以往我們輸入提示詞，告訴 AI 攝像機如何運動，角色如何運動，要可控和容易得多。它對那些專業鏡頭語言的理解，還是比較準確。

繼續測試它對運鏡和景別的理解能力。推鏡頭是最基礎的電影鏡頭之一，從遠景緩慢推進到近景，制造情緒遞進感。我們先用傳統方式寫提示詞，「Elean 在醫院對面，天在下雨，鏡頭推進到她的臉部，然后鏡頭拉遠，從空中鳥瞰」。

先不說這個用提示詞實現的運鏡如何，沒有參考主體的純文生視頻有諸多不可控，例如畫面的風格是否過于超現實，主體的展示是否符合情境等，我們生成了好幾次，單純用提示詞的效果，幾乎都把握不好這個推進到鳥瞰的速度和效果。

▲提示詞版本，鳥瞰運鏡下，人物都消失了，不能保持在畫面中心

使用 Vidu 主體庫，我們還可以直接選擇主體社區中，已經有的人物形象，來生成視頻。同時@鏡頭庫選擇「鏡頭推進」，加上簡單的場景描述。第一次生成就出片了，從推進到拉遠，再到鳥瞰鏡頭，自然過渡。

▲組合公式：@Elean在@醫院對面，天在下雨，@鏡頭推進到她的臉部，然后再@鏡頭拉遠的@鳥瞰運鏡

這個對比很能說明問題，傳統 AI 視頻生成的「理解力」是飄忽的，同一個提示詞每次生成都像開盲盒。而主體庫相當于把這些專業概念做了標準化封裝，模型不用再去猜我們想要什么效果。

不只是好看，讓故事更有「代入感」

除此之外，在主體庫中里面的氛圍、風格和場景，決定了整個視頻的味道。

具體來說，場景能決定視頻的空間環境，風格決定視頻的整體美術風格，氛圍則是給畫面的情感色彩帶來了新的故事。Vidu 主體社區也提供了包括太空艙、醫院、森林、咖啡店、豪華宴會廳等場景，科幻、懸疑、賽博朋克、古風等風格，以及緊張壓抑、歡快、悲傷、浪漫依戀、科技感等氛圍。

我們直接把一個豪華的高級宴會廳，變成一出陰森恐怖的驚悚片，配合左右搖晃的運鏡，營造出從人物視角觀察環境的效果，增強身臨其境感。

▲組合公式：@豪華宴會廳變成@恐怖驚悚的氛圍，采用@左右搖晃的運鏡，整體是@懸疑電影風格

能通過環境的燈光來展現氛圍變化，Vidu 主體社區的其他氛圍，還能結合人物表情來呈現。

還能讓 @小李子 和 @夢露，加一個@浪漫依戀氛圍。Vidu 最后生成的視頻光影效果很好，當全景的時候，是用比較暗的下雨天氛圍，而自動推進到兩個人臉部時，畫面又自動提亮了。

▲測試公式：@群像對峙@小李子和@夢露@浪漫依戀氛圍，背景是@咖啡店

通過對這些不同分類的主體進行測試，讓我確認了一件事，多主體組合不是簡單的「功能堆疊」，Vidu 在底層做了某種協調機制，讓不同主體之間能互相配合。

這種協同感，是傳統 AI 視頻生成最缺少的。我們在提示詞里寫再多細節，模型也很難同時從里面理解到，鏡頭、氛圍、特效的平衡。

更驚喜的是，我們不僅能直接引用主體庫，來生成視頻；Vidu 這次還把這些主體，做成了一個可以分享、互動和交易的社區。

▲用戶可以上傳自己設計的主體

我們每個人都可以設計和上傳自己的主體，同時使用其他的主體，在創作和使用的過程中，Vidu 設置了資產變現模式，每一個主體都是可交易的。

配合前兩天剛剛更新的 Vidu Agent 1.0 和 Vidu Q2 參考生 Pro 模型，一方面有更自動化的工作流，開箱即用，實現一鍵成片，靈活性與便捷性完美平衡的 Agent；全新升級后的功能，支持上傳背景音樂、刪減旁白、Storyboard 編輯，內置多語言，多音色，多模特，多場景的海量素材庫等。

另一方面則是更強大的基座模型，能直接復刻不同視頻效果的 Q2 參考生 Pro。

AI 視頻生成這條路，Vidu 算是越走越明白了。

從「抽卡」到「搭樂高」

這一圈實測下來，我對 Vidu 主體社區也有了一個更清晰的判斷，它除了是一個更好的工具，能幫助我們更好地生成 AI 視頻，它更想要改變整個生成的工作模式。

傳統 AI 視頻生成是「抽卡模式」，我們寫一堆提示詞，祈禱模型能理解，然后賭概率。運氣好抽到 SSR，運氣不好全是垃圾。這種模式的問題是，創作過程不可控，專業門檻以另一種形式（說的就是提示詞工程）依然存在。

而 Vidu 主體社區是「樂高模式」，把專業元素拆解成標準化的模塊，我們只需要選擇、組合，然后生成。這種模式的核心優勢是可控性，在選擇主體時，我們就大體上知道會有什么效果，而不是單純碰運氣。

這個轉變對誰最有價值?自媒體、短劇漫劇創作者、電商營銷團隊、中小企業主，他們需要批量產出有質感的視頻內容，但沒有專業團隊和高昂預算。主體庫對他們來說，相當于花小錢雇了一個「虛擬劇組」。

▲復雜的視頻制作流程

那些獨立創作者、設計師、廣告從業者也會受益。主體庫可以補齊他們的短板，不用從零學 AE 就能搞定酷炫的鏡頭和特效。

放到更大的行業背景下看，Vidu 主體社區讓 AI 視頻生成進入了「工業化階段」的一個標志。

過去一年，AI 視頻生成的主戰場是誰的模型更強——可靈、Runway、Sora、Veo 都在比拼畫面質量、時長、一致性。但技術到了一定階段，競爭維度會轉向「怎么生成」，也就是工作流、可控性、復用性。

這種轉變，其實和 Claude Skills 的邏輯是如出一轍的。Skills 的價值不在于讓 Claude 變得更聰明，而在于讓它的能力變得可預期、可調用、可組合。用戶不再需要猜測「這次它會不會理解我的意思」，而是明確知道「我調用了這個 Skill，它就會按這個方式工作」。

▲Claude 提供的 Skills 選擇，不同的 Skill 能直接解決對應的問題

Vidu 主體庫做的也是同樣的事情。它把視頻生成從「抽卡游戲」變成了「精準指令」。這種確定性，才是真正降低門檻的關鍵。

對于真正有想法、有審美、有敘事能力的創作者來說，這其實是好事。他們終于不用被技術門檻卡住，可以把精力集中在真正重要的部分。

換句話說，Vidu 全新的主體社區，它能幫我們實現一個完美的推鏡頭，但不能幫我們決定這個推鏡頭，應該出現在故事的哪個節點、推進速度應該配合什么樣的情緒節奏、這個鏡頭和前后鏡頭如何形成敘事張力。

▲主體社區包含的部分主體

這些決策，依然需要我們人類創作者的判斷力和審美。

當然，它現在還有一些可以進步的空間，8 秒限制、主體庫覆蓋度，但這些都是可以迭代優化的。更重要的是，Vidu 主體社區開了一個頭，證明了「標準化 + 可組合」這條路是走得通的。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.