Claude Skills 最近在社交媒體上刷屏。它讓 AI 從會聊天變成會干活。把專業能力打包成模塊,用戶只用斜杠 / 一下就能選擇對應的 Skills。
想做數據分析?/DataAnalyst。想寫代碼?/Coding Expert。AI 不再是猜我們想要什么的黑盒,變成了一個按需加載的工具箱。這個模塊化的思路,現在也來到了 AI 視頻生成領域。
Vidu 新上線的主體社區,把運鏡、特效、氛圍、表演、構圖、敘事、風格、場景、招式等等,這八大類型打包成「主體庫」,我們只需要在輸入框里 @ 一下,就能調用。
![]()
▲在參考生視頻中,輸入 @,會自動彈出選擇框,我們可以直接找到需要的主體
想要推鏡頭?@鏡頭庫。想要賽博朋克氛圍?@氛圍庫。想要粒子特效?@特效庫。
我們甚至可以像 Claude Skills 那樣疊加使用:@鏡頭 + @氛圍 + @特效 + 角色圖,一次性搞定導演、攝影師、特效師、美術指導的活兒。
![]()
以前都說 AI 要搶走好萊塢演員的飯碗,現在 Vidu 直接給每個創作者配了一個 AI 好萊塢制片廠。演員、導演、攝像全部都是 AI,只要我們 @ 一下。
這也是全球第一個 AI 視頻主體社區,一個可分享、可交易、可互動的主體社區。
![]()
體驗地址:https://www.vidu.cn |Vidu API:http://platform.vidu.cn/
APPSO 第一時間拿到了 Vidu 主體社區的測試資格,把里面的 8 大主體類型都體驗了一遍,我們一起來看看它的實際表現如何。
還有給大家也準備了福利,登錄 vidu.cn,輸入邀請碼:APPSON,注冊即送 500 積分,快一起來體驗吧
AI 終于學會了「演戲」
在傳統 AI 視頻中,最難描述的就是畫面感。稍微多寫幾個形容詞,AI 就容易產生幻覺。尤其是人物表情的僵硬,簡直就是 AI 視頻的硬傷。
Vidu 主體社區的表演和表情庫,把這些復雜的情緒描述和動作設計,都做到了標準化。現在包括癲狂大笑、驚恐、悲傷、歡快等表演和表情主體,能夠直接生成對應角色的表情和情緒狀態;還有雙人對打、群像對峙、浪漫依戀等招式主體,更是把角色的具體動作都安排好了。
一鍵@表情,我們甚至不需要用多余的提示詞,就能完美復刻主體社區里面各種表情。同時,還能兼顧到視頻的完整統一性。
我們輸入一張小丑的圖片,使用癲狂大笑這一主體,既讓小丑有更豐富的表情和動作,同時小丑的模樣也沒有被改變,整體畫面的氣氛也保持在恐怖驚悚中。

▲組合公式:@雷暴不止的@城市廢墟,@圖1站在街道上,正對著鏡頭作出@癲狂大笑,結合劇烈的@急搖鏡頭,營造出強烈的@恐怖驚悚氛圍
能笑,當然也能哭,使用@夸張大眼哭哭這個主體,就可以直接讓畫面里的角色,哭得撕心裂肺。這些表情和表演主體,能真的讓 AI 視頻里的角色「活」過來。

▲ 組合公式:@圖1站在鏡子前,鏡子里顯示著她展現出@夸張大眼哭哭的表情,結合強烈的@悲傷氛圍,她的哭泣越來越悲痛,同時使用@側逆光,顯示她的輪廓和鏡子中清晰的哭泣表情。
不只表情控制準確,動作上,有了主體庫的預設,我們可以輕輕松松地就讓角色放大招。不只是角色的動作,就連視頻特效,我們也是直接@主體社區 里面的對應主體,就自動添加上。
我們先在招式里面,選了一個@百花繚亂的分身。

▲組合公式:@角色3使用@百花繚亂分身
效果還是很不錯的,即使是比較復雜的@冰雨術、鎖鏈等招式,Vidu 也基本上都能駕馭得很好。

▲組合公式:@劍圣使用@冰雨術攻擊@蒼玄,冰雨快要掉到@蒼玄身上時,@蒼玄快速使用@金鐘罩來抵抗攻擊
這些招式和特效,對于短劇漫劇創作者來說,簡直是最佳利器。
不同的主體也能多個疊加組合,Vidu 就能給我一個精彩的玄幻武打大片。

▲組合公式:@星野仙尊面向@鬼怪打出@降龍十八掌,場景是@戰場,@智能運鏡
近距離的雙人對打,行云流水的動作也能復刻黑客帝國了。
![]()

@ 幾下就能出片,我也能做百萬運鏡了
解決了人物的表情和動作,接著就是畫面的設計。
能控制視角,掌握觀眾的眼睛的鏡頭,是視頻內容呈現當之無愧的重要部分。其中的運鏡和構圖,運鏡能決定攝影機的運動方式,向來就是電影鏡頭語言的基礎;而構圖更是決定了畫面的景別和視角。
在 Vidu 主體社區,景別包括特寫、全景、鳥瞰、360 度展示等,構圖也有群像對峙、三分構圖、荷蘭角構圖等,鏡頭則更加豐富,包含推鏡頭、搖鏡頭、環繞鏡頭、探針鏡頭等多種運鏡方式。
我們先是從主體庫里,按照人物+風格+場景+氛圍+運鏡的方式,隨機選擇了一組提示詞,中間甚至沒有太多的連接詞,用來把這些主體連起來。最后一次性呈現出來的效果,也很有好萊塢大片的風格。

▲組合公式:@緊張壓抑氛圍,@小李子站在@停車場,鏡頭先@360度展示,再拉遠到@全景展示空蕩蕩的停車場
其中小李子就是我們自己創建的主體,上傳 1-3 張圖片,選擇對應的聲音,然后確定風格和提示詞,就能得到一個可以重復使用的人物主體。
![]()
配合 @360度展示的環繞,進一步凸顯緊張壓抑的氛圍,到鏡頭拉遠,使用@全景展示,把這種視覺沖擊力做到更強;短短五秒,充滿了戲劇張力。
除了在這種封閉空間的運鏡,Vidu 主體社區的鏡頭配置方案,在露天的無限空間里,表現同樣優秀。

▲組合公式:@背后視角@活力少女坐在摩天大樓邊緣,@無人機拉遠,@全景展現@南京城市天際線和@敬畏崇高氛圍
此外,Vidu 主體社區還提供了像@探針鏡頭這樣的特殊鏡頭軌跡,很難用自然語言描述清楚攝像機的運動路徑,現在直接直接調用主體就能幫我們快速實現微距穿梭。

▲組合公式:@鄭開開@科幻風格@太空艙場景@科技感氛圍@探針鏡頭
很多 AI 視頻往往畫質很美,動起來很假。Vidu 主體社區新增的豐富運鏡,確實比以往我們輸入提示詞,告訴 AI 攝像機如何運動,角色如何運動,要可控和容易得多。它對那些專業鏡頭語言的理解,還是比較準確。
繼續測試它對運鏡和景別的理解能力。推鏡頭是最基礎的電影鏡頭之一,從遠景緩慢推進到近景,制造情緒遞進感。我們先用傳統方式寫提示詞,「Elean 在醫院對面,天在下雨,鏡頭推進到她的臉部,然后鏡頭拉遠,從空中鳥瞰」。
先不說這個用提示詞實現的運鏡如何,沒有參考主體的純文生視頻有諸多不可控,例如畫面的風格是否過于超現實,主體的展示是否符合情境等,我們生成了好幾次,單純用提示詞的效果,幾乎都把握不好這個推進到鳥瞰的速度和效果。

▲提示詞版本,鳥瞰運鏡下,人物都消失了,不能保持在畫面中心
使用 Vidu 主體庫,我們還可以直接選擇主體社區中,已經有的人物形象,來生成視頻。同時@鏡頭庫選擇「鏡頭推進」,加上簡單的場景描述。第一次生成就出片了,從推進到拉遠,再到鳥瞰鏡頭,自然過渡。

▲組合公式:@Elean在@醫院對面,天在下雨,@鏡頭推進到她的臉部,然后再@鏡頭拉遠的@鳥瞰運鏡
這個對比很能說明問題,傳統 AI 視頻生成的「理解力」是飄忽的,同一個提示詞每次生成都像開盲盒。而主體庫相當于把這些專業概念做了標準化封裝,模型不用再去猜我們想要什么效果。
不只是好看,讓故事更有「代入感」
除此之外,在主體庫中里面的氛圍、風格和場景,決定了整個視頻的味道。
具體來說,場景能決定視頻的空間環境,風格決定視頻的整體美術風格,氛圍則是給畫面的情感色彩帶來了新的故事。Vidu 主體社區也提供了包括太空艙、醫院、森林、咖啡店、豪華宴會廳等場景,科幻、懸疑、賽博朋克、古風等風格,以及緊張壓抑、歡快、悲傷、浪漫依戀、科技感等氛圍。
我們直接把一個豪華的高級宴會廳,變成一出陰森恐怖的驚悚片,配合左右搖晃的運鏡,營造出從人物視角觀察環境的效果,增強身臨其境感。
▲組合公式:@豪華宴會廳變成@恐怖驚悚的氛圍,采用@左右搖晃的運鏡,整體是@懸疑電影風格
能通過環境的燈光來展現氛圍變化,Vidu 主體社區的其他氛圍,還能結合人物表情來呈現。
還能讓 @小李子 和 @夢露,加一個@浪漫依戀氛圍。Vidu 最后生成的視頻光影效果很好,當全景的時候,是用比較暗的下雨天氛圍,而自動推進到兩個人臉部時,畫面又自動提亮了。

▲測試公式:@群像對峙@小李子和@夢露@浪漫依戀氛圍,背景是@咖啡店
通過對這些不同分類的主體進行測試,讓我確認了一件事,多主體組合不是簡單的「功能堆疊」,Vidu 在底層做了某種協調機制,讓不同主體之間能互相配合。
這種協同感,是傳統 AI 視頻生成最缺少的。我們在提示詞里寫再多細節,模型也很難同時從里面理解到,鏡頭、氛圍、特效的平衡。
更驚喜的是,我們不僅能直接引用主體庫,來生成視頻;Vidu 這次還把這些主體,做成了一個可以分享、互動和交易的社區。
![]()
▲用戶可以上傳自己設計的主體
我們每個人都可以設計和上傳自己的主體,同時使用其他的主體,在創作和使用的過程中,Vidu 設置了資產變現模式,每一個主體都是可交易的。
配合前兩天剛剛更新的 Vidu Agent 1.0 和 Vidu Q2 參考生 Pro 模型,一方面有更自動化的工作流,開箱即用,實現一鍵成片,靈活性與便捷性完美平衡的 Agent;全新升級后的功能,支持上傳背景音樂、刪減旁白、Storyboard 編輯,內置多語言,多音色,多模特,多場景的海量素材庫等。
另一方面則是更強大的基座模型,能直接復刻不同視頻效果的 Q2 參考生 Pro。
AI 視頻生成這條路,Vidu 算是越走越明白了。
從「抽卡」到「搭樂高」
這一圈實測下來,我對 Vidu 主體社區也有了一個更清晰的判斷,它除了是一個更好的工具,能幫助我們更好地生成 AI 視頻,它更想要改變整個生成的工作模式。
傳統 AI 視頻生成是「抽卡模式」,我們寫一堆提示詞,祈禱模型能理解,然后賭概率。運氣好抽到 SSR,運氣不好全是垃圾。這種模式的問題是,創作過程不可控,專業門檻以另一種形式(說的就是提示詞工程)依然存在。
而 Vidu 主體社區是「樂高模式」,把專業元素拆解成標準化的模塊,我們只需要選擇、組合,然后生成。這種模式的核心優勢是可控性,在選擇主體時,我們就大體上知道會有什么效果,而不是單純碰運氣。
這個轉變對誰最有價值?自媒體、短劇漫劇創作者、電商營銷團隊、中小企業主,他們需要批量產出有質感的視頻內容,但沒有專業團隊和高昂預算。主體庫對他們來說,相當于花小錢雇了一個「虛擬劇組」。
![]()
▲復雜的視頻制作流程
那些獨立創作者、設計師、廣告從業者也會受益。主體庫可以補齊他們的短板,不用從零學 AE 就能搞定酷炫的鏡頭和特效。
放到更大的行業背景下看,Vidu 主體社區讓 AI 視頻生成進入了「工業化階段」的一個標志。
過去一年,AI 視頻生成的主戰場是誰的模型更強——可靈、Runway、Sora、Veo 都在比拼畫面質量、時長、一致性。但技術到了一定階段,競爭維度會轉向「怎么生成」,也就是工作流、可控性、復用性。
這種轉變,其實和 Claude Skills 的邏輯是如出一轍的。Skills 的價值不在于讓 Claude 變得更聰明,而在于讓它的能力變得可預期、可調用、可組合。用戶不再需要猜測「這次它會不會理解我的意思」,而是明確知道「我調用了這個 Skill,它就會按這個方式工作」。
![]()
▲Claude 提供的 Skills 選擇,不同的 Skill 能直接解決對應的問題
Vidu 主體庫做的也是同樣的事情。它把視頻生成從「抽卡游戲」變成了「精準指令」。這種確定性,才是真正降低門檻的關鍵。
對于真正有想法、有審美、有敘事能力的創作者來說,這其實是好事。他們終于不用被技術門檻卡住,可以把精力集中在真正重要的部分。
換句話說,Vidu 全新的主體社區,它能幫我們實現一個完美的推鏡頭,但不能幫我們決定這個推鏡頭,應該出現在故事的哪個節點、推進速度應該配合什么樣的情緒節奏、這個鏡頭和前后鏡頭如何形成敘事張力。
![]()
▲主體社區包含的部分主體
這些決策,依然需要我們人類創作者的判斷力和審美。
當然,它現在還有一些可以進步的空間,8 秒限制、主體庫覆蓋度,但這些都是可以迭代優化的。更重要的是,Vidu 主體社區開了一個頭,證明了「標準化 + 可組合」這條路是走得通的。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.