我輸入了一段 prompt,按下生成。手還擱在鍵盤上呢,視頻已經(jīng)出來了。
畫面前景是一杯冒著熱氣的黑咖啡,背景模糊;隨后焦點(diǎn)平滑轉(zhuǎn)移,清晰展現(xiàn)出背景中一位翻閱舊書的女孩。
改了兩個詞,把光線方向調(diào)了一下,再按一次。又出來了,質(zhì)感沒掉。提示詞寫得很隨意,就是腦子里的畫面用大白話說了一遍,沒有刻意堆關(guān)鍵詞,模型全聽懂了。
![]()
提示詞:前景是一杯正在冒著熱氣的黑咖啡,占據(jù)畫面主導(dǎo)位置,背景模糊。隨后,鏡頭焦點(diǎn)自然地轉(zhuǎn)移到背景中,清晰地展現(xiàn)出一位正在翻閱舊書的女孩。
這是 PixVerse V6 給我的第一感受。不是「效果好」三個字能概括的,準(zhǔn)確說是「這個效果,居然這個速度就出來了」。
PixVerse 出片快,這件事圈里不算新聞。大多數(shù) AI 視頻工具還在用排隊(duì)考驗(yàn)?zāi)托牡臅r候,PixVerse 已經(jīng)是同類里生成速度最快的選手。在 Artificial Analysis 的視頻生成模型排行榜上,PixVerse V6 更是處在第一梯隊(duì)。
![]()
不過如果 V6 只是「更快了一點(diǎn)、畫質(zhì)更好了一些」,那它只是一次常規(guī)迭代,不值得單獨(dú)拿出來聊。
V6 做的事情,是把「快」從一個技術(shù)參數(shù),變成了一種創(chuàng)作層面的結(jié)構(gòu)性優(yōu)勢。指令理解強(qiáng)了,提示詞不用反復(fù)打磨;畫質(zhì)也更穩(wěn)了,這些環(huán)節(jié)省下來的時間疊在一起,比單純的生成速度提升值錢得多。
換句話說,當(dāng)出片質(zhì)量夠穩(wěn)定、速度夠快,創(chuàng)作者的瓶頸就不再是工具,而是想法本身 。AI 沒有讓創(chuàng)作者貶值,它反而讓好想法比以前更值錢了。
不只是快,每一幀也經(jīng)得起放大看
PixVerse V6 的操作本身沒有任何門檻,新手也能輕松上手。
打開拍我 AI,在輸入框里用自己的話描述想要的畫面,選好分辨率、畫面比例和時長,點(diǎn)生成就行。支持 360P 到 1080P 輸出,橫屏豎屏都能選,單次生成時長可以自己控制。
附拍我 AI 網(wǎng)頁端地址: https://pai.video
V6在指令理解上有了肉眼可見的進(jìn)步,只需簡單描述創(chuàng)作意圖就足夠,無需堆砌專業(yè)術(shù)語,它明白你要的是什么光線、什么氛圍、什么景別,這也導(dǎo)致省下的不僅是時間,還有反復(fù)推敲提示詞的精力。
也支持上傳參考圖。想還原某個風(fēng)格、想鎖定角色長相,把圖扔進(jìn)去就行,模型會參照著生成。
![]()
演示生成過程
V6 最讓我意外的進(jìn)步在于物理仿真。
我試了一段微距鏡頭。金黃色蜂蜜緩慢滴落,拉出晶瑩的絲線,落在松餅上緩緩散開。絲線被重力拉細(xì),接觸面的擴(kuò)散速度也和蜂蜜的黏度匹配。
它有重量,有重力,有因果。
![]()
提示詞:微距鏡頭。高粘度的金黃色蜂蜜正緩慢地從木質(zhì)攪拌棒上滴落,拉出長長的、晶瑩剔透的絲線,最后重重地落在下方剛出爐的松餅上,蜂蜜在接觸面緩緩散開。畫面具有極強(qiáng)的真實(shí)物理運(yùn)動邏輯。
以前 AI 視頻里的物理世界是「會動的像素」,V6 里的物體在遵守物理定律。這一點(diǎn)的意義超出視覺層面。我們判斷一個畫面真不真,靠的是一種直覺:這杯水倒出來的方式對不對?這滴蜂蜜落下的軌跡合不合理?V6 在這個層面上交出了一份像樣的答卷。
物理仿真解決的是世界真不真實(shí),而人像質(zhì)感解決的是人的質(zhì)感對不對。
這是 AI 視頻最容易翻車的科目。稍有不慎就是恐怖谷。五官精致但表情僵硬,皮膚光滑但質(zhì)感像硅膠,眼睛很亮但眼神沒焦點(diǎn)。你能認(rèn)出這是一張臉,但直覺會告訴你,這不是一個人。
V6 在這方面讓我重新有了新的審視。一些圈內(nèi)創(chuàng)作者拿它和 Seedance 放在一起比,結(jié)論基本是:兩者互有勝負(fù),很難說誰壓過誰。
我試了一段中年男性演員的面部特寫,他正努力克制哭泣的沖動,淺景深,柔和側(cè)光。出來的結(jié)果很難讓人移開視線。鼻翼輕微顫動,眼角濕潤,這幾個動作之間有時間差,有層次,有內(nèi)在邏輯。
![]()
這種微表情的層次感,讓人物開始有了一種 AI 演員的即視感。對比之下,以前 AI 人像的情緒更接近「狀態(tài)切換」,V6 里的情緒有了過程。皮膚質(zhì)感的取向也值得單說——肌理,毛孔、細(xì)紋、光線下的皮膚色差都保留。
打斗戲是 AI 視頻的體能測試。
拳頭要打在正確位置,被打的人要有合理反應(yīng),身體運(yùn)動慣性要連貫,多角色空間關(guān)系不能穿模。任何一個環(huán)節(jié)崩了,就變成搞笑視頻。許多 AI 視頻模型的生成結(jié)果要么是兩個人在做體操,要么揮拳的手臂穿過了對方的臉。
在體驗(yàn) V6 的過程中,我生成了一段大雨滂沱的泥濘小巷里,兩名武術(shù)高手正在激烈近身肉搏的場景。一記重拳擊中對方下顎,雨水和汗水隨沖擊飛濺,受擊者的面部肌肉因沖擊力產(chǎn)生真實(shí)的震顫。
![]()
畫質(zhì)之外,真正讓我興奮的是 V6 補(bǔ)齊了一套鏡頭語言能力。
變身特效方面,我生成了一臺科技感極強(qiáng)的機(jī)械無人機(jī)在空中急速飛行,隨后快速從金屬形態(tài)幻化為一條由流動墨水和水墨線條組成的、散發(fā)幽藍(lán)光芒的水墨神龍。
![]()
提示詞:中國風(fēng)動漫風(fēng)格,無人機(jī)在飛行過程中快速從金屬形態(tài)幻化為一條由流動的墨水、墨點(diǎn)和水墨線條組成的、散發(fā)著幽藍(lán)光芒的水墨神龍。
過渡自然,沒有常見的像素閃爍和邊緣殘影。金屬的硬度和水墨的流動之間有一個過渡狀態(tài),兩種質(zhì)感都沒有被粗暴切斷,整個變身過程更接近融合,而非替換。
運(yùn)鏡能力同樣有驚喜。電影級航拍視角下,一臺無人機(jī)在廢棄的、生銹的工業(yè)廠房內(nèi)部急速穿行。廠房的空間感、金屬質(zhì)感的光線處理、高速運(yùn)鏡時畫面的穩(wěn)定性,三件事同時做到位,沒有出現(xiàn) AI 常見的那種「不知道該看哪」的混亂感。
![]()
提示詞:電影級航拍視角,現(xiàn)實(shí)主義風(fēng)格。一臺無人機(jī)在廢棄的、生銹的工業(yè)廠房內(nèi)部急速飛行。
還有一個方向是子彈時間。黑客帝國式的視角旋轉(zhuǎn),主體定格,背景動態(tài)延續(xù)。這類鏡頭對時間感的控制要求很高,稍有偏差就會變成慢放,V6 處理得比較克制,速度分層是有的,沒有用力過猛。
我還試了兩個對空間穿越要求更高的場景。第一個是課堂。無人機(jī)視角從走廊切入教室,鏡頭跟著這股氣流穿出教室,拉到整個校園上空。試卷和白紙被氣流卷起,滿天都是,運(yùn)鏡軌跡卻沒有斷。
第二個是蜜蜂從窗縫擠進(jìn)來,穿過臥室、客廳,找到廚房里的蜂蜜罐再飛出。每個房間光線和景深都不同,換場時蜜蜂飛行慣性有輕微滯后,和真實(shí)昆蟲的節(jié)律對得上。
多鏡頭切鏡可能是對實(shí)際工作流貢獻(xiàn)最大的能力。一段時尚女裝廣告短片,三個鏡頭的銜接流暢,色調(diào)溫暖統(tǒng)一,沒有 AI 的拼湊感。
![]()
還有三個我比較喜歡的運(yùn)鏡和場景調(diào)度的測試。
比如一架紙飛機(jī)在維多利亞式書架間起飛,書本跟著騰空排成隧道,隨后場景切進(jìn)腦內(nèi)微觀世界,神經(jīng)元在半透明星云狀組織里閃著熒光,像縮小版的銀河系。
同樣是紙飛機(jī)在圖書館迷宮里做非線性飛行,俯沖、側(cè)滑、擦邊過障礙,鏡頭緊緊跟隨,轉(zhuǎn)彎時有強(qiáng)烈的側(cè)滑感,沒有糊掉。
![]()
前腳還是琥珀暖色的圖書館,進(jìn)入腦內(nèi)世界后立刻切成深藍(lán)和深紫,但因?yàn)檫\(yùn)鏡沒有斷,切換反而變成了一種視覺沖擊,并不突兀。
![]()
這些能力單拿出來每一項(xiàng)都是加分項(xiàng)。組合在一起,意味著 V6 開始具備完整的鏡頭語言能力了。
最后一個讓我印象深刻的點(diǎn),不是畫面,是聲音。
V6 在開啟 Audio 之后,音頻適配有了明顯增強(qiáng)。我試了一段微縮模型視角的場景:遠(yuǎn)處火山正在噴發(fā),小人國村民四散奔逃,一只巨大的手拿著透明碗從天而降,將整個村莊罩住,透明碗落下的瞬間帶著空氣被壓縮的細(xì)微震動。
特別是 ASMR 類場景。下雨天的窗戶、篝火噼啪聲、書頁翻動。這些畫面本身就追求沉浸感,音頻質(zhì)量直接決定你是在看視頻還是沉浸在場景里。
一個人暴力出片叫效率,一群人暴力出片叫生產(chǎn)力
如果 V6 只是一個更快更好的 AI 視頻模型,故事到這里可以收尾了。但 PixVerse 顯然不打算只講到這里。
據(jù)了解,這次還同步上線了兩個東西:Team Plan 和 Mini Apps。
Team Plan 是給 2 到 15 人的工作室用的。核心機(jī)制很簡單,團(tuán)隊(duì)共享一個積分池。
不再是每人一個賬號各算各的,而是整個團(tuán)隊(duì)統(tǒng)一消耗,按角色分配權(quán)限。老板看全局,創(chuàng)意總監(jiān)管項(xiàng)目分組,剪輯師專注出片。個人空間的素材和模板一鍵同步到團(tuán)隊(duì)空間,不用在群里來回傳文件。
![]()
聽起來不復(fù)雜,但解決的問題很真實(shí)。以前工作室用 AI 視頻工具,就是每人開各自的賬號,出了好素材在群里互傳,版本管理靠文件命名加日期。這跟十年前用 U 盤傳 PPT 沒什么本質(zhì)區(qū)別。
Team Plan 做的事情,就是把 AI 視頻從個人工具升級成了團(tuán)隊(duì)生產(chǎn)線。一個人連出十條挑最好的叫個人效率,五個人各出十條,五十條里挑一條炸裂的,叫團(tuán)隊(duì)生產(chǎn)力。
Mini Apps 走的是另一條路。使用方式簡單到不需要解釋:上傳幾張商品圖,系統(tǒng)自動幫你剪成一條完整的廣告視頻。不用懂剪輯,不用知道什么叫鏡頭語言。
![]()
一個淘寶店主、一個小紅書博主、一個街邊奶茶店老板,都能在幾分鐘內(nèi)拿到一條可以直接發(fā)的產(chǎn)品視頻。
V6 模型是給創(chuàng)作者的武器,Mini Apps 是給所有人的傻瓜相機(jī)。當(dāng)創(chuàng)作門檻被壓到零,暴力出片就不只是創(chuàng)作者的方法論了,它變成了人人能用的基礎(chǔ)設(shè)施。
快,才是最貴的畫質(zhì)
畫質(zhì)夠好,速度夠快,成本這道關(guān)也值得單獨(dú)說一說。
720p 分辨率常態(tài)成本大概為每秒 0.04 美元,放在當(dāng)前市場里已屬低位,對應(yīng)的卻是第一梯隊(duì)的生成質(zhì)量,4 月 7 日前購買會員至高打七折,生成時積分消耗再減免 30%,進(jìn)一步把規(guī)模化出片的成本壓了下來。
![]()
這讓我想到攝影從膠卷到數(shù)碼的變化。
膠卷時代一卷 36 張,按一次快門前得在腦子里構(gòu)圖三分鐘,因?yàn)槊恳粡埗加谐杀荆扉T本身的質(zhì)量沒有區(qū)別。數(shù)碼時代的攝影師怎么拍?因?yàn)槊恳粡埗记逦⒍級蛴茫钥梢赃B拍 200 張,事后選構(gòu)圖最好的那張。沒人會說這「不嚴(yán)肅」,因?yàn)樽罱K給觀眾看的永遠(yuǎn)是那張最好的。
V6 讓 AI 視頻創(chuàng)作進(jìn)入了這種「數(shù)碼時代」。
而 PixVerse 對「快」的理解,也早已超出了生成速度本身。
從早期的高速生成,到 R1 的實(shí)時交互,到 V6 的強(qiáng)指令理解讓描述變得更自然,再到 Team Plan 把協(xié)作效率拉到團(tuán)隊(duì)量級,這條線串起來,體現(xiàn)的是 PixVerse 在多個維度上同時提速:生成速度快、指令理解準(zhǔn)確、協(xié)作效率提升。
支撐這一切的,是 PixVerse 扎實(shí)的模型迭代能力。
能在排行榜上持續(xù)保持第一梯隊(duì),靠的是每一代產(chǎn)品都在扎實(shí)啃硬骨頭,物理仿真、人像質(zhì)感、鏡頭語言,每一項(xiàng)都是難而正確的方向。V6 的初衷很純粹:讓創(chuàng)作者把精力放在創(chuàng)意上,其余的交給工具。
當(dāng)一個工具把高質(zhì)量的生成變成了觸手可及的日常,又把使用門檻壓到零、把協(xié)作效率拉到團(tuán)隊(duì)級別,它就不再只是一個「模型」了。它正在變成內(nèi)容時代的基礎(chǔ)設(shè)施。
PixVerse V6 開啟了 AI 視頻的暴力出片時代,快到不講道理,好到能直接交片。
這個時代才剛開始。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.