網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

實(shí)測 PixVerse V6 暴力出片：快，才是最貴的

2026-03-31 10:02:52　來源: AppSo

廣東舉報(bào)

分享至

我輸入了一段 prompt，按下生成。手還擱在鍵盤上呢，視頻已經(jīng)出來了。

畫面前景是一杯冒著熱氣的黑咖啡，背景模糊；隨后焦點(diǎn)平滑轉(zhuǎn)移，清晰展現(xiàn)出背景中一位翻閱舊書的女孩。

改了兩個詞，把光線方向調(diào)了一下，再按一次。又出來了，質(zhì)感沒掉。提示詞寫得很隨意，就是腦子里的畫面用大白話說了一遍，沒有刻意堆關(guān)鍵詞，模型全聽懂了。

提示詞：前景是一杯正在冒著熱氣的黑咖啡，占據(jù)畫面主導(dǎo)位置，背景模糊。隨后，鏡頭焦點(diǎn)自然地轉(zhuǎn)移到背景中，清晰地展現(xiàn)出一位正在翻閱舊書的女孩。

這是 PixVerse V6 給我的第一感受。不是「效果好」三個字能概括的，準(zhǔn)確說是「這個效果，居然這個速度就出來了」。

PixVerse 出片快，這件事圈里不算新聞。大多數(shù) AI 視頻工具還在用排隊(duì)考驗(yàn)?zāi)托牡臅r候，PixVerse 已經(jīng)是同類里生成速度最快的選手。在 Artificial Analysis 的視頻生成模型排行榜上，PixVerse V6 更是處在第一梯隊(duì)。

不過如果 V6 只是「更快了一點(diǎn)、畫質(zhì)更好了一些」，那它只是一次常規(guī)迭代，不值得單獨(dú)拿出來聊。

V6 做的事情，是把「快」從一個技術(shù)參數(shù)，變成了一種創(chuàng)作層面的結(jié)構(gòu)性優(yōu)勢。指令理解強(qiáng)了，提示詞不用反復(fù)打磨；畫質(zhì)也更穩(wěn)了，這些環(huán)節(jié)省下來的時間疊在一起，比單純的生成速度提升值錢得多。

換句話說，當(dāng)出片質(zhì)量夠穩(wěn)定、速度夠快，創(chuàng)作者的瓶頸就不再是工具，而是想法本身。AI 沒有讓創(chuàng)作者貶值，它反而讓好想法比以前更值錢了。

不只是快，每一幀也經(jīng)得起放大看

PixVerse V6 的操作本身沒有任何門檻，新手也能輕松上手。

打開拍我 AI，在輸入框里用自己的話描述想要的畫面，選好分辨率、畫面比例和時長，點(diǎn)生成就行。支持 360P 到 1080P 輸出，橫屏豎屏都能選，單次生成時長可以自己控制。

附拍我 AI 網(wǎng)頁端地址： https://pai.video

V6在指令理解上有了肉眼可見的進(jìn)步，只需簡單描述創(chuàng)作意圖就足夠，無需堆砌專業(yè)術(shù)語，它明白你要的是什么光線、什么氛圍、什么景別，這也導(dǎo)致省下的不僅是時間，還有反復(fù)推敲提示詞的精力。

也支持上傳參考圖。想還原某個風(fēng)格、想鎖定角色長相，把圖扔進(jìn)去就行，模型會參照著生成。

演示生成過程

V6 最讓我意外的進(jìn)步在于物理仿真。

我試了一段微距鏡頭。金黃色蜂蜜緩慢滴落，拉出晶瑩的絲線，落在松餅上緩緩散開。絲線被重力拉細(xì)，接觸面的擴(kuò)散速度也和蜂蜜的黏度匹配。

它有重量，有重力，有因果。

提示詞：微距鏡頭。高粘度的金黃色蜂蜜正緩慢地從木質(zhì)攪拌棒上滴落，拉出長長的、晶瑩剔透的絲線，最后重重地落在下方剛出爐的松餅上，蜂蜜在接觸面緩緩散開。畫面具有極強(qiáng)的真實(shí)物理運(yùn)動邏輯。

以前 AI 視頻里的物理世界是「會動的像素」，V6 里的物體在遵守物理定律。這一點(diǎn)的意義超出視覺層面。我們判斷一個畫面真不真，靠的是一種直覺：這杯水倒出來的方式對不對？這滴蜂蜜落下的軌跡合不合理？V6 在這個層面上交出了一份像樣的答卷。

物理仿真解決的是世界真不真實(shí)，而人像質(zhì)感解決的是人的質(zhì)感對不對。

這是 AI 視頻最容易翻車的科目。稍有不慎就是恐怖谷。五官精致但表情僵硬，皮膚光滑但質(zhì)感像硅膠，眼睛很亮但眼神沒焦點(diǎn)。你能認(rèn)出這是一張臉，但直覺會告訴你，這不是一個人。

V6 在這方面讓我重新有了新的審視。一些圈內(nèi)創(chuàng)作者拿它和 Seedance 放在一起比，結(jié)論基本是：兩者互有勝負(fù)，很難說誰壓過誰。

我試了一段中年男性演員的面部特寫，他正努力克制哭泣的沖動，淺景深，柔和側(cè)光。出來的結(jié)果很難讓人移開視線。鼻翼輕微顫動，眼角濕潤，這幾個動作之間有時間差，有層次，有內(nèi)在邏輯。

這種微表情的層次感，讓人物開始有了一種 AI 演員的即視感。對比之下，以前 AI 人像的情緒更接近「狀態(tài)切換」，V6 里的情緒有了過程。皮膚質(zhì)感的取向也值得單說——肌理，毛孔、細(xì)紋、光線下的皮膚色差都保留。

打斗戲是 AI 視頻的體能測試。

拳頭要打在正確位置，被打的人要有合理反應(yīng)，身體運(yùn)動慣性要連貫，多角色空間關(guān)系不能穿模。任何一個環(huán)節(jié)崩了，就變成搞笑視頻。許多 AI 視頻模型的生成結(jié)果要么是兩個人在做體操，要么揮拳的手臂穿過了對方的臉。

在體驗(yàn) V6 的過程中，我生成了一段大雨滂沱的泥濘小巷里，兩名武術(shù)高手正在激烈近身肉搏的場景。一記重拳擊中對方下顎，雨水和汗水隨沖擊飛濺，受擊者的面部肌肉因沖擊力產(chǎn)生真實(shí)的震顫。

畫質(zhì)之外，真正讓我興奮的是 V6 補(bǔ)齊了一套鏡頭語言能力。

變身特效方面，我生成了一臺科技感極強(qiáng)的機(jī)械無人機(jī)在空中急速飛行，隨后快速從金屬形態(tài)幻化為一條由流動墨水和水墨線條組成的、散發(fā)幽藍(lán)光芒的水墨神龍。

提示詞：中國風(fēng)動漫風(fēng)格，無人機(jī)在飛行過程中快速從金屬形態(tài)幻化為一條由流動的墨水、墨點(diǎn)和水墨線條組成的、散發(fā)著幽藍(lán)光芒的水墨神龍。

過渡自然，沒有常見的像素閃爍和邊緣殘影。金屬的硬度和水墨的流動之間有一個過渡狀態(tài)，兩種質(zhì)感都沒有被粗暴切斷，整個變身過程更接近融合，而非替換。

運(yùn)鏡能力同樣有驚喜。電影級航拍視角下，一臺無人機(jī)在廢棄的、生銹的工業(yè)廠房內(nèi)部急速穿行。廠房的空間感、金屬質(zhì)感的光線處理、高速運(yùn)鏡時畫面的穩(wěn)定性，三件事同時做到位，沒有出現(xiàn) AI 常見的那種「不知道該看哪」的混亂感。

提示詞：電影級航拍視角，現(xiàn)實(shí)主義風(fēng)格。一臺無人機(jī)在廢棄的、生銹的工業(yè)廠房內(nèi)部急速飛行。

還有一個方向是子彈時間。黑客帝國式的視角旋轉(zhuǎn)，主體定格，背景動態(tài)延續(xù)。這類鏡頭對時間感的控制要求很高，稍有偏差就會變成慢放，V6 處理得比較克制，速度分層是有的，沒有用力過猛。

我還試了兩個對空間穿越要求更高的場景。第一個是課堂。無人機(jī)視角從走廊切入教室，鏡頭跟著這股氣流穿出教室，拉到整個校園上空。試卷和白紙被氣流卷起，滿天都是，運(yùn)鏡軌跡卻沒有斷。

第二個是蜜蜂從窗縫擠進(jìn)來，穿過臥室、客廳，找到廚房里的蜂蜜罐再飛出。每個房間光線和景深都不同，換場時蜜蜂飛行慣性有輕微滯后，和真實(shí)昆蟲的節(jié)律對得上。

多鏡頭切鏡可能是對實(shí)際工作流貢獻(xiàn)最大的能力。一段時尚女裝廣告短片，三個鏡頭的銜接流暢，色調(diào)溫暖統(tǒng)一，沒有 AI 的拼湊感。

還有三個我比較喜歡的運(yùn)鏡和場景調(diào)度的測試。

比如一架紙飛機(jī)在維多利亞式書架間起飛，書本跟著騰空排成隧道，隨后場景切進(jìn)腦內(nèi)微觀世界，神經(jīng)元在半透明星云狀組織里閃著熒光，像縮小版的銀河系。

同樣是紙飛機(jī)在圖書館迷宮里做非線性飛行，俯沖、側(cè)滑、擦邊過障礙，鏡頭緊緊跟隨，轉(zhuǎn)彎時有強(qiáng)烈的側(cè)滑感，沒有糊掉。

前腳還是琥珀暖色的圖書館，進(jìn)入腦內(nèi)世界后立刻切成深藍(lán)和深紫，但因?yàn)檫\(yùn)鏡沒有斷，切換反而變成了一種視覺沖擊，并不突兀。

這些能力單拿出來每一項(xiàng)都是加分項(xiàng)。組合在一起，意味著 V6 開始具備完整的鏡頭語言能力了。

最后一個讓我印象深刻的點(diǎn)，不是畫面，是聲音。

V6 在開啟 Audio 之后，音頻適配有了明顯增強(qiáng)。我試了一段微縮模型視角的場景：遠(yuǎn)處火山正在噴發(fā)，小人國村民四散奔逃，一只巨大的手拿著透明碗從天而降，將整個村莊罩住，透明碗落下的瞬間帶著空氣被壓縮的細(xì)微震動。

特別是 ASMR 類場景。下雨天的窗戶、篝火噼啪聲、書頁翻動。這些畫面本身就追求沉浸感，音頻質(zhì)量直接決定你是在看視頻還是沉浸在場景里。

一個人暴力出片叫效率，一群人暴力出片叫生產(chǎn)力

如果 V6 只是一個更快更好的 AI 視頻模型，故事到這里可以收尾了。但 PixVerse 顯然不打算只講到這里。

據(jù)了解，這次還同步上線了兩個東西：Team Plan 和 Mini Apps。

Team Plan 是給 2 到 15 人的工作室用的。核心機(jī)制很簡單，團(tuán)隊(duì)共享一個積分池。

不再是每人一個賬號各算各的，而是整個團(tuán)隊(duì)統(tǒng)一消耗，按角色分配權(quán)限。老板看全局，創(chuàng)意總監(jiān)管項(xiàng)目分組，剪輯師專注出片。個人空間的素材和模板一鍵同步到團(tuán)隊(duì)空間，不用在群里來回傳文件。

聽起來不復(fù)雜，但解決的問題很真實(shí)。以前工作室用 AI 視頻工具，就是每人開各自的賬號，出了好素材在群里互傳，版本管理靠文件命名加日期。這跟十年前用 U 盤傳 PPT 沒什么本質(zhì)區(qū)別。

Team Plan 做的事情，就是把 AI 視頻從個人工具升級成了團(tuán)隊(duì)生產(chǎn)線。一個人連出十條挑最好的叫個人效率，五個人各出十條，五十條里挑一條炸裂的，叫團(tuán)隊(duì)生產(chǎn)力。

Mini Apps 走的是另一條路。使用方式簡單到不需要解釋：上傳幾張商品圖，系統(tǒng)自動幫你剪成一條完整的廣告視頻。不用懂剪輯，不用知道什么叫鏡頭語言。

一個淘寶店主、一個小紅書博主、一個街邊奶茶店老板，都能在幾分鐘內(nèi)拿到一條可以直接發(fā)的產(chǎn)品視頻。

V6 模型是給創(chuàng)作者的武器，Mini Apps 是給所有人的傻瓜相機(jī)。當(dāng)創(chuàng)作門檻被壓到零，暴力出片就不只是創(chuàng)作者的方法論了，它變成了人人能用的基礎(chǔ)設(shè)施。

快，才是最貴的畫質(zhì)

畫質(zhì)夠好，速度夠快，成本這道關(guān)也值得單獨(dú)說一說。

720p 分辨率常態(tài)成本大概為每秒 0.04 美元，放在當(dāng)前市場里已屬低位，對應(yīng)的卻是第一梯隊(duì)的生成質(zhì)量，4 月 7 日前購買會員至高打七折，生成時積分消耗再減免 30%，進(jìn)一步把規(guī)模化出片的成本壓了下來。

這讓我想到攝影從膠卷到數(shù)碼的變化。

膠卷時代一卷 36 張，按一次快門前得在腦子里構(gòu)圖三分鐘，因?yàn)槊恳粡埗加谐杀荆扉T本身的質(zhì)量沒有區(qū)別。數(shù)碼時代的攝影師怎么拍？因?yàn)槊恳粡埗记逦⒍級蛴茫钥梢赃B拍 200 張，事后選構(gòu)圖最好的那張。沒人會說這「不嚴(yán)肅」，因?yàn)樽罱K給觀眾看的永遠(yuǎn)是那張最好的。

V6 讓 AI 視頻創(chuàng)作進(jìn)入了這種「數(shù)碼時代」。

而 PixVerse 對「快」的理解，也早已超出了生成速度本身。

從早期的高速生成，到 R1 的實(shí)時交互，到 V6 的強(qiáng)指令理解讓描述變得更自然，再到 Team Plan 把協(xié)作效率拉到團(tuán)隊(duì)量級，這條線串起來，體現(xiàn)的是 PixVerse 在多個維度上同時提速：生成速度快、指令理解準(zhǔn)確、協(xié)作效率提升。

支撐這一切的，是 PixVerse 扎實(shí)的模型迭代能力。

能在排行榜上持續(xù)保持第一梯隊(duì)，靠的是每一代產(chǎn)品都在扎實(shí)啃硬骨頭，物理仿真、人像質(zhì)感、鏡頭語言，每一項(xiàng)都是難而正確的方向。V6 的初衷很純粹：讓創(chuàng)作者把精力放在創(chuàng)意上，其余的交給工具。

當(dāng)一個工具把高質(zhì)量的生成變成了觸手可及的日常，又把使用門檻壓到零、把協(xié)作效率拉到團(tuán)隊(duì)級別，它就不再只是一個「模型」了。它正在變成內(nèi)容時代的基礎(chǔ)設(shè)施。

PixVerse V6 開啟了 AI 視頻的暴力出片時代，快到不講道理，好到能直接交片。

這個時代才剛開始。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.