還有人記得Sora2嗎?
OpenAI內部因為Gemini上線兩周讓GPT日活躍用戶下降了6%急到拉紅色警報,
我找到了這個報告的源頭,這6%里面包括了Sora2,發布不到一個月失去了 App Store 的榜首位置。
App的合拍玩法是很新穎,但最近用sora2的速度慢到離譜。本來清晰度就不高,人物一致性還時不時出點bug。原生帶音效的視頻模型選擇真不多,今天,這個名單里又要多一個名字了,
PixVerse新上線的V5.5視頻模型。
先看我只roll了一次就跑出來的視頻,
生成效果既有切鏡,又有音效,還能說話,還有劇情,而且重要的是用的是PixVerse的自研模型,
咱們又趕上來了!
如果有一路看我成長的老粉可能會知道,兩年前最最最最開始的時候我們做的第一個完整AI視頻用的就是Pixverse,
要知道那個時候搓一個兩分鐘的視頻要花我十幾天的時間。
可以說是,那個時候在一水的視頻模型還沒有嶄露頭角的時候,PixVerse先亮相了,說實話可以算的上是我的AI視頻啟蒙。
然而直到今天,PixVerse最新版本的V5.5已經能在prompt中直接控制音效、臺詞、音色、音樂、鏡頭直出視頻,甚至我們也可以給出不明確的指令,看看PixVerse能給到什么驚喜。
比如我隨便給一句提示語“小貓講笑話”
它就給我一段自己腦補出的小笑話,說實話,我真的笑了,這就是AI的腦洞!
用了幾天這個V5.5版本,簡單總結一下它的優勢就是,
快(1080p生成速度1分鐘)
好(完整視頻一鍵直出)
省錢(高性價比音畫同出視頻生成)
既然已經說到這里了,必然得帶大家全面的來看看效果啦,前方一大波case來襲!
GOGOGO!
這里我用的是Piverse國內版拍我AI, pai.video
首先,PixVerse目前支持的功能有很多,圖片、視頻、視頻編輯、特效等等等等一應俱全,
![]()
而且圖像生成這里接入了BananaPro,生成圖片后可以直接跳去生成視頻,非常方便
![]()
這里我還有一個生圖小技巧,平時生成圖片即使使用“動漫風格”的關鍵詞也很難把所有圖片都固定到完全相同的畫風上,但你又想生成的圖片盡可能保持同一種風格時,可以在PixVerse中得到想要的圖片后復制它的種子值,
![]()
然后在下一張圖片時使用關鍵詞“動漫風格”+同一種子值的方法,就能得到風格非常相似的畫面了。
![]()
然后在生成視頻時,如果有具體的想法就可以把每一個分鏡頭的描述都寫進去,左側參數框內可以根據自己的需要進行選擇打開的功能選項,最長可以生成10s的視頻。
![]()
一部制作精良、畫面清晰流暢的大制作動畫電影
[00:00]
戴著破損飛行頭盔的宇航員男子從墜毀的飛船殘骸中艱難爬出,呼出一口在頭盔內形成白霧的熱氣。
[00:02]
鏡頭切到他的側面特寫,他緩慢踏入一片發著微光的外星巖石峽谷,腳步踩過時,地面的熒光紋路像水波一樣向四周擴散。
[00:04]
鏡頭切換到仰拍,峽谷兩側高聳的巖壁上長著半透明的晶體藤蔓,藤蔓內部有光點流動,如同緩慢流淌的星河。
[00:06]
鏡頭切到前方遠景,宇航員走出峽谷,來到一片巨大的外星遺跡廣場中央,廣場正中漂浮著一塊黑色立方體石碑,緩慢旋轉。
[00:08]
鏡頭切到立方體石碑的極近特寫,石碑表面突然亮起復雜的金色符文,符文像程序一樣快速滾動,照亮宇航員的頭盔面罩。
[00:10]
鏡頭切換為超廣角遠景,整片外星遺跡從地面緩緩升起,周圍沙海像潮水般退去,露出一座龐大的懸浮城市骨架,懸浮城市下方環繞著明滅閃爍的能量光環。
于是我就可以得到這樣一段視頻,每一個鏡頭都完美對應上了我的提示語內容,畫面一致性很高,音效和畫面內容也相當匹配,而且這是一次生成的效果,PixVerse你在做多鏡頭上的權威我現在是體驗到了。
不僅如此,讓PixVerse說中文也是很簡單的事情,比如前段時間Sora2的街頭采訪是不是AI的抽象視頻非常火,我現在隨便用PixVerse就能做個同款,而且生成速度還嘎嘎快,不到兩分鐘就有了下面的效果,這味兒太對了。
傍晚的城市街頭,霓虹燈閃爍。一個手持麥克風的年輕記者站在原地采訪一個路人,鏡頭是紀錄片風格,非常真實的現代街頭,記者問:“你什么時候知道自己是AI的?”
路人微笑說:“當我發現我的手可以冒火,我還不嫌燙的時候。”
路人一邊說一邊張開手掌,手心開始冒出一團火焰,路人表情正常,記者發出“哇”的驚呼。
背景是人群照常行走,無人驚訝。
再有就是可以利用分鏡的能力完成一個小型產品廣告片的創意,這個分鏡切換是真心絲滑,配音位置和鏡頭都能匹配的上,產品的一致性保持的也很好,結尾也能寫上正確的文字。
但小小的遺憾是目前寫實風格的衍生鏡頭還是留有一些文生圖帶來的細節不細膩,后續期待一個畫面質感的再提升。
一只手緩慢舉起圖中的香水瓶,瓶內液體在燈光下微微晃動。一個男聲說:“MASION MAGALA。”
鏡頭切至下一場景:?一個中近景鏡頭,一位短發女子,身穿白色襯衫疊穿焦糖色風衣,站在昏黃街燈照亮的街角櫥窗前,她將香水輕輕噴在自己耳后。噴霧的“嗤——”聲清晰可聞。男聲繼續說:“一款,為夜色而生的香水。”
鏡頭切至下一場景:下雨天夜晚,雨水打在樹葉上,樹影中間透出街燈微弱的光線,人在街上行走,整體是非常舒適的氛圍。男聲說:“有雨后的空氣,有街燈下的呢喃。”
鏡頭切至下一場景:?一個特寫鏡頭,女子停下腳步,閉上眼淺淺一笑,抬頭感受從上方斜灑下來的暖金色與冷藍色交織的光線,光線在她的側臉和鎖骨間勾出柔和輪廓。男聲繼續說:“也有,你不愿忘記的那一刻。”
鏡頭切至下一場景:?香水瓶保持在純黑色背景中央,瓶身亮起柔和輪廓光。畫面上方出現簡潔的白色文字“MASION MAGALA”,男聲繼續說“你記憶深處的味道。”
那既然產品宣傳片都能做的話,我也可以讓一個模特穿上一套衣服不停的擺出pose來展示衣服,還可以切換鏡頭展示衣服的細節,這些PixVerse都能自動完成。
一段模特展示服裝的快剪視頻,不斷切換鏡頭展示衣服的細節和整體,模特擺出不同的pose,電商視頻,背景有輕快的音樂
或者我可以直接讓PixVerse自己給我做一段懸疑電影的預告片,它自己設計分鏡,設計劇情,這個氛圍確實足足的!
一段電影風格的視頻,用于展示一部驚悚片的預告片。運用快速剪輯營造緊張氣氛,視頻結尾加入電影標題。配以懸疑緊張的音樂。
我也可以給小貓設計一段劇情短視頻,感覺分分鐘可以做一個系列短劇集了,我自己就做了兩集出來,養貓人誰懂一早上醒來,紙巾盒遙控器什么的都被推到地上的痛啊!
鏡頭1: 小貓站在桌子上,左看右看桌子上的東西,
鏡頭2: 特寫,貓把遙控器、水杯,紙巾盒全都推到地上
鏡頭3: 主人進門,看見一地狼藉,愣住
鏡頭4:貓已經乖乖坐在沙發上,微微仰頭,一臉無辜地眨眼,張嘴說:“誰?我?我可沒動你的東西。”
鏡頭1: 小貓端坐在書桌前,對著打開的筆記本電腦,雙爪搭在鍵盤上,像個加班員工認真打字。
鏡頭2: 鏡頭切換,特寫,貓忽然像想起什么似的,抬起一只爪子,極其嚴肅地在鍵盤上“啪啪啪”亂敲一通,然后用另一只爪子按下回車鍵,之后跑走了。
鏡頭3:鏡頭切換,主人一臉震驚的表情
鏡頭4:貓已經優雅地躺在沙發上,一臉淡定的說:“今天的遠程辦公,也圓滿完成了。”
說實話,我挺慶幸現在不僅僅只有一個Sora 2。
如果AI視頻的世界里只有一家獨大,
那我大概率只能等著被擠牙膏,一年發一版。
但現在是PixVerse、Wan、Kling這些模型在瘋狂內卷。
影響是潛移默化的,
我現在做AI視頻沒聽到聲音我都有點不習慣,
而在半年前,讓我做1分鐘Veo3的有聲AI視頻我還肉疼到齜牙咧嘴的。
話都說到這份上了,
許個愿吧,
來個視頻模型把剪輯特效字幕ArollBroll都做了吧,
我不挑的。
@ 作者 / 卡爾 & 阿湯
最后,感謝你看到這里如果喜歡這篇文章,不妨順手給我們點贊|在看|轉發|評論
如果想要第一時間收到推送,不妨給我個星標
更多的內容正在不斷填坑中……
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.