可靈2.5,來了。
不僅已經對可靈的超級創(chuàng)作者們正式進行灰度內測,還在這個周末,登上了釜山國際電影節(jié)。
![]()
我其實已經很久很久沒做過小片子了,在前幾天拿到可靈2.5的體驗資格以后,試了一下,居然,又激起了我的一些創(chuàng)作欲望。
就,我自己是非常喜歡科幻、非常喜歡動作、也非常喜歡一些張力很足的動作戲的。
這些,是過往幾乎所有的AI視頻模型,都不太行的東西。
但,可靈2.5,不說媲美那種動作大片,但是,還是把AI視頻在動作和表演上,又拉到了一個新的高度。
我也花了一整天的時間,用可靈2.5,手搓了一個AI版《速度與激情》,做了一個小片子,更直觀的感受一下,可靈2.5在動作戲上的實力。
這里面可以說是集齊了我從十五歲到現(xiàn)在喜歡的所有視覺效果,腎上腺素飆升的追車戰(zhàn),經費燃燒的爆炸大場面,拳拳到肉的打戲,超級酷炫的漂移,等等等。
而這些效果,現(xiàn)在,可靈能以一己之力,給我都實現(xiàn)了,如果在24年,這就是不可能想象的。。。
從這個小片子,大家應該就能感受到,可靈2.5的能力圈了。
我把他總結成兩塊:
運動的超進化,表演的超進化。
一塊一塊來說。
一.運動的超進化
先用一個case,讓你們直觀感受一下可靈2.5的進步到底有多大。
提示詞:電影大片風格,一個身穿黑衣,頭戴面具的金發(fā)女特工破窗而出,借助升降繩迅速滑落在地,然后飛速跑到準備好的摩托車旁,鏡頭跟隨女特工運動。然后女特工跨上摩托車,在街道上飛馳,周圍的景物因高速運動而動態(tài)模糊,采用令人眩暈的高速鏡頭,低機位拍攝,突出女特工的速度感和力量感。
可靈2.5,非常絲滑地銜接了下落、奔跑、騎摩托幾個動作,最后飛馳而去。
還顧及到了破窗時玻璃渣散落,落地時蹲一下緩沖,這種極具真實感的細節(jié)。
整個看下來真的很爽。

而可靈2.1,只能保持人物基本不崩壞,但所有與環(huán)境交互的細節(jié),全都糊掉了。
下降到一半繩子不知所蹤,說好的高空速降變成了一樓跳窗,摩托車憑空出現(xiàn)在大馬路上,跨上摩托的動作也是錯的。

再來看一個栗子。
提示詞:霓虹都市背景,車輛爆炸,火光四起,黑衣特工從車中飛躍而出,翻滾落地,然后迅速爬起,左手右手同時舉槍開火,鏡頭跟隨特工運動,最后環(huán)繞特工360度旋轉。
可靈2.5就一個字,穩(wěn)。人物的動作穩(wěn),運鏡也穩(wěn)。

而可靈2.1看起來,就有種很忙、但不知在忙什么的感覺。

再來看一個跑酷的case。
提示詞:鏡頭高速跟隨,一個機甲在霓虹閃爍的賽博都市樓頂跑酷,靈活翻越金屬欄桿,在大樓之間跨越,動作迅捷流暢。
可靈2.5的機器人跑酷過程中的動作和交互,相當真實。
甚至完全不需要做首尾幀,只要輸入提示詞,它就可以自動給你補全所有運動畫面。
直接靠文生視頻能達到這樣的效果,我真的跪了。

而這是可靈2.1,會不受重力控制地,逐漸飛天。

這么看下來,你們應該知道,可靈2.5的運動能力相比2.1到底提升多少了。
再來欣賞幾個可靈2.5跑出來的case。
我真的很喜歡這個跑酷的感覺,機器人動作和鏡頭運動配合得特別好。

還有這個第一視角跟隨鏡頭,我在提示詞里讓它猛然加速,它真的做出了那種急迫感。
提示詞:他跨上最后一級臺階沖出地鐵口,逆光里捕到前方那道模糊人影正要拐走,他猛地加速追過去,鏡頭跟隨。

讓可靈2.5生成各種運動鏡頭,效果也賊好。
讓它滑雪,它給你來套空翻,還會摸雪,呲雪墻,耍酷耍得停不下來。

玩滑板速降,效果幾乎可以媲美《白日夢想家》原片。

打籃球,投籃已經是小case了,直接給你來場籃球賽。

還可以飆車。

在廢土世界開裝甲車。

在陌生的星球上開飛行器。

滿足各種奇幻腦洞也不在話下。
和小鹿一起闖進魔法森林。
走在路上突然被吸入時空圓環(huán)。
二.表演的超進化
之前的可靈2.1不是不能做表情,而是表情做的不夠準確。
拿下面這個case來舉例。
提示詞:他眉心忽然鎖死、眼神由散到準、然后下一秒對著電話怒吼,隨后憤怒的掛斷電話,隨后用手搓著自己臉,告訴自己要冷靜。
男人有一個從憤怒到克制的過程,可靈2.5比較自然地完成了這個轉變。

而可靈2.1,基本就是一個全程超雄的狀態(tài)。
用稍微專業(yè)點的話來說就是,表演沒層次。

下面這一組對比也很明顯。
提示詞:女人暗中觀察著自己的殺父仇人,帶著濃濃的的恨意,鏡頭推進到女人的臉部特寫,女主感覺對方已經在自己的掌握之中,馬上就要復仇成功,臉上露出淡淡的笑意。
女主是一個躲在暗處、勝券在握的殺手,她的笑應該是淡淡的,不動聲色的,但給人一種不寒而栗的感覺。
可靈2.5這個陰惻惻的笑,就很對味。

而可靈2.1,我懷疑它沒理解淡淡的笑這四個字,牙花子都笑出來了。
這怕是還沒復仇成功,自己就先被仇人發(fā)現(xiàn)了。

除了表情做得太過之外,表情太粗糙也是一個問題。
拿這個拳擊手的例子來說。
提示詞: 克林頓伊斯特伍德風格,一名拳擊手被擊倒在地,鏡頭360度旋轉,定格在拳擊手的臉部特寫鏡頭,他滿臉傷痕,暈眩,疲憊,近乎絕望。但是,他深吸了一口氣,咬緊牙關,用手撐著顫抖的身體,一點點站了起來。晃動鏡頭跟隨。眼神變得堅定,帶著不屈的力量。
可靈2.5這里,你能感受到這個拳擊手非常虛弱,但還是掙扎著站起來,繼續(xù)應戰(zhàn)。

而可靈2.1,怎么說呢,感覺就是一個傻大個,噌的一下站起來了。
太直白了,感受不到情緒。

看到這里你們應該也能感受到,可靈2.5對于不同層次情緒的理解和表達,有怎樣的提升了。
再來看幾個case。
好萊塢老電影,兩個歡喜冤家斗嘴,女主這個無語的翻白眼,還有男主手足無措的樣子,太真實了,就很搞笑。

劇烈的爆炸映亮了女主的臉,女主的愛人和家園都毀掉了,但她不能回頭,必須繼續(xù)戰(zhàn)斗。

受了重傷的男人捂著自己的胸口,大口吸氣,強撐著不讓自己倒下。

古靈精怪的女孩看著攝像頭燦爛一笑,卻發(fā)現(xiàn)對面的人沒有回應,有點失落地收起了自己的表情。

李白在白帝城得知了自己被赦免的喜訊,又哭又笑,喜極而泣。

女孩在幻境里看到了平生從未見過的奇觀,她目不轉睛地看著,悲欣交集。

一個男人剛剛得知自己母親的死訊,在無人處悲慟哭泣。

總結一下可靈這次更新。
運動能力、表演能力毫無疑問地又卷上了一個新高度。
除此之外,文生視頻的能力也提升了一大截,我這些case里面有至少一半,都是只靠提示詞生成出來的。
在理解能力上有巨幅提升,很多以前理解不了,因果關系和細節(jié)不到位的問題,都能解決了。
不愧我之前叫它,人民的可靈。
其實我覺得,可靈的野心,一直都是讓更多年輕的創(chuàng)作者,擁有更多屬于自己的創(chuàng)作自由,不需要被團隊和資金所束縛,也能在專業(yè)領域獲得自己的一席之地。
讓我們,期待可靈的下一次進化。
以上,既然看到這里了,如果覺得不錯,隨手點個贊、在看、轉發(fā)三連吧,如果想第一時間收到推送,也可以給我個星標?~謝謝你看我的文章,我們,下次再見。
>/ 作者:卡茲克、水杉
>/ 投稿或爆料,請聯(lián)系郵箱:wzglyay@virxact.com
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.