作者|子川
來源|AI先鋒官
卷,還得看AI視頻賽道!
前有OpenAI 的Sora2在網上掀起一場AI視頻創作熱潮,后有谷歌的Veo3.1緊隨其后!
這不,MiniMax帶著它的海螺AI也來了!
此次不僅帶來了全新的Hailuo 2.3系列視頻模型,還推出了支持全模態全能創作的 Media Agent。
簡單來說是這樣的——
Hailuo 2.3:Hailuo 2.0的升級版,據官方介紹此模型在人物動態、微表情、物理效果上都有了飛躍式的提升。同時在風格化方面,支持更多風格,輸出效果也更穩定。
Hailuo 2.3 Fast:Hailuo 2.3的“Fast”版,生成速度更快,定價更低,最高可為批量創作降低50%成本,主打一個性價比。
Media Agent:這是一個全能的多模態創作工具,只需輸入指令,它能幫你調度文生圖、圖生視頻等模型,甚至配音和背景音樂都可以搞定,從而實現了“一鍵成片”。
官方給出的Demo視頻效果確實非常頂,無論是復雜的肢體動作,還是動漫、水墨等風格化演繹,都顯得游刃有余。
不過效果到底如何,是騾子是馬,總得拉出來遛遛。
這次我們使用Hailuo 2.3和Sora 2以及可靈2.5 Turbo打個PK,看誰的效果更好。
注意,因為考慮到成本的原因,本次測試中同一提示詞每款模型均生成兩次,取效果最佳的一次進行展示。
同時,提示詞為英文,下面我會將提示詞翻譯成中文,以供大家更好的理解。
提示詞:一名專業跑酷運動員在復雜的城市廢墟中進行一系列高難度跳躍,包括翻轉、跟隨鏡頭動作,保持主體清晰,動作極其流暢自然,符合真實物理重力,具有電影感,4K高清。
可靈2.5 Turbo:
Hailuo 2.3:
Sora 2:
從整體的效果來看,可靈2.5 Turbo要更勝一籌,可靈 2.5 Turbo視頻中讓人物的動作行云流水,從起跳、騰空到落地都很自然。
Hailuo 2.3雖然也完成了動作,但流暢度上明顯差一點,還有些許形變。
最令人意外的是Sora 2,它生成的視頻中人物動作是最多的,同時也出現了最為明顯的肢體變形,人物在空中出現了不符合物理常理的扭曲。
提示詞:一個超寫實主義電影特寫鏡頭,展示一位年輕女性的面龐,她的眼睛充滿故事。在鏡頭中,她的表情從茫然逐漸轉變,最終展現出復雜的微笑。
可靈2.5 Turbo:
Hailuo 2.3:
Sora 2:
這非常考驗模型對細膩情感的理解。Sora 2在這里扳回一城,它精準地捕捉到了提示詞中的“復雜表情”一詞,也很好的表現了出來。
而Hailuo 2.3的微表情則有很重的AI感,看起來十分不自然。
提示詞:一個動漫風格的女孩在月球上獨自跳舞
可靈2.5 Turbo:
Hailuo 2.3:
Sora 2:
這三款模型都 沒有出現明顯的錯誤 ,生成了一個動漫女孩在月球上跳舞的視頻。但“完成”和“優秀”是兩碼事。
Hailuo 2.3生成的舞蹈動作相對簡單,而可靈 2.5 Turbo和Sora 2則明顯更勝一籌,它們編排的舞蹈動作更復雜。
最關鍵的是,在連續的動作下,人物的身體結構和畫風始終保持高度穩定,沒有出現崩壞的跡象。
提示詞:一名男子在日落時從海邊懸崖跳入大海。攝像機以慢動作捕捉整個動作,從起跳、空中旋轉到入水,再到天空映出橙色和粉色的光芒。
可靈2.5 Turbo:
Hailuo 2.3:

Sora 2:

這就能明顯地看出誰是國家隊,誰是菲律賓跳水隊。
在大幅度的跳水動作中,Sora 2和Hailuo 2.3的效果明顯不如可靈2.5Turbo。
特別是Hailuo 2.3還來了一場反人類跳水表演。。。
雖然此次測評的維度沒有基準測試那么多,但也可以清晰的看到每款模型的特點。
目前Hailuo 2.3 & 2.3 Fast 模型提供了免費試用額度,已經注冊過的用戶可以使用該模型生成4次視頻,而未注冊的用戶則還有額外的500積分。
感興趣的朋友可以去試一試。
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.