作者|子川
來源|AI先鋒官
可靈又又又又更新啦!
可靈推出了全新的視頻生成模型可靈 2.5 Turbo模型。
![]()
據可靈團隊介紹,較上代相比,新一代的可靈 2.5 Turbo主要是升級下面幾點:
提示詞理解與時序控制更精準。
高速動態質量更流暢更穩定。
多種風格保持能力全面覆蓋。
更高品質、更低價格,價格比可靈2.1同檔位便宜30%!
這些技術上的提升可能聽起來比較抽象,我們直接通過幾個案例來感受一下
在提示詞理解方面,可靈 2.5 Turbo 甚至能理解古詩詞。
提示詞:欲把西湖比西子,淡妝濃抹總相宜
是不是有種想象照進現實的感覺?
西湖、荷花再加上一位身著古裝的古典美人,非常契合了詩詞中“西子”的韻味和“淡妝濃抹”的意境。
理解力Max!
如果說視頻模型最怕什么,運動場景首當其沖,大幅度動作做著做著很容易就“崩掉”。
經常出現肢體扭曲、畫面破碎等情況,就像這樣——
兩只手和兩只腳纏繞在一起,并在空中直立翻個大跟頭,簡直比菲力賓跳水隊還抽象。
升級后的可靈 2.5 Turbo,在處理大幅度運動時表現得更加穩定和順暢。
提示詞:正常速度,展示一名籃球運動員從后場帶球突破至扣籃。主體是一名身穿白色球衣的年輕球員,位于畫面中央,動作連貫自然。背景是燈光閃耀的籃球館,觀眾席模糊但熱烈。球員一路帶球突破,避開防守,騰空扣籃。整體風格為寫實體育競技,暖黃燈光,高亮度,中高飽和度,氛圍熱血。鏡頭采用正面跟隨拍攝,無剪輯持續跟隨,從遠景到近景捕捉完整動作。
運球突破再到最后的扣籃,一氣呵成,幾乎沒有沒有任何卡頓或動作形變。
特別是鏡頭始終跟隨主體,完整捕捉了整個連貫的動作。
除此之外,2.5 Turbo生成視頻的人物表現力方面更加的細膩,表演更具張力。
提示詞:真實速度播放。昏暗的馬戲團后臺,氣氛詭異,唯一的頂燈灑下冷白光,周圍彌漫灰塵。鏡頭從近景開始,正面拍攝一名身穿破舊小丑服、滿臉白色油彩的小丑,他的紅鼻子和涂抹開的口紅讓笑容顯得僵硬。起初他咧嘴大笑,露出整齊的白牙,眼角皺紋拉開,鏡頭緩慢推進到特寫,他的笑聲逐漸停下,嘴角緩緩下垂,眼神開始黯淡,淚水從涂著油彩的眼角流下,沿著臉頰留下黑色淚痕。背景聲音消失,只能聽到他的呼吸聲。下一瞬間,鏡頭捕捉到他抬起頭,嘴角緩緩扭曲成詭異的邪笑,牙齒在冷光下反射著光,眼神變得陰冷,淚水和笑容同時掛在臉上,既滑稽又恐怖。鏡頭略微抖動,定格在他詭異的表情上,畫面充滿心理壓迫感。
昏暗的燈光、小丑臉上夸張卻又僵硬的笑容,加上泛黃的牙齒和從眼角流出的黑色淚水,看得小編雞皮疙瘩都掉落一地。
可靈 2.5 Turbo在紙面實力同樣表現不俗。
在可靈AI團隊內部構建的評測集中,文生視頻和圖生視頻方面幾乎都碾壓seedance 1.0 mini、seedance-1.0和Veo3-fast這三款模型。
![]()
![]()
那實際效果到底如何,是騾子是馬,總得拉出來遛一遛才知道。
老規矩,來一場 PK。
這次可靈 2.5 Turbo 的對手是字節的 seedance-1.0 模型,看看究竟誰能更勝一籌。
眾所周知,“抽卡”是視頻生成必備的環節,為了保護我方錢包。
所以定了一個規則:使用相同的提示詞,每款模型生成兩次,選取效果更好的一次進行比較。
案例一:鏡頭追隨
提示詞:
滑板手在U池做‘空中抓板’動作,鏡頭先近距鎖定滑板尾部,起跳后順勢拉近到面部特寫并自動對焦,落地時再拉遠至半身構圖,全程自動曝光與景深過渡自然。
可靈2.5 Turbo
seedance-1.0
先說優點,兩款模型動作上都沒有變形。
但可靈 2.5 Turbo 的鏡頭追隨能力明顯要比 seedance-1.0 好不少。
在可靈的視頻中,鏡頭先是精準地對準滑板尾部,滑板手起跳后,鏡頭順勢平滑地拉近并自動對焦到人物面部,這個過渡非常自然。
同時兩款模型都有一個缺點,沒有做空中抓板的這個動作。
案例二:跑車變形機甲
提示詞:固定鏡頭,拍攝,霓虹光,照耀的黃昏街道上,紅色跑車緩慢展開機械結構,車門與引擎蓋以折疊位移方式重組,輪組向外翻轉形成關節,變形為機甲人形后,仰視,鏡頭,金屬表面倒映著街燈,暖光,地面陰影隨結構變化同步調整,機械關節處溢出少量白色蒸汽
可靈2.5 Turbo
seedance-1.0
結果一目了然,2.5 Turbo 生成的畫面,完完整整地展現了紅色跑車從汽車形態逐步展開成變形為機甲人形的全過程。
反觀 seedance-1.0,僅完成了一半的變形,然后呈現一個機器人直接“坐”在了一輛跑車上的畫面。
案例三:運動能力
提示詞:
黃昏的露天跳水池,一名職業跳水運動員從10米跳臺起跳,完成向前翻騰三周半抱膝,鏡頭自下向上跟隨起跳軌跡,隨后快速下搖至水面,捕捉入水瞬間的水花收束與漣漪,真實光影與水體折射。
可靈2.5 Turbo
seedance-1.0
先說可靈 2.5 Turbo,在運動員空中完成向前翻騰三周半抱膝動作時,有幾幀畫面出現了輕微的動作形變,雖然不影響整體理解,但不夠完美。
而 seedance-1.0 的表現則更糟糕,運動員跳到空中后,直接來了個一字馬后空翻。
除此之外,這兩款模型似乎對數字都不敏感,提示詞明確的是10米,而它們生成的視頻都是1~2米的跳臺。
案例四:微距視角
提示詞:微距視角拍攝熱帶雨林潮濕地面,螞蟻用前肢托舉綠葉邊緣緩慢前行,葉片邊緣有細小露珠,鏡頭緩慢,推進,從葉尖露珠逐漸聚焦到螞蟻復眼,背景蕨類植物形成朦朧光斑,柔和,自然光,照亮絨毛細節
可靈2.5 Turbo

seedance-1.0

這次在微距視角下,兩款模型效果都相當不錯。如果非要在這兩者之間選一個更厲害的,小編依然會選擇可靈2.5 Turbo。
它實現了聚焦到螞蟻復眼”這個細節!
經過這一系列的實測與對比,可靈 2.5 Turbo 的能力確實提升了不少,無論是在復雜語義的理解,還是高難度動態場景的流暢展現,表現都相當不錯。
目前 可靈2.5 Turbo已經上線,感興趣的朋友可以去試玩一番。
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.