西風 鷺羽 發自 凹非寺
量子位 | 公眾號 QbitAI
“視頻生成AGI時刻”,這是RunwayGen-4.5突襲發布后獲得的評價。
趁著ChatGPT發布三周年,AI圈開始過年啦(doge)。
最新發布的Runway Gen-4.5以1247 Elo評分——在Artificial Analysis文本轉視頻基準測試中拿下SOTA,超越所有現有模型。
![]()
直接來看效果。
運鏡、視角切換很絲滑,文字也能很好地生成:

人照鏡子這種復雜場景,幾乎看不出破綻:

汽車疾馳塵土飛揚,還有很真實的顛簸感:

下面這個刷墻視頻也能看到很多細節,已經刷過的地方顏料干了,顏色會稍微淺一點:

縱觀Gen 1到Gen4.5兩年迭代,質感全面蛻變:
![]()
視頻鏈接:https://mp.weixin.qq.com/s/Pm1i0s1_-1JNiCJoJ_vOyg
網友們紛紛評價道:“顛覆者”。
![]()
- 尤其是其前所未有的物理和視覺準確性,不只是更美觀,這下真實內容與AI生成內容更難以區分了。
![]()
官方表示正在逐步開放Runway Gen-4.5的使用權限,未來幾天內所有用戶都能體驗到。
并且“加量不加價”,會以和當前訂閱套餐相近的價格全面開放
![]()
超強物理還原度與視覺精準度
下面來看官方介紹。
首先,Gen-4.5主打擅長理解并執行復雜的序列式指令
換句話說,你可在單個提示詞中精準指定詳細的鏡頭運鏡方式、復雜的場景構圖、事件的精確時間節點,以及細微的氛圍變化。

Gen-4.5既保留了Gen-4在速度和效率上的核心優勢,又實現了畫質層面的突破性提升。

對比Gen-2,運行相同的提示be like:

其次,物理還原度與視覺精準度也是一大核心賣點。
其生成的視頻物體移動具備符合現實的重量感與動量特征,物體表面呈現出與現實世界一致的物理特性。

街頭滑滑板效果很逼真:

速度提升,背景模糊處理也很有質感:

當然,遵循還是突破物理定律,全靠你的創作構想。
你也可以讓小羊拉北極熊(doge):

各種風格都能駕馭:

3D繪畫風格也可以:

在網友們都關心的可控性方面,官方表示除了文本生成視頻,會為Gen-4.5適配所有已有的控制模式,比如圖片轉視頻、關鍵幀生成、視頻轉視頻等。
值得一提的是,官方還毫不避諱模型局限性:
- 盡管該模型的能力實現了質的飛躍,但仍存在一些局限性,例如因果推理與物體恒存性(即理解“物體即使看不見也依然存在”的認知能力)方面表現不足
好消息是,目前團隊正在進行相關優化了。
最后再來看兩個長視頻展示~
![]()
視頻鏈接:https://mp.weixin.qq.com/s/Pm1i0s1_-1JNiCJoJ_vOyg
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.