剛剛,谷歌更新了其 Veo AI 視頻生成器,新增原生豎屏視頻生成與 4K 分辨率支持功能。此次對(duì) “文生視頻” 功能的調(diào)整,旨在提升畫面清晰度的同時(shí),確保不同場(chǎng)景中的主體元素保持一致。
Veo 3.1 的更新,解決了生成式視頻領(lǐng)域一項(xiàng)長(zhǎng)期存在的挑戰(zhàn):保持鏡頭間的視覺一致性。谷歌表示,新款模型在場(chǎng)景切換時(shí)能更好地保留人物特征與背景紋理,從而更容易重復(fù)使用特定的視覺元素,或在多場(chǎng)景敘事中貫穿同一主題。
最顯著的改進(jìn)是對(duì)“素材到視頻”工具的重大優(yōu)化。用戶只需添加三張參考圖片:一張用于主體,一張用于背景,一張用于展現(xiàn)所需的視覺效果或風(fēng)格。然后,只需添加一些文字即可開始制作。即使提示信息較短,Veo 3.1 也能在提供參考圖像后生成角色表情和動(dòng)作更生動(dòng)的視頻。
移動(dòng)創(chuàng)作者是本次更新的核心受眾。升級(jí)后的 Veo 可直接生成 9:16 比例的原生豎屏視頻,創(chuàng)作者無需對(duì)橫屏素材進(jìn)行裁剪,也不必犧牲畫質(zhì),就能制作出適配 YouTube Shorts 等平臺(tái)的全屏內(nèi)容。針對(duì)更專業(yè)的創(chuàng)作流程,谷歌還新增了 1080P 至 4K 的畫質(zhì)提升選項(xiàng)。
目前,這些新功能已率先在 Gemini 應(yīng)用、YouTube Shorts 及 YouTube Create 工具中上線,并將逐步覆蓋谷歌旗下更多創(chuàng)作者工具與企業(yè)級(jí)服務(wù)。為區(qū)分生成內(nèi)容與真實(shí)拍攝素材,谷歌會(huì)在視頻文件中嵌入肉眼不可見的 SynthID 數(shù)字水印。
有體驗(yàn)用戶反饋,Veo 3.1似乎存在不同語言版本表現(xiàn)差距太大的問題。“巴西葡萄牙語的人物音頻存在音畫不同步、臺(tái)詞錯(cuò)亂的問題,其他語言版本的表現(xiàn)則相對(duì)更佳。我曾指令其生成一段鸚鵡以沙啞嗓音鳴叫的音頻,但該需求最終未能實(shí)現(xiàn)。”
值得一提的是,此次更新距蘋果與谷歌官宣合作、計(jì)劃在下一代 Siri 中集成 Gemini 模型僅過去一天。與此同時(shí), OpenAI 已達(dá)成合作,計(jì)劃將迪士尼角色引入 Sora 平臺(tái)。
![]()
![]()
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.