網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

實(shí)測(cè)谷歌Veo 3.1：新增原生豎屏模式和4K畫質(zhì)，卻栽在了語言表現(xiàn)上？

2026-01-14 10:17:56　來源: AI前線

北京舉報(bào)

分享至

剛剛，谷歌更新了其 Veo AI 視頻生成器，新增原生豎屏視頻生成與 4K 分辨率支持功能。此次對(duì) “文生視頻” 功能的調(diào)整，旨在提升畫面清晰度的同時(shí)，確保不同場(chǎng)景中的主體元素保持一致。

Veo 3.1 的更新，解決了生成式視頻領(lǐng)域一項(xiàng)長(zhǎng)期存在的挑戰(zhàn)：保持鏡頭間的視覺一致性。谷歌表示，新款模型在場(chǎng)景切換時(shí)能更好地保留人物特征與背景紋理，從而更容易重復(fù)使用特定的視覺元素，或在多場(chǎng)景敘事中貫穿同一主題。

最顯著的改進(jìn)是對(duì)“素材到視頻”工具的重大優(yōu)化。用戶只需添加三張參考圖片：一張用于主體，一張用于背景，一張用于展現(xiàn)所需的視覺效果或風(fēng)格。然后，只需添加一些文字即可開始制作。即使提示信息較短，Veo 3.1 也能在提供參考圖像后生成角色表情和動(dòng)作更生動(dòng)的視頻。

移動(dòng)創(chuàng)作者是本次更新的核心受眾。升級(jí)后的 Veo 可直接生成 9:16 比例的原生豎屏視頻，創(chuàng)作者無需對(duì)橫屏素材進(jìn)行裁剪，也不必犧牲畫質(zhì)，就能制作出適配 YouTube Shorts 等平臺(tái)的全屏內(nèi)容。針對(duì)更專業(yè)的創(chuàng)作流程，谷歌還新增了 1080P 至 4K 的畫質(zhì)提升選項(xiàng)。

目前，這些新功能已率先在 Gemini 應(yīng)用、YouTube Shorts 及 YouTube Create 工具中上線，并將逐步覆蓋谷歌旗下更多創(chuàng)作者工具與企業(yè)級(jí)服務(wù)。為區(qū)分生成內(nèi)容與真實(shí)拍攝素材，谷歌會(huì)在視頻文件中嵌入肉眼不可見的 SynthID 數(shù)字水印。

有體驗(yàn)用戶反饋，Veo 3.1似乎存在不同語言版本表現(xiàn)差距太大的問題。“巴西葡萄牙語的人物音頻存在音畫不同步、臺(tái)詞錯(cuò)亂的問題，其他語言版本的表現(xiàn)則相對(duì)更佳。我曾指令其生成一段鸚鵡以沙啞嗓音鳴叫的音頻，但該需求最終未能實(shí)現(xiàn)。”

值得一提的是，此次更新距蘋果與谷歌官宣合作、計(jì)劃在下一代 Siri 中集成 Gemini 模型僅過去一天。與此同時(shí)， OpenAI 已達(dá)成合作，計(jì)劃將迪士尼角色引入 Sora 平臺(tái)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.