哈嘍,大家好,我是小方,今天,我們主要來看看AI視頻生成領域一個讓人頭疼的“老大難”問題,以及中國天才研究者帶來的破局新思路。
![]()
![]()
最近,AI生成視頻是火得一塌糊涂,但玩過的朋友都知道,它有個硬傷:生成的視頻往往就十幾秒,想做個一分鐘的短視頻?得反復分段生成、拼接,還得祈禱角色別“變臉”,場景別“跳戲”,費時又費力,這背后的核心瓶頸,就在于模型的“記憶力”有限。
![]()
![]()
![]()
![]()
簡單說,就是教AI學會一種“高效筆記法”:用很短的篇幅(比如5千個token記錄20秒視頻),卻能把關鍵的高清畫面細節都保留下來,他們的秘訣在于預訓練階段的一個獨特設計:隨機從被壓縮的歷史信息中抽一幀,要求AI能高質量地還原它,這就防止了AI偷懶只記住開頭結尾,逼著它必須公平地照顧好時間線上的每一刻。
![]()
![]()
![]()
![]()
![]()
當然,這項技術目前仍有其局限,比如在極端復雜的鏡頭運動和快速場景切換下,保真度還會有損失,但它的方向是明確的:讓AI的視頻“記憶力”更強、更經濟。
![]()
![]()
![]()
從幾秒的閃爍片段,到十幾秒的精彩瞬間,再到未來可期的連貫敘事,AI視頻生成的進化之路,正是由這樣一個個解決具體問題的扎實工作所鋪就。
![]()
這讓我們有理由期待,在不久的未來,每個人都能更輕松地用AI講述自己心中那個更長的、栩栩如生的故事。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.