<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      港大俞益洲團隊發布首篇「高效視頻世界模型」全面綜述

      0
      分享至



      本篇綜述工作由香港大學博士生何沐陽、郭瀚中、林俊雄(共同第一作者)及香港大學俞益洲教授完成。

      還記得兩年前,AI 生視頻可謂是「鬼畜專區」—— 人物多一根手指算基操,走路自帶鬼步舞才是常態。結果轉眼間,從 OpenAI 的 Sora 到字節跳動的 Seedance,這些模型已經開始一本正經地「模擬世界」了:水會流、球會彈、光影能追蹤,儼然一副要當「物理引擎」的架勢。

      研究人員也越來越相信,視頻生成模型不只是個「特效師」,更有潛力成為理解物理規律的世界模型(World Models)—— 一條通向通用人工智能(AGI)的硬核賽道。

      然而,在這一廣闊前景之前,仍存在著一個極其嚴峻的挑戰:計算成本與速度。

      視頻生成模型要作為世界模擬器,需要維持長期的時空一致性、遵守物理約束,并支持高分辨率的交互式生成。但高維度的視頻數據和復雜的物理動態導致了海量的計算開銷,使得模型陷入了「長時一致性」「實時高可用」與「物理準確性」難以兼得的「不可能三角」。

      現有文獻大多聚焦于視頻生成的一般性進展,卻鮮有工作系統性地探討「如何通過提升效率來成就真正的世界模型」。

      在這篇最新的綜述中,港大俞益洲團隊首次聚焦于「高效性」(Efficiency)這一決定視頻生成器能否成功轉化為實用世界模型的關鍵先決條件,從理論潛力與龐大計算成本之間的鴻溝出發,系統且全面地梳理了高效視頻世界模型的發展脈絡、關鍵技術與最新進展。



      • 論文地址:
      • https://arxiv.org/abs/2603.28489
      • 或https://huggingface.co/papers/2603.28489

      具體來說,團隊從高效建模范式、高效模型架構和高效推理算法三個維度對現有工作進行了分類分析,并進一步探討了這些高效技術如何賦能下游的應用領域,包括自動駕駛、具身智能、游戲與交互等。



      團隊詳盡地梳理了以下核心內容。

      高效建模范式(Efficient Modeling)

      該部分重點探討了從視頻生成問題最基本的建模范式出發,如何將模型從短片段生成擴展到支持長周期、交互式的世界建模。包括:

      • 擴散模型蒸餾(Diffusion Model Distillation):通過步數縮減、一致性蒸餾和對抗性蒸餾等方法,將采樣步數壓縮至幾步甚至單步,大幅降低生成延遲;
      • 自回歸與混合方法(Auto-Regressive & Hybrid AR-Diffusion):使用自回歸(AR)模型或結合 AR 和 Diffusion,旨在實現長周期推理能力,保持高保真度;還包括一類將擴散過程流式因果化的方法。

      高效模型架構(Efficient Architectures)

      架構設計是緩解時空冗余和 attention 機制平方計算復雜度的最直接方法。涵蓋了四大方向:

      • 層次化與 VAE 設計(Hierarchical & VAE Designs):通過粗到細(Coarse-to-fine)的級聯生成降低計算成本,或通過高效的 VAE 設計實現隱空間壓縮和降維;
      • 長上下文與記憶機制(Long Context & Memory Mechanisms):引入視覺記憶、空間記憶(如 3D 點云 / 網格)、上下文壓縮或隱式模型記憶(測試時訓練),以維持長周期的物理與邏輯一致性;
      • 高效注意力機制(Efficient Attention):利用稀疏注意力、窗口注意力、線性注意力乃至狀態空間模型(如 Mamba)來替代昂貴的全局注意力;
      • 外推與 RoPE 技術(Extrapolation and RoPE):通過位置編碼的優化,實現無需訓練的長序列外推生成。

      高效推理算法(Efficient Inference)

      面向數十億參數級大模型的實際部署,團隊總結了四類關鍵的推理優化策略:

      • 并行化(Parallelism):分布式推理(空間、序列及流水線并行);
      • 緩存機制(Caching):利用擴散模型相鄰去噪步之間的時空冗余進行特征復用;
      • 剪枝(Pruning):包含 token 級合并 / 丟棄,以及網絡架構(channel、layer 級)剪枝;
      • 量化(Quantization):以 8bit、4bit 部署,涵蓋從注意力機制量化到訓練后量化(PTQ)與量化感知訓練(QAT)、及時間維度的動態量化策略。

      賦能應用(Applications)

      團隊詳細分析了高效技術如何直接推動視頻世界模型在三大核心領域的應用:

      1.自動駕駛(Autonomous Driving):讓 AI 司機在「腦內駕校」練到畢業

      這大概是視頻世界模型最剛需的戰場。綜述從三個維度梳理了它的打法:

      • 一是數據合成——現實世界里,「鬼探頭」、極端天氣等長尾場景可遇不可求,但世界模型可以批量「腦補」出來,給感知和規劃模型當訓練素材(代表作如 GAIA 系列、MagicDrive-V2);
      • 二是閉環交互模擬—— 把世界模型當虛擬考場,AI 在里面不斷試駕、犯錯、學習,形成「生成 — 評估 — 重訓」的飛輪(如 Vista、ADriver-I 實現了「在 AI 生成的虛擬世界里無限開車」);
      • 三是生成式規劃—— 模型在腦中「想象」多條未來軌跡,挑最優的那條執行,相當于讓自動駕駛系統擁有了「先在腦子里過一遍」的能力(如 Drive-WM、DriveLAW 等將視頻生成與動作規劃共享同一個隱空間)。

      2.具身智能(Embodied AI):給機器人裝一個「物理直覺」

      機器人領域最頭疼的問題之一就是數據 ——真實環境數據采集成本高、分布窄。

      視頻世界模型在這里扮演了三重角色:

      首先是數據引擎,比如 GigaWorld-0 通過文本引導真實視頻編輯來擴充訓練數據,DreamGen 用世界模型的「想象」直接生成軌跡級監督信號,GenMimic 甚至把人類運動視頻「遷移」到人形機器人上做強化學習;

      其次是交互式模擬器,機器人可以在世界模型生成的虛擬環境里安全試錯(如 Ctrl-World、DreamDojo);

      最值得關注的是生成式策略學習——GR-1 在大規模視頻上預訓練再遷移到機器人操作,Fast-WAM 更是提出了 WAM(World Action Model)范式的關鍵證據:世界模型的增益主要來自視頻聯合訓練塑造的物理表征,而非推理時的顯式「想象」。僅 15M 參數的 LeWorldModel 則證明,小而精的隱空間世界模型也能實現高效規劃。

      3.游戲與交互式世界模擬(Game & Interactive Simulation):AI 當上了「游戲引擎」

      游戲天然提供了閉環交互接口和可控評測環境,是世界模型的理想試驗田。

      GameGen-X 把鍵盤鼠標操作注入生成過程,Matrix-Game 2.0 在 GTA5 和虛幻引擎數據上訓練,實現了約 25 FPS 的交互生成和分鐘級長序列滾動推演。DreamerV4 則用世界模型充當強化學習的虛擬訓練場,讓智能體在「腦內世界」練習復雜的長程任務。

      更通用的方向上,WorldPlay 主打高分辨率實時生成,Yume1.5 通過上下文壓縮和蒸餾降低長序列延遲,開源項目 LingBot-World 則將分層語義數據引擎與多階段訓練結合,追求低延遲交互與長期記憶的統一。



      此外,團隊也分析了 talking head、實時互動創作、3D/4D 場景等領域的相關工作。

      總的來說,盡管視頻生成在分辨率、擬真度、時長等方面取得了令人矚目的突破,但要賦予模型真正的物理推理和環境模擬能力,仍面臨著巨大的算力挑戰。

      在這方面,將多角度效率優化與視頻生成的時空屬性深度結合,展現出了不可替代的價值。

      為此,團隊首次基于「面向高效性」(Efficiency-oriented) 的視角,對視頻世界模型進行了全景式的綜述。

      通過系統整理模型范式、架構創新到高效推理的各個環節,我們厘清了該領域的發展脈絡與關鍵方法,還指出了當前存在的關鍵局限(如長時間生成的誤差累積、物理一致性困境等)以及未來的潛在突破口。

      團隊希望本篇綜述能為廣大研究人員帶來新的啟發,共同推動視頻生成模型向著通用、實時且魯棒的物理世界模擬器邁出堅實的一步。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      中國開始殺雞儆猴!對2大公司下達逐客令,巴拿馬反應出乎意料

      中國開始殺雞儆猴!對2大公司下達逐客令,巴拿馬反應出乎意料

      琨玉秋霜
      2026-04-24 03:04:07
      前男友曝黃一鳴和王思聰在一起時出軌男方朋友,難怪王思聰不認娃

      前男友曝黃一鳴和王思聰在一起時出軌男方朋友,難怪王思聰不認娃

      叨嘮
      2026-04-23 17:48:14
      百億美元砸出的荒誕死局:一國正規軍為何永遠打不贏一支民兵

      百億美元砸出的荒誕死局:一國正規軍為何永遠打不贏一支民兵

      寰球經緯所
      2026-04-20 22:59:41
      胡錫進以安全代言沃爾沃,是整個社會的恥辱

      胡錫進以安全代言沃爾沃,是整個社會的恥辱

      黔有虎
      2026-04-19 17:34:12
      沙媒:勝利主帥有意簽薩拉赫,但他要先解決自己的續約問題

      沙媒:勝利主帥有意簽薩拉赫,但他要先解決自己的續約問題

      懂球帝
      2026-04-24 15:48:07
      女子大鬧亞航后續:真容傳開社死,真實身份被扒,寫保證書拒認錯

      女子大鬧亞航后續:真容傳開社死,真實身份被扒,寫保證書拒認錯

      阿纂看事
      2026-04-24 12:19:35
      突發!華潤集團副總被查

      突發!華潤集團副總被查

      新浪財經
      2026-04-24 08:47:42
      “香港演員幾乎全軍覆沒! 無戲可拍”引發網友熱議

      “香港演員幾乎全軍覆沒! 無戲可拍”引發網友熱議

      許三歲
      2026-03-26 11:35:13
      關于榴蓮的消費提示

      關于榴蓮的消費提示

      極目新聞
      2026-04-23 22:19:44
      老人同房時,需要注意這3點!不然可能麻煩就大了,早知道早好

      老人同房時,需要注意這3點!不然可能麻煩就大了,早知道早好

      熊貓醫學社
      2026-04-03 12:05:03
      烏度卡:G3增加謝潑德時間!湖人再包夾杜蘭特,必須付出代價

      烏度卡:G3增加謝潑德時間!湖人再包夾杜蘭特,必須付出代價

      不想長大的莫扎特
      2026-04-24 15:51:10
      30架飛機歸零:一家航司的死亡筆記

      30架飛機歸零:一家航司的死亡筆記

      時光慢郵啊
      2026-04-23 15:15:57
      2027款寶馬X5外觀引爭議?雙腎變“豬鼻子”,車主:不適應

      2027款寶馬X5外觀引爭議?雙腎變“豬鼻子”,車主:不適應

      汽車網評
      2026-04-23 22:56:32
      比土木還崩的專業,從年薪20萬跌到月薪2500,畢業即轉行!

      比土木還崩的專業,從年薪20萬跌到月薪2500,畢業即轉行!

      燈錦年
      2026-04-23 19:35:21
      切爾西慘敗,球迷呼吁穆帥第3次執教藍軍,切爾西管理層無動于衷

      切爾西慘敗,球迷呼吁穆帥第3次執教藍軍,切爾西管理層無動于衷

      福醬的小時光
      2026-04-24 08:00:53
      美媒稱,革命衛隊總司令瓦希迪成為美軍最新打擊目標

      美媒稱,革命衛隊總司令瓦希迪成為美軍最新打擊目標

      山河路口
      2026-04-24 13:23:02
      朝鮮名將方虎山,不聽勸將3000日俘踹下冰河,他說:我愿背上罵名

      朝鮮名將方虎山,不聽勸將3000日俘踹下冰河,他說:我愿背上罵名

      朝子亥
      2026-04-23 19:25:03
      全網唱衰的下嫁!嫁普通人5年,前任是法拉利總裁,終究還是輸了

      全網唱衰的下嫁!嫁普通人5年,前任是法拉利總裁,終究還是輸了

      橙星文娛
      2026-04-18 16:42:58
      好好存錢,家庭存款達到“這個數”,你就已經很幸福了,別比較!

      好好存錢,家庭存款達到“這個數”,你就已經很幸福了,別比較!

      CG說科技
      2026-04-24 09:24:50
      特朗普:美國“無意影響”伊朗參加2026年美加墨世界杯

      特朗普:美國“無意影響”伊朗參加2026年美加墨世界杯

      中國網
      2026-04-24 10:42:04
      2026-04-24 16:07:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12847文章數 142635關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4牽手華為,價格依然"屠夫級"

      頭條要聞

      女子買二手奔馳里程數偏差20萬公里 看到事故記錄崩潰

      頭條要聞

      女子買二手奔馳里程數偏差20萬公里 看到事故記錄崩潰

      體育要聞

      里程碑之戰拖后腿,哈登18分8失誤

      娛樂要聞

      停工16個月!趙露思證實接拍新劇

      財經要聞

      19家企業要"鋁代銅",格力偏不

      汽車要聞

      YU7 GT 5 月上市!小米Vision GT概念車國內首秀

      態度原創

      游戲
      健康
      藝術
      本地
      教育

      Fami通銷量榜:《識質存在》3.6萬被第一十倍吊打!

      干細胞如何讓燒燙傷皮膚"再生"?

      藝術要聞

      16幅 佐恩高清油畫 | 瑞典著名畫家

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統文化

      教育要聞

      江西省委宣傳部原常務副部長陳東有:教育孩子不能太急切

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 欧美va天堂在线电影| 久久97| 亚洲3p| 欧美精品乱码99久久蜜桃| 少妇被粗大的猛烈进出动视频| 91牛牛| 东山县| 91久久国产综合精品| 国产成人无码A区视频在线观看| 天天综合天天色| 亚洲综合第一色| 国产av麻豆mag剧集| 中文字幕熟妇人| 无码人妻毛片丰满熟妇精品区| 国产在线观看91精品亚瑟| 亚洲天堂自拍| 尤物一区| 午夜无码人妻A∨大片| 人人玩人人添人人澡超碰| 久久精品亚洲精品毛片| 成在人线av无码免费高潮水老板| 无码专区—va亚洲v天堂| 色综合久久久久无码专区| 泽州县| 人妻内射一区二区在线视频| 69亚洲精品| 少妇的丰满3中文字幕| xxx久久| 亚洲伊人影院| 日本人妻中文| YOUJIZZJIZZJIZZ18| 久久久精品人妻一区二区三区| 色婷婷五月综合亚洲小说| 国产 麻豆 日韩 欧美 久久| 欧美亚洲自偷自拍 在线| 国产午夜不卡av免费| 尤物在线观看国产精品| 豆国产96在线 | 亚洲| 国产亚洲欧洲av综合一区二区三区 | 色综合久久中文| www.成人|