<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      VerseCrafter:給視頻世界模型裝上4D方向盤,精準運鏡控物

      0
      分享至



      視頻世界模型領(lǐng)域又迎來了新的突破!

      復旦大學與騰訊 PCG ARC Lab 等機構(gòu)的研究者們提出了 VerseCrafter,這是一個通過顯式 4D 幾何控制(4D Geometric Control)實現(xiàn)的動態(tài)逼真視頻世界模型。它不僅能像「導演」一樣精準控制運鏡,還能同時指揮場景中多個物體的 3D 運動軌跡,為視頻生成引入了物理世界維度。

      自 Sora 問世以來,視頻世界模型(Video World Models)成為了 AI 領(lǐng)域最熱門的研究方向之一。我們希望 AI 不僅能生成視頻,更能理解和模擬真實的物理世界。然而,現(xiàn)有的視頻模型往往面臨一個核心困境:視頻是在 2D 平面上播放的,但真實世界是 4D(3D 空間 + 時間)的。

      現(xiàn)有的方法(如 Voyager、Yume 等)雖然引入了 3D 幾何結(jié)構(gòu)來輔助生成,但往往難以在一個統(tǒng)一的框架下同時實現(xiàn)精準的相機控制和多物體運動控制。要么是控制了鏡頭但物體不動(靜態(tài)場景),要么是控制了物體但鏡頭受限,或者依賴于剛性的 3D 邊界框和人的參數(shù)化模型(如 SMPL),難以應對復雜的真實世界物體。

      為了打破這一僵局,來自復旦大學、上海創(chuàng)智學院、香港大學和騰訊 PCG ARC Lab 的研究團隊提出了 VerseCrafter。



      • 論文地址: https://arxiv.org/pdf/2601.05138
      • 項目主頁: https://sixiaozheng.github.io/VerseCrafter_page/
      • 代碼倉庫: https://github.com/TencentARC/VerseCrafter

      VerseCrafter 的核心理念在于:用一個統(tǒng)一的 4D 幾何世界狀態(tài)(4D Geometric World State)以此驅(qū)動視頻生成。它利用靜態(tài)背景點云和每個物體的 3D 高斯軌跡,實現(xiàn)了對相機和物體運動的解耦與協(xié)同控制。

      如何構(gòu)建 4D 可控的世界模型?

      VerseCrafter 的魔法源于其獨特的4D 幾何控制(4D Geometric Control) 表示和輕量級的 GeoAdapter 架構(gòu)。

      1. 統(tǒng)一的 4D 幾何控制表示

      傳統(tǒng)的控制信號通常是 2D 的(如光流、軌跡點、掩碼),缺乏 3D 空間的一致性。VerseCrafter 創(chuàng)新性地提出了一種基于3D 高斯(3D Gaussians)的表示方法:

      • 背景:使用靜態(tài)背景點云(Background Point Cloud)來表示環(huán)境幾何。
      • 物體:使用每物體 3D 高斯軌跡(Per-object 3D Gaussian Trajectories)來編碼物體運動。



      VerseCrafter 的框架圖。通過將 4D 幾何控制渲染為多通道圖,并通過 GeoAdapter 注入到凍結(jié)的 Wan2.1 主干網(wǎng)絡中。

      相比于剛性的 3D 邊界框,3D 高斯軌跡提供了一種軟性、靈活且類別無關(guān)的表示方式。它的均值定義了運動路徑,協(xié)方差則捕捉了物體隨時間變化的形狀和方向。這意味著無論是汽車、行人還是動物,VerseCrafter 都能以概率分布的形式描述其在 3D 空間中的占據(jù)情況。

      2. 凍結(jié)的 Wan2.1 主干 + GeoAdapter

      為了保證視頻生成的畫質(zhì)和真實感,VerseCrafter 并沒有從頭訓練一個大模型,而是巧妙地利用了強大的開源視頻生成模型Wan2.1-T2V-14B作為凍結(jié)的視頻先驗(Frozen Video Prior)。

      研究團隊設(shè)計了一個輕量級的 GeoAdapter:

      1. 首先將 4D 幾何控制信息(背景 RGB / 深度、物體高斯軌跡 RGB / 深度、控制掩碼)渲染為 2D 序列圖;
      2. 利用 GeoAdapter 對這些幾何信息進行編碼;
      3. 將其作為殘差注入到 Wan2.1 的特定 DiT 模塊中。

      這種設(shè)計既保留了 Wan2.1 強大的生成能力,又以極小的代價引入了精確的 4D 控制。

      數(shù)據(jù)集:VerseControl4D

      訓練這樣一個 4D 世界模型,最大的瓶頸在于數(shù)據(jù) —— 我們?nèi)ツ睦镎掖罅繋в芯_ 4D 標注(相機參數(shù) + 多物體 3D 軌跡)的真實世界視頻?

      為了解決這個問題,團隊構(gòu)建了VerseControl4D 數(shù)據(jù)集。



      VerseControl4D 數(shù)據(jù)集的自動化構(gòu)建流程

      • 數(shù)據(jù)源:基于 Sekai-Real-HQ 和 SpatialVID-HQ 等高質(zhì)量視頻數(shù)據(jù)集;
      • 自動化標注引擎:結(jié)合了 Qwen2.5-VL-72B(生成描述)、Grounded-SAM2(物體分割)、MegaSaM(深度和相機位姿估計)等最先進的工具,自動從視頻中提取 4D 幾何信息;
      • 規(guī)模:包含35,000 個訓練視頻片段,涵蓋了豐富的動態(tài)和靜態(tài)場景。

      這一數(shù)據(jù)集的構(gòu)建,填補了真實世界 4D 幾何控制數(shù)據(jù)的空白,為模型的訓練提供了堅實的基礎(chǔ)。

      實驗結(jié)果:SOTA 級的控制力

      實驗表明,VerseCrafter 在各項指標上均超越了現(xiàn)有的 SOTA 方法(如 Perception-as-Control、 Yume、 Uni3C 等)。

      1. 動態(tài)場景聯(lián)合控制對比

      在同時控制相機運鏡和物體運動的復雜場景下,VerseCrafter 展現(xiàn)出了驚人的穩(wěn)定性。


      https://mp.weixin.qq.com/s/P2MBsslV2i1Q9v8N7zm_bQ

      動態(tài)場景對比。第一行從左至右:相機軌跡、GT、Perception-as-Control、Yume,第二行從左到右:Uni3C(第 1,2 列)、VerseCrafter(第 3,4 列)??梢钥吹?VerseCrafter(右下)的物體運動和背景穩(wěn)定性最好。

      從對比視頻中可以看出:

      • Perception-as-Control生成的幀質(zhì)量較低,運鏡不準。
      • Yume雖然能大致遵循文本描述的運動,但缺乏精確的相機控制。
      • Uni3C僅限于單人體運動控制。
      • VerseCrafter能夠精確地讓物體沿著預設(shè)的 3D 高斯軌跡移動,同時完美執(zhí)行相機運鏡,且背景保持幾何一致。

      2. 靜態(tài)場景運鏡對比

      即使在沒有移動物體的靜態(tài)場景中,作為單純的「場景漫游」工具,VerseCrafter 的表現(xiàn)也優(yōu)于專門的 ViewCrafter 和 Voyager 等模型。


      https://mp.weixin.qq.com/s/P2MBsslV2i1Q9v8N7zm_bQ

      靜態(tài)場景運鏡對比。第一行從左至右:相機軌跡、GT、ViewCrafter,第二行從左到右:Voyager、FlashWorld、VerseCrafter。VerseCrafter 在大幅度運鏡下依然保持了建筑結(jié)構(gòu)的筆直和紋理的清晰。

      3. 多視角一致性(Multi-Player View)

      得益于統(tǒng)一的 4D 世界坐標系,VerseCrafter 還支持多玩家視角(Multi-Player View)生成。對于同一個動態(tài)事件,可以從完全不同的兩個視角分別生成視頻,兩者在時間、空間和物體動作上保持高度一致。


      https://mp.weixin.qq.com/s/P2MBsslV2i1Q9v8N7zm_bQ

      兩者在同一時間軸上展現(xiàn)了完全一致的世界動態(tài)。

      總結(jié)

      VerseCrafter 的出現(xiàn),標志著視頻生成向可控 4D 世界模擬邁出了重要一步。通過將顯式的 3D 幾何先驗(點云與高斯)與強大的 2D 視頻生成模型(Wan2.1)相結(jié)合,它不僅解決了復雜場景下的控制難題,也為游戲制作、電影預演和具身智能模擬提供了新的可能性。

      目前,項目代碼與模型權(quán)重均已開源,感興趣的讀者可以前往項目主頁體驗。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      震驚!網(wǎng)傳上海一公司招聘13名海歸,4男按時提交,9女都未提交…

      震驚!網(wǎng)傳上海一公司招聘13名海歸,4男按時提交,9女都未提交…

      火山詩話
      2026-01-24 21:37:07
      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      回顧探花大神:害人害己,多位女主被親戚認出當場“社死”

      就一點
      2025-10-09 12:19:42
      李湘王詩齡被曝已經(jīng)跑路,妄圖用外籍身份扯保護旗,逃脫法律制裁

      李湘王詩齡被曝已經(jīng)跑路,妄圖用外籍身份扯保護旗,逃脫法律制裁

      花哥扒娛樂
      2026-01-24 16:06:55
      北京獨生女被外地前男友毆打致殘!劣跡男霸占房產(chǎn)的方式太極端

      北京獨生女被外地前男友毆打致殘!劣跡男霸占房產(chǎn)的方式太極端

      奇思妙想草葉君
      2026-01-24 23:18:55
      特朗普:美國多州進入緊急狀態(tài)

      特朗普:美國多州進入緊急狀態(tài)

      第一財經(jīng)資訊
      2026-01-25 08:45:31
      六旬老人跟團北京5日游,第3天猝死!連續(xù)兩天凌晨集合,導游臨時在車上通知增加游覽項目,法院判了

      六旬老人跟團北京5日游,第3天猝死!連續(xù)兩天凌晨集合,導游臨時在車上通知增加游覽項目,法院判了

      揚子晚報
      2026-01-24 22:29:57
      個稅降了,2026年1月15日起執(zhí)行

      個稅降了,2026年1月15日起執(zhí)行

      會計人
      2026-01-25 12:03:57
      官方:日本門將荒木琉偉獲得本屆U23亞洲杯最佳門將

      官方:日本門將荒木琉偉獲得本屆U23亞洲杯最佳門將

      懂球帝
      2026-01-25 01:41:11
      國足U23奪亞軍頒獎!拜合拉木笑開花,2將摘下獎牌,李昊低頭!

      國足U23奪亞軍頒獎!拜合拉木笑開花,2將摘下獎牌,李昊低頭!

      籃球資訊達人
      2026-01-25 02:04:51
      新華社記者直擊伊朗最新局勢

      新華社記者直擊伊朗最新局勢

      新華社
      2026-01-24 17:45:55
      五五分流為什么分不下去了?背后的真相

      五五分流為什么分不下去了?背后的真相

      楓冷慕詩
      2026-01-24 13:09:19
      中國隊丟冠僅1夜,隊長赴英超!王鈺棟遭批:態(tài)度有問題 基本廢了

      中國隊丟冠僅1夜,隊長赴英超!王鈺棟遭批:態(tài)度有問題 基本廢了

      侃球熊弟
      2026-01-25 10:37:48
      又要下雪了,就在今晚!山東最新天氣預報

      又要下雪了,就在今晚!山東最新天氣預報

      魯中晨報
      2026-01-25 14:19:09
      大車司機向年長8歲情人轉(zhuǎn)賬125萬,車載電話錄下出軌細節(jié)!妻子起訴返還,二審判了

      大車司機向年長8歲情人轉(zhuǎn)賬125萬,車載電話錄下出軌細節(jié)!妻子起訴返還,二審判了

      紅星新聞
      2026-01-25 12:53:14
      多地將器官捐獻納入“見義勇為”評定,專家稱概念擴展需審慎

      多地將器官捐獻納入“見義勇為”評定,專家稱概念擴展需審慎

      澎湃新聞
      2026-01-24 22:55:05
      中國共產(chǎn)黨中央軍事委員會副主席張升民簡歷

      中國共產(chǎn)黨中央軍事委員會副主席張升民簡歷

      上觀新聞
      2025-10-23 18:17:07
      一個拿腔作勢一個雙目無神,兩人連累48集大劇,老戲骨再強也沒用

      一個拿腔作勢一個雙目無神,兩人連累48集大劇,老戲骨再強也沒用

      查爾菲的筆記
      2026-01-24 20:12:13
      丹麥如何白撿50倍大領(lǐng)土格陵蘭島的?格陵蘭島的原住民,為啥長得像中國人?

      丹麥如何白撿50倍大領(lǐng)土格陵蘭島的?格陵蘭島的原住民,為啥長得像中國人?

      犀利強哥
      2026-01-23 06:59:12
      我國的“斤”用了3000年,為何與國際接軌后,恰好相當于500克?

      我國的“斤”用了3000年,為何與國際接軌后,恰好相當于500克?

      鶴羽說個事
      2026-01-24 14:02:31
      毒紅薯升級!調(diào)查組已介入調(diào)查,黑色產(chǎn)業(yè)鏈被扒,已蔓延全國多地

      毒紅薯升級!調(diào)查組已介入調(diào)查,黑色產(chǎn)業(yè)鏈被扒,已蔓延全國多地

      青橘罐頭
      2026-01-25 08:58:36
      2026-01-25 15:35:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12179文章數(shù) 142549關(guān)注度
      往期回顧 全部

      科技要聞

      黃仁勛在上海逛菜市場,可能惦記著三件事

      頭條要聞

      霉霉翻車了:短信中爆粗辱罵閨蜜的導演 口碑急劇下跌

      頭條要聞

      霉霉翻車了:短信中爆粗辱罵閨蜜的導演 口碑急劇下跌

      體育要聞

      中國足球不會一夜變強,但他們已經(jīng)創(chuàng)造歷史

      娛樂要聞

      王玉雯方嚴正聲明 劇方回應:涉事人員已被開除

      財經(jīng)要聞

      隋廣義等80人被公訴 千億騙局進入末路

      汽車要聞

      別克至境E7內(nèi)飾圖曝光 新車將于一季度正式發(fā)布

      態(tài)度原創(chuàng)

      藝術(shù)
      旅游
      本地
      親子
      軍事航空

      藝術(shù)要聞

      全認識這13個字的人,能否復印王羲之的作品?

      旅游要聞

      年貨大集打造“農(nóng)文旅融合”亮麗名片 煙火氣中“線上+線下”齊享消費盛宴

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      親子要聞

      抗抽是個持久戰(zhàn)千萬別雞娃

      軍事要聞

      俄美烏三方首輪會談細節(jié)披露

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 东京道一本热中文字幕| 国产一区二区三区视频| 无码a∨高潮抽搐流白浆| 人妻少妇亚洲| 后入内射无码人妻一区| 风韵丰满熟妇啪啪区老老熟妇| 欧美性猛交xxxx免费看| 久久伊人五月天| 国产免费人成网站在线播放| 亚洲中文字幕无码二区在线 | 三上悠亚精品一区二区久久| 欧美激情精品久久久久久| 国产在线无码视频一区二区三区| 国产成人精品2021欧美日韩| 景洪市| 久久国产乱子伦免费精品无码 | 亚洲国产精品自产拍久久| 人人妻人人澡人人爽国产一区| 一边吃奶一边做动态图| 国产旡码高清一区二区三区| 成人自拍偷拍| 91人妻熟妇在线视频| 日韩人妻无码网站| 久久久久国产精品熟女影院| 精品国产成人国产在线视| 淫射网| 色综合久久久久无码专区| 99久久精品国产一区二区蜜芽 | 99视频精品全部免费 在线| 超浪熟女在线| 99久久久无码国产精品性| 国产麻豆精品在线观看| xx性欧美肥妇精品久久久久久| 色噜噜狠狠一区二区三区果冻| 69精品人人人人人| 亚洲熟妇中文字幕五十av| 久久婷婷五月综合色一区二区| 久久99亚洲网美利坚合众国| 久久精品国产99久久6| 亚洲第一av网站| 色婷婷综合久久久久中文|