<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      一個模型統一4D世界生成與重建,港科大One4D框架來了

      0
      分享至



      本文第一作者密振興,香港科技大學計算機科學與技術學院人工智能方向博士生,研究方向是多模態理解與生成,視頻生成和世界模型,目前正在尋找工業界全職職位。

      一、背景介紹

      近年來,視頻擴散模型在 “真實感、動態性、可控性” 上進展飛快,但它們大多仍停留在純 RGB 空間。模型能生成好看的視頻,卻缺少對三維幾何的顯式建模。這讓許多世界模型(world model)導向的應用(空間推理、具身智能、機器人、自動駕駛仿真等)難以落地,因為這些任務不僅需要像素,還需要完整地模擬 4D 世界。

      來自香港科技大學(HKUST)的研究團隊提出 One4D,一個統一的 4D 生成與 4D 重建框架。One4D 構造了一個同步輸出多模態的視頻擴散模型,能夠用一個模型同步輸出 RGB 視頻與 Pointmap(XYZ)幾何視頻,并支持從單張圖像到 4D 生成、從稀疏幀到 4D 生成 + 重建、以及從完整視頻到 4D 重建等多種任務形態。



      • 論文標題:One4D: Unified 4D Generation and Reconstruction via Decoupled LoRA Control
      • 論文地址:https://arxiv.org/abs/2511.18922
      • Github:https://github.com/MiZhenxing/One4D
      • 項目主頁:https://mizhenxing.github.io/One4D

      二、One4D 算法設計

      One4D 的核心目標是用強大的視頻生成模型(比如Wan Video)統一 4D 生成與 4D 重建,輸出對齊的 RGB 和幾何多模態結果。論文亮點有:

      1. 多模態輸出:RGB + Pointmap;

      2. DLC:解耦 LoRA 控制,穩住 RGB 同時學幾何對齊;

      3. UMC:統一掩碼條件,一套模型覆蓋生成和重建任務。

      具體來說,One4D 將動態 4D 場景表示為兩種同步的輸出模態。(1) RGB frames(外觀);(2) Pointmaps(XYZ),即與 RGB 視頻對齊的 3 通道幾何視頻,每個像素存 XYZ 值,可進一步導出 Depth 并結合后處理估計相機軌跡,最終可視化為 4D 點云和相機。

      并且,One4D 在一個框架內支持三種輸入:單張圖到 4D 生成,稀疏視頻幀到 4D 生成 + 重建,完整視頻到 4D 重建。

      1. DLC:解耦 LoRA 控制

      在基于視頻擴散模型的 “RGB + 幾何” 多模態聯合建模里,一個常見做法是把模態在通道維拼接。但在低資源微調時,這會導致嚴重的跨模態干擾,幾何學不好,基礎模型的 RGB 質量也容易被拖垮。而將兩個模態在長寬維度拼接,共享參數,也會導致跨模態干擾,幾何精度不高,而且與 RGB 無法保持對齊。

      One4D 提出 Decoupled LoRA Control(DLC) 來專門解決這個問題,設計目標包括:

      (1) 低資源微調也盡量保住底座視頻模型的強先驗;(2) 解耦 RGB 與幾何生成,減少互相干擾;(3) 仍要保留必要的跨模態通信,確保像素級對齊一致。

      具體做法是:

      1. 為 RGB 與 Pointmap 分別掛載模態專屬 LoRA,并且形成兩條解耦計算分支,共享凍結的 base 參數,但 forward 分開跑。確保兩個模態能夠相對獨立。

      2. 再用少量 zero-init 的 control links 連接對應層,讓兩個模態從 0 開始逐步學會互相控制,從而實現精確的像素級對齊。



      從直觀上理解 DLC 的設計, RGB 分支努力保持視頻美學與運動先驗,幾何分支專心擬合幾何視頻的分布,少量控制連接負責對齊同步。這也正是 One4D 強調的多模態輸出同步生成的關鍵。

      2. UMC:統一掩碼條件

      為了使用同一個視頻模型統一 4D 的生成和重建,One4D 基于Wan Video的多任務框架,提出了 Unified Masked Conditioning(UMC),把不同類型的條件如單幀、稀疏幀、全視頻,統一打包成一個條件視頻,缺失幀用 0 填充,并使用一個 mask 張量指定哪些幀需要生成。單張圖對應純生成,稀疏幀對應混合生成 + 重建,全視頻對應純重建。在UMC的具體實現上,RGB 分支的條件視頻通過 VAE 編碼之后,連接到 RGB 的 latent states 上。而 XYZ 分支不直接使用這個條件視頻,控制信號是通過 DLC 從 RGB 傳遞給 XYZ,這保證了 XYZ 分支能夠更好地去適應新模態。UMC 的設計讓 One4D 具備一個非常實用的能力,同一個擴散骨干,同時做 4D 生成和 4D 重建。One4D 模型不需要為不同任務改結構,只需改變輸入幀的稀疏度,就可以在不同生成與重建任務之間平滑切換。



      3. 訓練數據

      訓練 One4D,需要獲得大規模 “外觀 - 幾何” 配對數據。One4D 的數據構建遵循兩個原則:幾何要準、分布要真實。因此我們采用合成數據 + 真實數據混合策略。

      合成數據通過游戲引擎渲染動態場景,天然提供每幀的幾何真值,用于為 Pointmap(XYZ)提供穩定監督,幫助模型學到可靠的時序幾何一致性。

      真實數據,收集自公開視頻數據的真實場景視頻,以覆蓋復雜光照、材質、運動模式。由于真實視頻通常缺少幾何真值,我們使用現有的 4D 重建方法 Geo4D 生成幾何標注,從而把真實世界外觀分布引入訓練。

      這套數據策略帶來的直接收益是,合成數據提供幾何精度與穩定性,真實數據提供視覺多樣性與真實分布,從而讓 One4D 在保持視頻質感的同時,也能輸出可用、對齊、時序一致的 4D 幾何結果。One4D 使用 34K 條視頻在 8 張 NVIDIA H800 GPU 上訓練 5500 步,就得到了很好的效果。

      三、實驗結果

      1. 單圖到 4D 生成

      論文將 One4D 與 4DNeX 做了單圖到 4D 的對比,評價指標有:

      用戶偏好(User study):在一致性、動態性、美學、深度質量、整體 4D 連貫性等維度上,One4D 全面領先。



      VBench:動態性(Dynamic)顯著提升(55.7 vs 25.6),同時 I2V consistency 仍保持可比水平。



      這些結果支持了 One4D 的優勢,輸出的多模態結果有更真實的 RGB 動態、更干凈的深度、更完整連貫的 4D 點云與相機軌跡。在不犧牲 RGB 視頻質量的前提下,仍然能學到準確、細粒度的 4D 幾何結構。更多對比視頻請移步項目主頁:https://mizhenxing.github.io/One4D



      2. 完整視頻到 4D 重建

      One4D 并不只在 4D 生成任務上優勢顯著,它還是一個重建模型,在完整視頻 4D 重建上也保持了不錯的性能。在深度重建評測數據集 Sintel 和 Bonn 上,One4D 的表現明顯超過一些只做重建的方法如 MonST3R 和 CUT3R。即使我們的方法使用 Geo4D 構造了訓練數據,它也取得了與只做重建的 Geo4D 相近的效果。更多對比視頻請移步項目主頁:https://mizhenxing.github.io/One4D





      在相機軌跡評估數據集 Sintel 和 TUM 上,One4D 的相機估計能力也保持了可用精度,充分證明了 One4D 統一重建與生成的能力。



      3. 稀疏視頻幀到 4D 生成

      在稀疏視頻幀設置下,One4D 的輸入僅是首尾幀以及少量中間幀,此時模型需要生成缺失 RGB 幀并補全完整幾何序列。實驗證明,即使在極稀疏條件下,One4D 仍能得到合理的 4D 結構。這意味著 One4D 不止能做重建,而是真正具備生成動態 4D 場景的能力。



      四、總結

      One4D 讓視頻擴散模型不再只會生成 RGB,而是能夠同步生成外觀(RGB)與幾何(Pointmap / 深度 / 相機軌跡),在同一套框架中統一了 4D 生成和重建任務。它通過 UMC 與 DLC 解決了多任務切換與多模態聯合訓練中最關鍵的穩定性與對齊問題。One4D 推動視頻生成走向生成可用于理解與交互的 4D 世界,為下一代世界模型與多模態內容創作提供了更實用的基礎能力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      文化水平越低,民族仇恨越強烈

      文化水平越低,民族仇恨越強烈

      詩詞中國
      2026-01-22 19:56:07
      72歲老太被兒子送養老院,賣掉留兒子的5套學區房,1月后兒子傻眼

      72歲老太被兒子送養老院,賣掉留兒子的5套學區房,1月后兒子傻眼

      黃家湖的憂傷
      2025-06-13 17:43:22
      比恒大還狠!千億房企爆雷,老板套現60億后,把1470億債留給股民

      比恒大還狠!千億房企爆雷,老板套現60億后,把1470億債留給股民

      牛牛叨史
      2026-01-22 22:54:17
      最后一個月,停止一切治療。帶癌生存的爸爸,終于笑著吃了頓餃子

      最后一個月,停止一切治療。帶癌生存的爸爸,終于笑著吃了頓餃子

      今日養生之道
      2026-01-22 12:30:34
      考辛斯:37歲的杜蘭特依然打出MVP級別的賽季,我很看好火箭隊

      考辛斯:37歲的杜蘭特依然打出MVP級別的賽季,我很看好火箭隊

      懂球帝
      2026-01-23 00:24:31
      數覽成績單·2025新成就|中國工業經濟如何頂壓前行 這份“成績單”亮點滿滿

      數覽成績單·2025新成就|中國工業經濟如何頂壓前行 這份“成績單”亮點滿滿

      新華社
      2026-01-22 17:08:46
      4球3助,拉什福德創個人單賽季歐冠參與進球數新高

      4球3助,拉什福德創個人單賽季歐冠參與進球數新高

      懂球帝
      2026-01-22 06:14:04
      用10塊錢,兩天賺80萬,小女孩的“神操作”真讓人震驚!

      用10塊錢,兩天賺80萬,小女孩的“神操作”真讓人震驚!

      眼界看視野
      2026-01-21 21:08:02
      善惡終有報!47歲“跌落神壇”的李玉剛,終是活成了“跳梁小丑”

      善惡終有報!47歲“跌落神壇”的李玉剛,終是活成了“跳梁小丑”

      凡知
      2026-01-22 09:51:54
      ”經濟學家吳曉求教授說:“老百姓都沒收入了,還在刺激消費!這種做法是錯誤的!

      ”經濟學家吳曉求教授說:“老百姓都沒收入了,還在刺激消費!這種做法是錯誤的!

      張曉磊
      2025-11-07 11:34:05
      倒計時!曝巴薩批準,“超巨”或冬窗離隊!弗帥欽點22球“妖鋒”

      倒計時!曝巴薩批準,“超巨”或冬窗離隊!弗帥欽點22球“妖鋒”

      頭狼追球
      2026-01-22 11:36:37
      還沒上映就翻車?吳京新電影遭全網抵制,這是怎么了

      還沒上映就翻車?吳京新電影遭全網抵制,這是怎么了

      查爾菲的筆記
      2026-01-22 17:06:23
      小姑子兒子滿月酒擺了55桌,我提前把老公銀行卡里的50萬存款轉移

      小姑子兒子滿月酒擺了55桌,我提前把老公銀行卡里的50萬存款轉移

      今天說故事
      2025-11-20 10:20:25
      德國總理:格陵蘭島問題正朝著正確方向解決!丹麥國防大臣、北約秘書長發聲

      德國總理:格陵蘭島問題正朝著正確方向解決!丹麥國防大臣、北約秘書長發聲

      每日經濟新聞
      2026-01-22 20:35:04
      著名的反派演員馮雷隱婚8年,和演員何昊陽育有一女

      著名的反派演員馮雷隱婚8年,和演員何昊陽育有一女

      話娛論影
      2026-01-22 13:11:19
      2年前,我朋友非得說黃金漲價,當時400一克,他買了60萬黃金

      2年前,我朋友非得說黃金漲價,當時400一克,他買了60萬黃金

      千秋文化
      2026-01-21 21:08:57
      前湖人后衛以賽亞·托馬斯批評里奇·保羅,關于里夫斯交易的言論

      前湖人后衛以賽亞·托馬斯批評里奇·保羅,關于里夫斯交易的言論

      好火子
      2026-01-23 04:04:18
      621年李世民之子降生,袁天罡看了一眼嬰兒長嘆:此子其父是真龍

      621年李世民之子降生,袁天罡看了一眼嬰兒長嘆:此子其父是真龍

      如煙若夢
      2025-12-05 18:15:03
      埃弗頓名宿:我曾被騙到摩洛哥參加執教面試,并在當地被綁架

      埃弗頓名宿:我曾被騙到摩洛哥參加執教面試,并在當地被綁架

      懂球帝
      2026-01-23 05:14:32
      大反轉!日媒稱找到中國隊短板,一點或決定冠軍歸屬,球迷熱議

      大反轉!日媒稱找到中國隊短板,一點或決定冠軍歸屬,球迷熱議

      大秦壁虎白話體育
      2026-01-23 01:55:03
      2026-01-23 05:40:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12171文章數 142547關注度
      往期回顧 全部

      科技要聞

      幾千億只是開胃菜,AI基建還得再砸幾萬億

      頭條要聞

      特朗普起訴美國最大銀行 索賠至少50億美元

      頭條要聞

      特朗普起訴美國最大銀行 索賠至少50億美元

      體育要聞

      跑個步而已,他們在燃什么?

      娛樂要聞

      車銀優賺800億 涉嫌逃稅200億!

      財經要聞

      西貝拿到“救命錢”,然后呢

      汽車要聞

      配備多塊娛樂屏 極氪8X內飾曝光

      態度原創

      旅游
      親子
      房產
      公開課
      軍事航空

      旅游要聞

      南方人看雪新地標!不用去東北,廬山霧凇 + 云海,美得像童話!

      親子要聞

      真相很可怕!終于揭秘:為什么你記不住3歲前的事?

      房產要聞

      開年王炸!四重政策紅利加碼,廣州置業窗口期邁入倒計時!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      普京:愿意向"和平委員會"提供10億美元

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 在线观看黄片在线播放视频| 2021精品国产品免费观看| 一 级做人爱全视频在线看| 一级黄视频| 国产二区精品久久| 91丨人妻丨国产丨丝袜| 欧美人与禽交zozo| 国产又色又爽又黄的视频在线| 国产精品亚洲综合色区韩国| 性色做爰片在线观看ww| 亚洲青青草视频免费观看| 久久精品一区二区三区中文字幕| 精品国模| 老司机亚洲精品影院无码| 羞羞成人一区| 尤物最新网址| 成人午夜视频一区二区无码| 精品人妻一区二区蜜臀av| 国产香蕉九九久久精品免费| a4yy私人毛片| 久久久久人妻一区精品| 欧美日韩国产综合在线| 欧美色aⅴ欧美综合色| 普兰县| 国产色婷婷精品综合在线| 天天干天天射天天操| 成人欧美亚洲人妻| 国产黄色自拍视频| free性丰满白嫩白嫩的HD| 精品三级在线| 伊人天天久大香线蕉av色| 男女真人国产牲交a做片野外| 国产顶级熟妇高潮xxxxx| 邻居少妇张开双腿让我爽一夜| 永久在线精品免费视频观看| 精品国产免费一区二区三区香蕉| 纳雍县| 亚洲精品久久久久久久久久吃药| 国产人妖TS重口系列网站观看| 在线视频精品中文无码| 日日噜噜夜夜久久亚洲一区二区|