<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      VGGT4D:無需訓練,挖掘3D基礎模型潛力,實現4D動態場景重建

      0
      分享至



      如何讓針對靜態場景訓練的 3D 基礎模型(3D Foundation Models)在不增加訓練成本的前提下,具備處理動態 4D 場景的能力?

      來自香港科技大學(廣州)與地平線 (Horizon Robotics) 的研究團隊提出了 VGGT4D。該工作通過深入分析 Visual Geometry Transformer (VGGT) 的內部機制,發現并利用了隱藏在注意力層中的運動線索。



      作為一種無需訓練 (Training-free) 的框架,VGGT4D 在動態物體分割、相機位姿估計及長序列 4D 重建等任務上均取得了優異性能。



      • 論文標題: VGGT4D: Mining Motion Cues in Visual Geometry Transformers for 4D Scene Reconstruction
      • 論文鏈接:https://arxiv.org/abs/2511.19971
      • 項目主頁: https://3dagentworld.github.io/vggt4d/
      • 代碼鏈接:https://github.com/3DAgentWorld/VGGT4D

      研究背景

      近年來,以 VGGT、DUSt3R 為代表的 3D 基礎模型在靜態場景重建中表現出色。然而,面對包含移動物體(如行人、車輛)的動態 4D 場景時,這些模型的性能往往顯著下降。動態物體的運動不僅干擾背景幾何建模,還會導致嚴重的相機位姿漂移。

      現有的解決方案通常面臨兩類挑戰:

      • 計算或訓練成本高:依賴繁重的測試時優化 (Test-time Optimization) 或需要在大規模 4D 數據集上進行微調。
      • 依賴外部先驗:通常需要引入光流、深度估計或語義分割等額外模塊,增加了系統的復雜性。

      VGGT4D 的核心設想:能否在不進行額外訓練的前提下,直接從預訓練的 3D 基礎模型中挖掘出 4D 感知能力?

      核心洞察:VGGT 內部的潛在運動線索

      研究人員對 VGGT 的注意力機制進行了可視化分析,觀察到一個關鍵現象:VGGT 的不同網絡層對動態區域表現出截然不同的響應模式。

      • 淺層網絡:傾向于捕捉語義上顯著的動態物體。
      • 深層網絡:則逐漸抑制幾何不一致的區域。



      這一發現表明,VGGT 雖然是基于靜態假設訓練的,但其內部實際上已經 隱式編碼 了豐富的動態線索。



      方法論:潛在運動線索的挖掘與解耦

      VGGT4D 的核心貢獻在于提出了一套無需訓練的注意力特征挖掘與掩膜精修機制。該方法深入特征流形內部,利用 Gram 矩陣和梯度流實現了高精度的動靜分離。



      跨越投影間隙:基于 Gram 相似度的特征挖掘







      基于投影雅可比矩陣的梯度流精修

      為了解決 Attention Map 分辨率不足導致的邊界模糊問題,VGGT4D 引入了 投影梯度感知精修 (Projection Gradient-aware Refinement)。





      分布內早期掩膜策略(In-Distribution Early-Stage Masking)

      在推理階段,直接的全層掩膜(Full Masking)會將模型推向分布外(OOD)狀態,導致性能下降。

      VGGT4D 提出了一種早期階段干預策略:僅在淺層抑制動態 Token 的 Key 向量。這種設計既在早期切斷了動態信息對深層幾何推理的影響,又保證了深層 Transformer Block 依然在其預訓練的特征流形上運行,從而保證了位姿估計的魯棒性。

      實驗驗證

      研究團隊針對動態物體分割、相機位姿估計和 4D 點云重建三大核心任務,在六個基準數據集上進行了詳盡的定量和定性評估。

      核心組件評估:動態物體分割性能

      實驗首先評估了該方法的核心組件:動態物體分割。





      定性分析:定性結果清晰地展示了基線方法的不足:Easi3R 的掩碼較為粗糙且遺漏細節;DAS3R 傾向于過度分割并滲入靜態背景;MonST3R 則常常分割不足。相比之下,VGGT4D 生成的掩碼更加準確,且邊界更加清晰。這些結果有力地驗證了研究團隊的假設:VGGT 的 Gram 相似度統計信息中嵌入了豐富的、可提取的運動線索。



      魯棒性驗證:相機位姿估計

      強大的基線與持續改進:數據表明,原始 VGGT 已經是一個非常強大的基線,其自身就優于 MonST3R、DAS3R 等許多專門的 4D 重建方法。這表明 VGGT 的預訓練隱式地使其對動態物體具有一定的魯棒性。然而,這種魯棒性并不完美。 VGGT4D 在所有數據集上均持續改進了這一強大的 VGGT 基線。例如在 VKITTI 數據集上,VGGT4D 的 ATE 僅為 0.164,而 MonST3R 高達 2.272。



      長序列魯棒性突破:在極具挑戰性的長序列 Point Odyssey 基準測試中,VGGT4D 在所有指標上均取得了最佳結果,同時保持了高度效率。許多其他 4D 方法由于內存不足(OOM)錯誤甚至無法在該 500 幀序列上運行。這表明 VGGT4D 提出的顯式、無需訓練的動態 - 靜態分離方法成功地識別并消除了由運動引起的殘余位姿不一致性,從而實現了更穩定、更準確的相機軌跡,尤其是在長且復雜的序列上。



      最終目標:4D 點云重建質量實驗

      在 DyCheck 數據集上的評估顯示,VGGT4D 在所有重建指標(準確度、完整度和距離)上均取得了最佳性能。與 VGGT 基線相比,中位準確度誤差從 0.009 降低到 0.004,平均距離從 0.150 降低到 0.123。這證明了該方法不僅實現了精準的動靜分離,更能實質性提升幾何重建質量。





      結語

      VGGT4D 提出了一種無需訓練的新范式,成功將 3D 基礎模型的能力擴展至 4D 動態場景。該工作證明了通過合理挖掘模型內部的 Gram 相似度統計特性,可以有效解耦動態與靜態信息。這不僅為低成本的 4D 重建提供了新思路,也展示了基礎模型在零樣本遷移任務中的潛力。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      4死1傷!柳州69歲老人砍鄰居跳樓身亡疑長期忍受被小孩吵不得休息

      4死1傷!柳州69歲老人砍鄰居跳樓身亡疑長期忍受被小孩吵不得休息

      歷史偉人錄
      2025-12-17 15:01:17
      降息降了寂寞(36圖)

      降息降了寂寞(36圖)

      邊際財經實驗室
      2025-12-17 18:56:18
      誤把雙胞胎妹妹當老婆,事后竟被要求:不許告訴我姐!

      誤把雙胞胎妹妹當老婆,事后竟被要求:不許告訴我姐!

      極品小牛肉
      2024-12-09 09:12:16
      黑色幽默!電詐園區辦公室中文標語,簡直是天大的諷刺

      黑色幽默!電詐園區辦公室中文標語,簡直是天大的諷刺

      麥大人
      2025-11-06 08:32:30
      傅作義親自護送5位敵將登機南逃,幾十年后才知他保住的是什么

      傅作義親自護送5位敵將登機南逃,幾十年后才知他保住的是什么

      小哥很OK
      2025-12-16 09:24:47
      性能力與壽命關系被發現!男性40歲后,睪酮越高,死亡風險越低

      性能力與壽命關系被發現!男性40歲后,睪酮越高,死亡風險越低

      藥師說健康
      2025-12-05 09:47:10
      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      古書記史
      2025-12-11 17:37:45
      燃油車殺回來了!僅售7.58萬,月銷量38434臺,比小米SU7還火!

      燃油車殺回來了!僅售7.58萬,月銷量38434臺,比小米SU7還火!

      隔壁說車老王
      2025-12-17 06:06:13
      48小時痛失兩巨星!何晴走后遺產曝光,許亞軍回應6字看呆眾人

      48小時痛失兩巨星!何晴走后遺產曝光,許亞軍回應6字看呆眾人

      草莓解說體育
      2025-12-17 09:20:06
      亞羅什:我的目標是取代阿利松和馬馬爾達什維利,并贏得歐冠

      亞羅什:我的目標是取代阿利松和馬馬爾達什維利,并贏得歐冠

      懂球帝
      2025-12-17 19:14:04
      許家印,為啥沒動靜了?

      許家印,為啥沒動靜了?

      數字財經智庫
      2025-12-17 16:54:48
      黃公略唯一的骨血,由彭德懷親自撫養長大的黃歲新,后來怎么樣了

      黃公略唯一的骨血,由彭德懷親自撫養長大的黃歲新,后來怎么樣了

      南書房
      2025-11-14 17:10:03
      不值錢了!低分批發211學歷崩了,太原某211計算機碩士稱簡歷沒人要

      不值錢了!低分批發211學歷崩了,太原某211計算機碩士稱簡歷沒人要

      趣筆談
      2025-12-17 14:33:09
      女孩深夜報警:爸爸偷看我洗澡,父親:我那時在外出差

      女孩深夜報警:爸爸偷看我洗澡,父親:我那時在外出差

      罪案洞察者
      2025-11-26 14:06:00
      大風追蹤|27歲海歸女子遇害551天后第二次開庭,嫌犯堅稱系正當防衛,遇害者母親稱12月19日宣判

      大風追蹤|27歲海歸女子遇害551天后第二次開庭,嫌犯堅稱系正當防衛,遇害者母親稱12月19日宣判

      大風新聞
      2025-12-16 21:46:28
      詹姆斯離開騎士時,讓城市損失10億美元!但他工資才2000萬!

      詹姆斯離開騎士時,讓城市損失10億美元!但他工資才2000萬!

      氧氣是個地鐵
      2025-12-17 19:02:36
      “鴻蒙大飯店”不再提供免費餐食:地主家也沒有余糧了?

      “鴻蒙大飯店”不再提供免費餐食:地主家也沒有余糧了?

      新浪財經
      2025-12-16 16:36:19
      知名演員官宣:已退出美國國籍,正式成為中國公民!

      知名演員官宣:已退出美國國籍,正式成為中國公民!

      草莓解說體育
      2025-12-17 10:08:45
      武磊身價僅50萬!13年新低,巔峰1000萬,已傷缺214天

      武磊身價僅50萬!13年新低,巔峰1000萬,已傷缺214天

      奧拜爾
      2025-12-17 18:48:19
      軍演結束,中國001航母返航,高市賭中方不敢玩真的,結果破防了

      軍演結束,中國001航母返航,高市賭中方不敢玩真的,結果破防了

      博覽歷史
      2025-12-16 18:54:34
      2025-12-17 19:51:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11943文章數 142512關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      中方被指對日本提出批評并要多國支持立場 外交部回應

      頭條要聞

      中方被指對日本提出批評并要多國支持立場 外交部回應

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      狗仔曝熱播劇姐弟戀真談了???

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      健康
      房產
      本地
      手機
      公開課

      這些新療法,讓化療不再那么痛苦

      房產要聞

      團購14888元/㎡起!海建·鳳翔豪庭獻禮自貿港封關

      本地新聞

      云游安徽|踏過戰壕與石板,讀一部活的淮北史

      手機要聞

      驍龍8 Gen 5+8300mAh大電池!一加 Ace 6T打造全新性價比之選

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 多毛老熟女| 真实国产老熟女无套中出| 色婷婷久久久swag精品| 日本妇人成熟免费| 中文字幕?人妻熟女| 美女成人网站| 亚洲AV成人无码久久精品黑人| 亚洲日本一区二区一本一道| 国产精品无码一区二区在线| 日韩第一页浮力| 福利在线视频导航| 曰批永久免费40分钟免费观看软件| 91视频在线看| 精品国产av一区二区三区| 野外少妇愉情中文字幕| 成人免费A片| 五月。。激情綜合老漢色| 国产精品国产三级国产试看| 亚洲AV成人无码精在线| 伊人成色综合网| 天堂8中文在线最新版在线| 国产亚洲精品??码| 巫山县| 国产αv| 九九久久自然熟的香蕉图片| 国产乱视频在线观看| 亚洲日韩乱码中文无码蜜桃臀 | 日本污视频在线观看| 中文字幕av在线一二三区| 亚洲精品美女久久久久99| 午夜精品一区二区三区在线视频| 亚洲一级电影| 国产老熟女伦老熟妇露脸| 色窝窝免费一区二区三区| 动漫av永久无码精品每日更新| 国产色精品久久人妻| 祁连县| 大熟女在线| 精品久久久久中文字幕无码油| 91资源总站| 成熟了的熟妇毛茸茸|