<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌4D世界模型來了,比SOTA快300倍!

      0
      分享至


      新智元報道

      編輯:艾倫

      【新智元導讀】谷歌 DeepMind 發布 D4RT,徹底顛覆了動態 4D 重建范式。它拋棄了復雜的傳統流水線,用一個統一的「時空查詢」接口,同時搞定全像素追蹤、深度估計與相機位姿。不僅精度屠榜,速度更比現有 SOTA 快出 300 倍。這是具身智能與自動駕駛以及 AR 的新基石,AI 終于能像人類一樣,實時看懂這個流動的世界。

      如果是幾年前,你問一位計算機視覺工程師:「我想把這段視頻里的所有東西——無論它是靜止的房子還是奔跑的狗——都在 3D 世界里重建出來,并且還能隨時知道它們下一秒會去哪兒,需要多久?」

      他大概會遞給你一根煙,讓你先去買幾塊頂級顯卡,然后給你畫一個由四五個不同模型拼湊起來的流程圖:先算光流,再算深度,再估相機位姿,最后還得用一晚上的時間去跑優化,祈禱結果別崩。

      但谷歌 DeepMind 剛剛發布的D4RT(Dynamic 4D Reconstruction and Tracking),試圖終結這種混亂。


      這篇論文在計算機視覺領域扔下了一枚關于「效率革命」的重磅炸彈。

      它把原本割裂的 3D 重建、相機追蹤、動態物體捕捉,統一成了一個極簡的「查詢」動作。


      更重要的是,它的速度比現有SOTA技術快了 18 到 300 倍。


      如果在你的認知里,高質量的 4D 重建還是好萊塢特效工作室里那些昂貴且緩慢的渲染農場,耗費漫長的時間等待生成完畢,那么 D4RT 正在把這種能力變成一種可以塞進機器人大腦甚至 AR 眼鏡里的實時直覺。

      Demo 演示

      為了理解 D4RT 到底做到了什么,我們需要先看一眼它眼中的世界。

      在論文展示的演示中,最直觀的震撼來自于對「動態混亂」的駕馭能力。

      想象一下這個畫面:一只天鵝在水面上劃過,或者一朵花在風中快速綻放。

      傳統的 3D 重建算法(比如 MegaSaM 或 )處理這種場景通常是一場災難——因為它們假設世界是靜止的,所以它們往往會在 3D 空間里留下一串「重影」,就像老式膠片重疊曝光一樣,天鵝變成了長著幾十個脖子的怪物,或者花朵直接變成了一團無法辨認的噪點。

      但 D4RT 給出的結果極其干凈。

      它不僅可以精準還原天鵝的 3D 形態,還完美剝離了相機的運動和天鵝自身的運動。

      在它的視野里,時間變成了一個可以隨意拖動的滑塊。


      更令人印象深刻的是它的全像素追蹤能力。

      你可以點擊視頻中花瓣上的任意一個像素,D4RT 就能畫出這個點在過去和未來的完整 3D 軌跡,哪怕這個點在中間幾幀被蜜蜂遮擋了,或者跑到了畫面之外,模型依然能根據上下文「腦補」出它的去向。


      這種視覺效果給人的感覺是:AI 不再是在一幀幀地「看」視頻,而是把整段視頻吞下去,在大腦里生成了一個完整的、流動的全息全景圖,然后你可以隨意從任何角度、任何時間去檢視它。


      模型能力對比圖

      拆解「神話」

      是真的快,還是文字游戲?

      科技公司發論文,數據通常都很漂亮。

      作為觀察者,我們需要剝離 PR 濾鏡,看看數據背后的定語。

      谷歌聲稱 D4RT 比之前的 SOTA 快了300 倍,處理一分鐘的視頻只需要 5 秒鐘。

      這是真的嗎?

      答案是:在特定維度上,是真的。

      這里的「300倍」指的是吞吐量,具體來說是「在保持相同幀率(FPS)的前提下,模型能同時追蹤多少條 3D 軌跡」。

      • 數據對比:在 24 FPS 的標準電影幀率下,之前的強者 SpatialTrackerV2 只能同時追蹤84條軌跡,再多就卡了;而 D4RT 可以輕松處理1570條。如果是和 DELTA 這種更慢的模型比,那就是314 倍的差距。


      • 實際意義:這意味著之前的技術可能只能盯著畫面里的主角(比如一個人),而 D4RT 可以同時盯著背景里走動的路人、飄落的樹葉和遠處的車流——即所謂的「全像素級感知」。

      它比同類技術強在哪兒?

      目前市面上的 4D 重建技術主要分兩派:

      1. 「拼裝派」(如 MegaSaM):把深度估計、光流、分割等多個現成模型串起來。雖然效果不錯,但不僅慢,而且一旦一個環節出錯(比如光流飄了),后面全完。

      1. 「多頭派」(如 VGGT):雖然是一個大模型,但為了輸出不同的任務(深度、位姿、點云),需要掛載不同的解碼頭,結構臃腫。

      D4RT 的牛,在于它做到了架構層面的統一

      它不需要為深度單獨做一個解碼器,也不需要為位姿單獨做一個。

      它只用同一個接口解決所有問題。


      有沒有代價?當然有。

      D4RT 的「快」主要體現在推理階段。

      在訓練階段,它依然是一個龐然大物。它的編碼器使用了 ViT-g,擁有10 億參數,并且需要在 64 個 TPU 芯片上訓練兩天。

      這絕不是普通開發者在自家車庫里能復現的玩具,它是典型的「大廠重武器」。

      技術解碼

      把 4D 重建變成「搜索引擎」

      那么,D4RT 到底是怎么做到的?

      論文的核心邏輯可以用一句話概括:先全局「閱讀」視頻,再按需「搜索」答案。

      不再逐幀解碼,而是「全局記憶」

      傳統的視頻處理往往是線性的,處理第 10 幀時可能已經「忘」了第 1 幀的細節。

      D4RT 的第一步是使用一個巨大的 Transformer 編碼器(Encoder),把整段視頻壓縮成一個全局場景表征(Global Scene Representation, F)

      你可以把這個F想象成 AI 對這段視頻形成的「長期記憶」。

      一旦這個記憶生成了,原本龐大的視頻數據就被濃縮在了這里。

      「哪里不會點哪里」的查詢機制

      這是 D4RT 最天才的設計。它發明了一種通用的查詢(Query)語言。

      當 AI 想要知道某個像素的信息時,它會向解碼器(Decoder)發送一個查詢 q:

      這個公式翻譯成人話就是:

      請告訴我:在這一幀圖像上坐標為的那個點,它在這個時間時刻,如果從這個相機的視角看過去,它的 3D 坐標在哪里?」

      • 如果你想生成深度圖:就問「現在這個點在現在的相機里多遠?」(讓 )。

      • 如果你想做軌跡追蹤:就問「這個點在第 1 幀、第 2 幀……第 N 幀都在哪?」(固定 ,改變 )。


      • 如果你想重建點云:就問「視頻里所有點在同一時刻的世界坐標在哪?」(把所有點都映射到同一個 )。



      并行計算的藝術

      因為每一個查詢(Query)都是獨立的,D4RT 不需要像穿針引線一樣按順序計算。

      它可以一次性扔出幾萬個問題,利用 GPU/TPU 的并行能力同時算出答案。

      這就是為什么它能比別人快 300 倍的根本原因:它把一個復雜的串行幾何問題,變成了一個大規模并行的搜索問題。

      關鍵的「作弊」技巧:9x9 Patch

      論文作者還發現了一個有趣的細節:如果只告訴解碼器坐標點,AI 有時候會「臉盲」,分不清紋理相似的區域。

      于是,他們在查詢時順便把那個像素點周圍9x9的小方塊圖像(RGB Patch)也喂給了模型。


      這就像是你讓人在人群中找人,光給個坐標不行,還得給他一張那個人臉部的特寫照片。

      消融實驗證明,這個小小的設計極大地提升了重建的銳度和細節。


      產業影響

      谷歌的野心與具身智能的眼睛

      D4RT 的出現,對谷歌現有的業務版圖和未來的 AI 戰略有著極強的互補性。

      具身智能與自動駕駛的最后一塊拼圖

      現在的機器人之所以笨,很大程度上是因為它們「看不懂」動態環境。

      一個掃地機器人能避開沙發,但很難預判一只正在跑過來的貓。

      D4RT 提供的實時、密集、動態的 4D 感知,正是機器人急需的技能。

      它能讓機器人理解:那個東西不僅現在在那里,而且下一秒它會出現在我左邊。

      對于自動駕駛而言,這種對動態物體(如行人、車輛)的像素級軌跡預測,是提升安全性的關鍵。

      增強現實(AR)的基石

      谷歌一直在 AR 領域尋找突破口(從當年的谷歌眼鏡,到現在的 Project Astra)。

      要在眼鏡端實現逼真的 AR,必須要有極低延遲的場景理解。

      D4RT 展示的高效推理能力(尤其是在移動端芯片上的潛力),讓「實時把虛擬怪獸藏在真實沙發后面」變得在工程上可行。

      對普通人的影響

      視頻編輯的「魔法化」

      對于普通用戶,這項技術最快落地的場景可能是手機相冊和視頻編輯軟件。

      想象一下,你拍了一段孩子踢球的視頻。

      有了 D4RT,你可以像在《黑客帝國》里一樣,在視頻播放過程中隨意旋轉視角(盡管你拍攝時并沒有移動),或者輕易地把路人從復雜的背景中「扣」掉,甚至改變視頻中光源的方向。

      這是 D4RT 這種 4D 重建技術成熟后的應用之一。

      結語

      D4RT 讓我們看到了一種新的可能性:AI 對世界的理解,正在從二維的「圖像識別」跨越到四維的「時空洞察」。

      它告訴我們,要看清這個流動的世界,關鍵不在于每一幀都看得多仔細,而在于如何建立一個能夠隨時回應疑問的全局記憶。

      AI的眼中,過去并沒有消逝,未來也不再不可捉摸,它們只是同一個四維坐標系里,等待被查詢的兩個不同參數而已。

      參考資料:

      https://d4rt-paper.github.io/

      https://deepmind.google/blog/d4rt-teaching-ai-to-see-the-world-in-four-dimensions/

      https://storage.googleapis.com/d4rt_assets/D4RT_paper.pdf


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      越扒越亮!李亞鵬當年在小沈陽熊黛林發生矛盾時的發言太爺們了!

      越扒越亮!李亞鵬當年在小沈陽熊黛林發生矛盾時的發言太爺們了!

      樂悠悠娛樂
      2026-01-22 08:58:02
      中國的陽謀奏效!特朗普心態已崩,五角大樓:請33國防長迅速赴美

      中國的陽謀奏效!特朗普心態已崩,五角大樓:請33國防長迅速赴美

      云鵬敘事
      2026-01-24 11:55:26
      賴清德邁出危險一步,想和澤連斯基聊聊,并打算對普京干一件大事

      賴清德邁出危險一步,想和澤連斯基聊聊,并打算對普京干一件大事

      松林看世界
      2026-01-24 06:48:34
      現場目擊:成都城南高速四輛執法車并排行駛致大面積車輛滯留緩行

      現場目擊:成都城南高速四輛執法車并排行駛致大面積車輛滯留緩行

      大眾新聞報社記者
      2026-01-24 12:35:02
      昭通市委書記市長,會見“蹦山咔拉咔”

      昭通市委書記市長,會見“蹦山咔拉咔”

      極目新聞
      2026-01-23 20:13:00
      1958年,志愿軍首長途經遼寧一縣,竟發現被認定 “犧牲” 的功臣,成了當地糧倉的警衛

      1958年,志愿軍首長途經遼寧一縣,竟發現被認定 “犧牲” 的功臣,成了當地糧倉的警衛

      文史明鑒
      2026-01-23 20:02:08
      泰山隊盯上百萬身價俄鐵塔,零元購+192cm防空鎖,中超最冷血操作

      泰山隊盯上百萬身價俄鐵塔,零元購+192cm防空鎖,中超最冷血操作

      體壇小鵬
      2026-01-24 09:37:35
      郭晶晶代言品牌被立案調查 跳水女皇退役15年年代言收入超5000萬

      郭晶晶代言品牌被立案調查 跳水女皇退役15年年代言收入超5000萬

      勁爆體壇
      2026-01-23 13:18:04
      商業航天+光伏概念股,強關聯的10家公司!

      商業航天+光伏概念股,強關聯的10家公司!

      風風順
      2026-01-24 02:00:03
      中國很“奇怪”的2個鎮:名字一模一樣、卻分別隸屬于不同的省份

      中國很“奇怪”的2個鎮:名字一模一樣、卻分別隸屬于不同的省份

      千秋歷史
      2025-08-18 09:44:45
      6000米深海!日本重金開采稀土,剛動手就被中國一紙禁令“掐喉”

      6000米深海!日本重金開采稀土,剛動手就被中國一紙禁令“掐喉”

      素衣讀史
      2026-01-23 17:20:48
      四大名著,終于有人敢說,這本,該踢出四大名著了

      四大名著,終于有人敢說,這本,該踢出四大名著了

      長風文史
      2026-01-22 15:17:46
      一語道破女留學生的牢A,親眼目睹陪讀媽媽的悲哀,到底真還是假

      一語道破女留學生的牢A,親眼目睹陪讀媽媽的悲哀,到底真還是假

      每日一見
      2026-01-23 15:07:50
      庫里創NBA歷史首例三分球出手突破1萬次…命中4222個亦為歷史之最

      庫里創NBA歷史首例三分球出手突破1萬次…命中4222個亦為歷史之最

      煙潯渺渺
      2026-01-24 10:57:42
      弘一法師:不要太操心你的孩子和在意的親人,每個人都有自己的命

      弘一法師:不要太操心你的孩子和在意的親人,每個人都有自己的命

      木言觀
      2026-01-18 13:56:24
      司令員入山剿匪,得知參謀出發前打了個電話后立即下令:原路返回

      司令員入山剿匪,得知參謀出發前打了個電話后立即下令:原路返回

      阿器談史
      2026-01-23 18:38:24
      河南小伙娶小18歲伊拉克媳婦,認識4天就結婚,彩禮花了3000萬!

      河南小伙娶小18歲伊拉克媳婦,認識4天就結婚,彩禮花了3000萬!

      凡知
      2026-01-17 10:15:33
      太陽報:曼市德比首發泄露,曼聯已展開內部調查

      太陽報:曼市德比首發泄露,曼聯已展開內部調查

      懂球帝
      2026-01-24 12:15:07
      班主任群里統計父母在外務工名單遭怒懟!網友叫屈:這是上級任務

      班主任群里統計父母在外務工名單遭怒懟!網友叫屈:這是上級任務

      火山詩話
      2026-01-22 09:14:54
      一場追悼會,戳穿向華強夫婦在香港的真實地位,原來李連杰沒說謊

      一場追悼會,戳穿向華強夫婦在香港的真實地位,原來李連杰沒說謊

      凡知
      2026-01-21 17:14:40
      2026-01-24 13:55:00
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14398文章數 66526關注度
      往期回顧 全部

      科技要聞

      特斯拉Cybercrab即將落地 每公里不到1塊錢

      頭條要聞

      女子患癌為籌錢治病賣掉勞力士 收16萬元后賬戶被凍結

      頭條要聞

      女子患癌為籌錢治病賣掉勞力士 收16萬元后賬戶被凍結

      體育要聞

      當家球星打替補,他們在故意擺爛?

      娛樂要聞

      李微漪更新:狼王格林去世,3字淚目

      財經要聞

      “百年老字號”張小泉遭60億債務壓頂

      汽車要聞

      有增程和純電版可選 日產NX8或于3-4月間上市

      態度原創

      教育
      藝術
      本地
      數碼
      時尚

      教育要聞

      刷到就是大數據認為你要進復試啦!

      藝術要聞

      色彩之巔!法國蓬皮杜中心館藏藝術大師特展”在北京民生現代美術館開幕

      本地新聞

      云游中國|格爾木的四季朋友圈,張張值得你點贊

      數碼要聞

      Mad Catz美加獅21按鍵鼠標M.M.O. 7+國行上市,到手999元

      不一定能掀桌男主,但一定是個好演員!

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲国产综合av| 日本一二三区视频在线| 欧美丝袜另类| 国产成人无码精品一区二区三区 | 色欲AV无码一区二区人妻| 中文字幕亚洲精品乱码在线看| 国产精品爽爽ⅴa在线观看| 光泽县| 中文字幕一区二区三区四区五区 | 乱码AV麻豆丝袜熟女系列| 国产精品美女一区二区三区| 天镇县| 久久香蕉国产线看观看精品yw| 久久55| 快好爽射给我视频| 国产制服丝袜在线视频观看| 综合成人亚洲| 九色91| 亚洲日本乱码一区二区在线二产线 | 午夜综合网| 69天堂人成无码麻豆免费视频| 国产成人精品三级在线影院| 老年人性行交视频| 色窝窝无码一区二区三区| 国产精品午夜视频自在拍| 人妻熟女一区二区aⅴ林晓雪| 获嘉县| 日本久久高清一区二区三区毛片| 五月丁香六月| 国产成人无码一区二区三区在线| 91亚洲视频| 精品久久久无码中文字幕| 久久无码专区| 成人精品区| 海角社区91熟女丝袜脚国产| 国产仑乱无码内谢| 国产精品成人av电影不卡| 亚洲视频高清不卡在线观看| 亚洲国产欧美在线人成大黄瓜| 久久精品国产国产精品四凭| 加勒比中文无码久久综合色|