<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      LaDi-WM模型大幅提升機器人操作策略的成功率和跨場景泛化能力

      0
      分享至



      在機器人操作任務中,預測性策略近年來在具身人工智能領域引起了廣泛關注,因為它能夠利用預測狀態來提升機器人的操作性能。然而,讓世界模型預測機器人與物體交互的精確未來狀態仍然是一個公認的挑戰,尤其是生成高質量的像素級表示。

      為解決上述問題,國防科大、北京大學、深圳大學團隊提出LaDi-WM(Latent Diffusion-based WorldModels),一種基于隱空間擴散的世界模型,用于預測隱空間的未來狀態。

      具體而言,LaDi-WM 利用預訓練的視覺基礎模型 (Vision Fundation Models) 來構建隱空間表示,該表示同時包含幾何特征(基于 DINOv2 構造)和語義特征(基于 Siglip 構造),并具有廣泛的通用性,有利于機器人操作的策略學習以及跨任務的泛化能力。

      基于 LaDi-WM,團隊設計了一種擴散策略,該策略通過整合世界模型生成的預測狀態來迭代地優化輸出動作,從而生成更一致、更準確的動作結果。通過在虛擬和真實數據集上的大量實驗,LaDi-WM 能夠顯著提高機器人操作任務的成功率,尤其是在 LIBERO-LONG 數據集上提升27.9%,超過之前的所有方法。





      • 論文地址:https://arxiv.org/abs/2505.11528
      • 項目主頁:https://guhuangai.github.io/LaDiWM.github.io/

      論文創新點:

      1.一種基于隱空間擴散的世界模型:使用視覺基礎模型構建隱空間的通用表示,并在隱空間學習可泛化的動態建模能力。

      2.一種基于世界模型預測迭代優化的擴散策略:利用世界模型生成未來預測的狀態,將預測的狀態反饋給策略模型,迭代式地優化策略輸出。



      圖 1 :(左)通過任務無關的片段學習隱擴散世界模型;(右)通過世界模型的未來狀態預測來優化策略模型

      技術路線

      該團隊提出一種利用世界模型優化策略學習的框架,以學習機器人抓取操作相關的技能策略。該框架可分為兩大階段:世界模型學習和策略學習。

      A. 世界模型學習:

      (a)隱空間表示:通過預訓練的視覺基礎模型對觀測圖像提取幾何表征與語義表征,其中幾何表征利用 DINOv2 提取,而語義表征則使用 Siglip 提取。

      (b)交互擴散:同時對兩種隱空間表示實施擴散過程,并在擴散過程中讓二者充分交互,學習幾何與語義表征之間的依賴關系,從而促進兩種表示的準確動態預測。



      圖 2 : 基于交互擴散的世界模型架構

      B. 策略模型訓練與迭代優化推理

      (a)結合世界模型的未來預測引導策略學習:將世界模型給出的未來預測作為額外的輸入,引導策略模型的準確動作預測;模型架構基于擴散策略模型,有利于學習多模態動作分布。

      (b)迭代優化策略輸出:策略模型可以在一個時間步多次利用世界模型的未來預測作為引導,從而不斷優化自身的動作輸出。實驗顯示,該方案可以逐漸降低策略模型的輸出分布熵,達到更準確的動作預測。



      圖 3 : 基于未來預測引導的策略模型架構

      實驗結果

      虛擬實驗:

      在公開的虛擬數據集(LIBERO-LONG,CALVIN D-D)中,團隊驗證了所提出框架在機器人抓取相關的操作任務上的性能。在實驗中,世界模型的訓練數據會與策略模型的訓練數據區分開,從而驗證世界模型的泛化能力。對于 LIBERO-LONG,給定語言指令,多次執行并統計機器人完成各項任務的成功率。對于 CALVIN D-D,連續給定五個語言指令,多次執行并統計平均完成任務的數量。

      在 LIBERO-LONG 數據集,為了驗證世界模型對策略模型的引導作用,團隊僅使用 10 條軌跡去訓練各任務,對比結果如表 1 所示。相比于其他方法,LaDi-WM 能夠提供精確的未來預測,并將預測反饋給策略模型,不斷優化動作輸出,僅需少量訓練數據即可達到 68.7% 的成功率,顯著優于其他方法。



      表 1: LIBERO-LONG 性能對比

      在 CALVIN D-D 數據集上,LaDi-WM 同樣展示了在長時任務中的強大性能(表 2)。



      表 2: CALVIN D-D 性能對比

      團隊進一步驗證了所提出框架的可擴展性,如圖 4 所示。

      (a)逐漸增大世界模型的訓練數據,模型的預測誤差逐漸降低且策略性能逐漸提升;

      (b)逐漸增大策略模型的訓練數據,抓取操作的成功率逐漸提升;

      (c)逐漸增大策略模型的參數量,抓取操作的成功率逐漸提升。



      圖 4 : 可擴展性實驗

      為了驗證 LaDi-WM 的跨場景泛化能力,團隊在 LIBERO-LONG 上訓練世界模型,并直接應用于 CALVIN D-D 的策略學習中,實驗結果如表 3 所示。若是使用在 LIBERO-LONG 訓練的原始策略模型,直接應用到 CALVIN D-D 是不工作的(表第一行);而使用在 LIBERO-LONG 訓練的世界模型來引導 CALVIN 環境下的策略學習,則可以比在 CALVIN 環境訓練的原始策略的性能高 0.61(表第三行)。這表明,世界模型的泛化能力要優于策略模型的泛化能力。



      表 3: 跨場景實驗結果。L 代表 LIBERO-LONG,C 代表 CALVIN D-D

      團隊進一步探索了利用世界模型迭代優化的工作原理。團隊收集不同迭代輪次下策略模型的輸出動作并繪制其分布,如圖 5 所示。迭代優化的過程中,輸出動作分布的熵在逐漸降低,這表明策略模型每一步的輸出動作更加穩定,從而提升整體的抓取成功率。



      圖 5 : 迭代優化的動作分布對比

      真機實驗:

      團隊也在真實場景中驗證了所提出框架的性能,具體操作任務包括「疊碗」、「開抽屜」、「關抽屜」以及「抓取物體放入籃子」等,如圖 6 所示。



      圖 6 : (左)真實場景環境;(右)機器人實際操作樣例

      在真實場景中,LaDi-WM 將原始模仿學習策略的成功率顯著提升 20%(表 4)。



      表 4: 真實場景性能對比

      圖 7 展示了最終所得策略模型在不同任務上的執行軌跡,從圖中可以發現,提出的策略能夠在不同光照條件以及不同初始位置的情況下有魯棒的泛化性。



      圖 7 : 真實場景機器人執行軌跡

      總結

      國防科大、北京大學、深圳大學團隊提出了一種隱空間擴散的世界模型 LaDi-WM(Latent Diffusion-based World Models),利用視覺基礎模型提取通用的隱空間表示,并在隱空間學習可泛化的動態建模。同時,團隊提出基于世界模型的未來預測來引導策略學習,在推理階段通過迭代式地優化策略輸出,從而進一步提高策略輸出動作的準確度。團隊通過虛擬與真機上廣泛的實驗證明了 LaDi-WM 的有效性,所提出的方法顯著提升了機器人抓取操作技能的性能。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      就在今天!12月8日上午,男籃傳來徐杰、廣東宏遠和國家隊消息

      就在今天!12月8日上午,男籃傳來徐杰、廣東宏遠和國家隊消息

      皮皮觀天下
      2025-12-08 13:19:50
      趙本山兒子請客吃砂鍋,趙一楠染一頭黃發,宋曉峰喝到臉泛紅

      趙本山兒子請客吃砂鍋,趙一楠染一頭黃發,宋曉峰喝到臉泛紅

      李橑在北漂
      2025-12-08 08:22:30
      法國與浙江都是6000多萬人口,法國創造了3萬多億美元,浙江呢?

      法國與浙江都是6000多萬人口,法國創造了3萬多億美元,浙江呢?

      回京歷史夢
      2025-11-10 13:29:34
      12月26日起 美國出入境大變革:綠卡也無法幸免!

      12月26日起 美國出入境大變革:綠卡也無法幸免!

      華人生活網
      2025-12-08 03:27:09
      李嘉誠預言要成真了!中國42%城鎮家庭的房子,將面臨這4現實難題

      李嘉誠預言要成真了!中國42%城鎮家庭的房子,將面臨這4現實難題

      巢客HOME
      2025-12-07 04:45:03
      學霸的努力程度到底有多恐怖?網友評論看呆了

      學霸的努力程度到底有多恐怖?網友評論看呆了

      另子維愛讀史
      2025-12-05 21:17:46
      二號位位置上打得如魚得水,勇士后場新星看來不太適合打一號位?

      二號位位置上打得如魚得水,勇士后場新星看來不太適合打一號位?

      稻谷與小麥
      2025-12-08 22:42:30
      張本智和輸了被喝倒彩,法國名將為他發聲,日本網友表示不滿

      張本智和輸了被喝倒彩,法國名將為他發聲,日本網友表示不滿

      小犙拍客在北漂
      2025-12-08 22:13:16
      官方通報44歲男子在公園摟抱女童:刑拘

      官方通報44歲男子在公園摟抱女童:刑拘

      界面新聞
      2025-12-08 09:02:55
      燒光35億!海瀾之家被“除名”

      燒光35億!海瀾之家被“除名”

      大佬灼見
      2025-11-21 09:08:28
      北京挖出大太監李蓮英之墓,開棺后,考古人員被嚇得渾身發抖

      北京挖出大太監李蓮英之墓,開棺后,考古人員被嚇得渾身發抖

      嘆知
      2025-12-02 12:25:10
      8號收評:三大指數高開高走,所有人都注意,準備迎接新的變盤了

      8號收評:三大指數高開高走,所有人都注意,準備迎接新的變盤了

      春江財富
      2025-12-08 15:19:36
      錯失主力,媒體評火箭簽下史密斯略顯著急,老鷹沃克或是更好人選

      錯失主力,媒體評火箭簽下史密斯略顯著急,老鷹沃克或是更好人選

      拾叁懂球
      2025-12-08 01:19:33
      我國人口達到14億,為何生意還是越來越難做?有4個原因要知曉

      我國人口達到14億,為何生意還是越來越難做?有4個原因要知曉

      貓叔東山再起
      2025-12-08 10:25:07
      絕了!C羅撩金姐加時90個月,金姐點贊陰陽手讓全球吃瓜成主隊

      絕了!C羅撩金姐加時90個月,金姐點贊陰陽手讓全球吃瓜成主隊

      羅氏八卦
      2025-12-08 10:18:19
      特朗普還沒啟程訪華,中國突然公布黃金庫存,美國霸權地位已不保

      特朗普還沒啟程訪華,中國突然公布黃金庫存,美國霸權地位已不保

      動漫里的童話
      2025-12-08 19:27:02
      家庭糾紛太適合讓年輕人去整頓了!網友:掀完桌子 我媽眼神都崇拜

      家庭糾紛太適合讓年輕人去整頓了!網友:掀完桌子 我媽眼神都崇拜

      夜深愛雜談
      2025-11-30 23:01:12
      杭州承辦世預賽票房破5000萬,據估創10億級別的綜合經濟效益

      杭州承辦世預賽票房破5000萬,據估創10億級別的綜合經濟效益

      懂球帝
      2025-12-08 12:10:08
      唐山殺警案,9年沒破案,原來兇手就在專案組

      唐山殺警案,9年沒破案,原來兇手就在專案組

      史記趣聞
      2025-12-04 20:55:06
      日本旅游到底有多“累”?

      日本旅游到底有多“累”?

      窮游網
      2025-12-03 10:31:35
      2025-12-08 23:43:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      11873文章數 142510關注度
      往期回顧 全部

      科技要聞

      國產機械硬盤尚未攻克,華為高管呼吁

      頭條要聞

      江蘇男子貴州投資養羊損失近百萬 543只羊被"躲貓貓"

      頭條要聞

      江蘇男子貴州投資養羊損失近百萬 543只羊被"躲貓貓"

      體育要聞

      一位大學美術生,如何用4年成為頂級跑者?

      娛樂要聞

      章子怡被說拜高踩低 主動和卡梅隆熱聊

      財經要聞

      百億金融爆雷 浙商大佬"朋友圈"也不靈了

      汽車要聞

      純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

      態度原創

      數碼
      游戲
      手機
      教育
      藝術

      數碼要聞

      聯想卷軸屏筆記本Legion Pro曝光:可水平展開,秒變21:9寬屏

      KeSPA杯:HLE和T1保持不敗,宙斯和小呂布有望碰撞Faker

      手機要聞

      三星三折疊手機:主\副屏觸控+側邊指紋方案來自匯頂

      教育要聞

      高中地理三年常考【世界地理】名詞解釋,高中生速看

      藝術要聞

      一棵樹的力量

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 在线A级毛片无码免费真人| 日韩一级亚洲一午夜免费观看中文版国语版 | 一区二区免费| 久久婷婷影院| 丝袜美腿一区二区三区| 2020精品国产自在现线看| 亚洲精品日本久久久中文字幕| 熟女爱V| 亚洲第一页色| 一线二线三线天堂| 亚洲国产亚洲综合在线尤物| 久久精品99久久久久久久久| 欧洲成人综合| 无码h黄肉3d动漫在线观看| 丝袜老师办公室里做好紧好爽| 极品熟女精品| 中文一区二区| 成人性生交大片免费看视频app| 免费无遮挡毛片中文字幕| 桃色91| 国产精品熟妇视频国产偷人| 99热这里只有精品最新地址获取| 亚洲伊人久久综合成人| 成人国产综合| 精品视频九九| 人妻无码久久| 日韩人妻网站| 洋洋av| www熟女com| 99热国产在线| 伊人综合夜夜操| jizz国产免费观看| 欧美黑人一区| 亚洲精品成人a在线观看| 国产无吗一区二区三区在线欢 | 成年无码av片在线蜜芽| 拳交av| 全黄h全肉边做边吃奶视频| 亚洲VA| 制服.丝袜.亚洲.中文.综合| 大香蕉一区|