<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      LeCun在Meta還有論文:JEPA物理規劃的「終極指南」

      0
      分享至



      編輯|Panda

      長期以來,AI 領域一直懷揣著一個宏大的夢想:創造出能夠像人類一樣直觀理解物理世界,并在從未見過的任務和環境中游刃有余的智能體。

      傳統的強化學習方法往往比較笨拙,需要通過無數次的試錯和海量的樣本才能學到一點皮毛,這在獎勵信號稀疏的現實環境中簡直是災難。

      為了打破這一僵局,研究者們提出了「世界模型」這一概念,即讓智能體在腦海中構建一個物理模擬器,通過預測未來狀態來進行演練。

      近年來,雖然能夠生成精美像素畫面的生成式模型層出不窮,但對于物理規劃而言,沉溺于無關緊要的細節(如背景煙霧的流動)往往是低效的。真正的挑戰在于,如何在錯綜復雜的原始視覺輸入中提取抽象精髓。

      這便引出了本研究的主角:JEPA-WM(聯合嵌入預測世界模型)

      從名字也能看出來,這個模型與 Yann LeCun 的JEPA(聯合嵌入預測架構)緊密相關。事實上也確實如此,并且 Yann LeCun 本人也是該論文的作者之一。更有意思的是,在這篇論文中,Yann LeCun 的所屬機構為 Meta FAIR。不知道這是不是他在 Meta 的最后一篇論文?



      • 論文標題:What Drives Success in Physical Planning with Joint-Embedding Predictive World Models?
      • 論文地址:https://arxiv.org/abs/2512.24497

      JEPA-WM 繼承了 JEPA 的衣缽,不再糾結于像素級的重建,而是在高度抽象的表征空間內進行預判。在這項研究中,團隊試圖通過對架構、目標函數和規劃算法的全方位掃描,揭示究竟是什么驅動了物理規劃的成功,并試圖為機器人裝上一個更理性的「大腦」。

      JEPA-WM 核心方法

      該團隊將 JEPA-WM 的訓練與規劃流程形式化為一套統一的「終極指南」,重點在于如何在學習到的特征空間中模擬動力學。

      1. 層次化的編碼與預測架構



      在訓練階段,模型主要由四部分交織而成:



      2. 多步展開與動作調節細節



      在訓練時,模型不僅要預測下一幀,還要學會在沒有真實觀測反饋的情況下,基于自己的預測結果遞歸生成后續狀態。為了提高效率,采用了截斷反向傳播(TBPTT),即只針對最后一步的預測誤差計算梯度,而切斷之前的累積梯度。

      在動作信息如何干預預測過程上,該團隊對比了三種關鍵方案:

      • 特征調節(Feature Conditioning):將動作向量直接拼接到每一個視覺特征向量上,增加了預測器的隱藏層維度。
      • 序列調節(Sequence Conditioning):將動作作為一個獨立的 Token 插入到 ViT 的輸入序列中,通過注意力機制進行信息分發。
      • 自適應層歸一化(AdaLN):動作嵌入被投影為縮放和偏移參數,在每一個 Transformer 塊中動態調制歸一化統計量,這能有效防止動作信號在深層網絡中「淡出」。

      3. 規劃邏輯:在嵌入空間中尋找最優解



      實驗與結果:從模擬器到真實機械臂

      研究團隊在 Metaworld(42 個操縱任務)、Push-T(物體推送)、PointMaze(導航)以及 DROID(真實機械臂數據集)上進行了評估。

      1. 規劃器之爭:梯度 vs 采樣

      實驗結果揭示了一個有趣的現象:在像 Metaworld 這種成本曲線相對平滑的任務中,基于梯度的 Adam 或 GD 優化器表現驚人,因為它們能順著梯度迅速找到目標。但在 2D 導航(Wall, Maze)任務中,梯度法極易卡在局部極小值(例如對著墻猛撞而不懂得繞過門口),此時基于采樣的交叉熵方法(CEM)憑借其探索能力完勝。



      此外,新引入的Nevergrad(NG)規劃器在無需調參的情況下展現了與 CEM 相當的實力,尤其適合跨任務遷移。

      2. 關鍵因素的「貢獻度」

      為了量化不同設計決策對智能體最終表現的影響,研究團隊采用了一種嚴謹的控制變量法。

      他們以一個基礎配置(DINO-WM 結合 ViT-S 編碼器及 6 層預測器)為基準,獨立改變每一個核心組件,從而在復雜的系統工程中剝離出真正驅動性能增長的關鍵因子。通過在 Metaworld、Push-T 等多種異構環境下進行數以萬計的幕(Episode)測試,實驗揭示了世界模型在處理物理邏輯時的內在偏好。以下是影響物理規劃成敗的核心貢獻因素:

      本體感受的顯著增益:引入機器人內部狀態信息(如關節角度、末端位姿)能夠一致性地提高規劃成功率。在 Metaworld 任務中,這能有效減少機械臂在目標點附近震蕩的情況,提供更精準的距離感知。



      編碼器架構:DINO 系列編碼器(DINOv2/v3)在所有任務中均表現出對 V-JEPA 等視頻編碼器的明顯優勢。這歸功于 DINO 強大的細粒度目標分割能力,這對于需要精確感知物體位置的操縱和導航任務至關重要。在視覺復雜度更高的真實數據(DROID)中,DINOv3 的優勢進一步擴大。

      動作調節技術的微妙差異:實驗發現 AdaLN(自適應層歸一化)調節技術在平均性能上表現最強,且計算效率更高。它通過在 Transformer 的每一層注入動作信息,有效防止了控制信號在深層網絡傳遞過程中的消失,相比傳統的特征拼接(ftcond)或序列拼接(seqcond)更具穩健性。



      訓練上下文長度的權衡:預測器需要至少 2 幀上下文來推斷速度信息,這在 W=1 與 W=2 之間的巨大性能鴻溝中得到了印證。然而,盲目增加上下文長度(如 W > 5)反而有害,因為這會減少訓練中看到的獨特軌跡數量,并可能引入無用的梯度噪聲。



      模型規模:這是一個令人意外的發現:在簡單的模擬環境(如 Maze, Wall)中,增大模型規模(從 ViT-S 到 ViT-L)非但沒有幫助,反而可能由于嵌入空間過于復雜而導致規劃效率下降。但對于復雜的現實數據(DROID),大容量的編碼器和更深的預測器則展現出了明確的正相關收益,說明任務的物理復雜度決定了智能體所需的智力上限。

      多步損失的對齊作用:在訓練中加入 2 步展開損失能顯著改善預測器的長時穩定性,使其訓練任務與測試時的遞歸規劃任務更加對齊。對于最復雜的 DROID 任務,最佳的展開步數甚至需要達到 6 步。

      3. 提出的最優解

      研究最終匯總所有洞察,提出了針對不同任務的最優配置:在模擬器中使用 ViT-S 配以 AdaLN,而在真實復雜場景中使用 DINOv3 ViT-L 配以 12 層深度的預測器。



      在與 DINO-WM 和 V-JEPA-2-AC 的直接較量中,該模型在幾乎所有維度上均取得了領先。

      更多詳情請參閱原論文。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      馬斯克沒說錯:拆開GDP的“包裝”,中國的真實實力是美國的2-3倍

      馬斯克沒說錯:拆開GDP的“包裝”,中國的真實實力是美國的2-3倍

      遠方風林
      2025-12-24 23:30:23
      委內瑞拉副總統羅德里格斯宣誓就任代總統

      委內瑞拉副總統羅德里格斯宣誓就任代總統

      財聯社
      2026-01-06 03:17:52
      絕殺贏球難掩致命缺點!杜蘭特一數據告急!烏度卡不改變火箭危險

      絕殺贏球難掩致命缺點!杜蘭特一數據告急!烏度卡不改變火箭危險

      Tracy的籃球博物館
      2026-01-06 17:00:43
      賴清德真的失蹤了,去向成謎?

      賴清德真的失蹤了,去向成謎?

      達文西看世界
      2026-01-05 19:48:39
      楊廣荒唐到什么程度?在皇宮內立下奇葩規矩,讓妃子宮女十分難堪

      楊廣荒唐到什么程度?在皇宮內立下奇葩規矩,讓妃子宮女十分難堪

      銘記歷史呀
      2026-01-06 01:08:47
      勇擔上游責任 守護碧水東流——重慶筑牢長江上游生態屏障觀察

      勇擔上游責任 守護碧水東流——重慶筑牢長江上游生態屏障觀察

      新華社
      2026-01-05 23:40:27
      阿莫林下課后續!曼聯鎖定6位新帥目標,英超名帥+隊史傳奇成熱門

      阿莫林下課后續!曼聯鎖定6位新帥目標,英超名帥+隊史傳奇成熱門

      夜白侃球
      2026-01-05 21:50:02
      伊朗蒙面警官焚燒哈梅內伊照片,“沙阿萬歲”標語點燃政權震蕩

      伊朗蒙面警官焚燒哈梅內伊照片,“沙阿萬歲”標語點燃政權震蕩

      老馬拉車莫少裝
      2026-01-06 00:06:13
      雄鹿與國王進行交易談判!欲用兩人換來拉文 對方堅決索要首輪簽

      雄鹿與國王進行交易談判!欲用兩人換來拉文 對方堅決索要首輪簽

      羅說NBA
      2026-01-06 07:14:11
      滿是心酸!42歲著名歌手江蘇走穴,賓客只顧吃席沒人搭理

      滿是心酸!42歲著名歌手江蘇走穴,賓客只顧吃席沒人搭理

      查爾菲的筆記
      2026-01-04 13:13:57
      我媽來住20天,丈夫甩了20天臉,元旦婆婆來這住,我連夜收拾行李

      我媽來住20天,丈夫甩了20天臉,元旦婆婆來這住,我連夜收拾行李

      小小包工頭阿汾
      2026-01-05 13:20:00
      成都官宣新帥上任,與浙江隊兄弟德比,申花簽下楊帥,補防線深度

      成都官宣新帥上任,與浙江隊兄弟德比,申花簽下楊帥,補防線深度

      替補席看球
      2026-01-06 15:43:58
      林依輪夫婦西湖邊撿無患子,五十多歲狀態驚人,手工禮物見真情

      林依輪夫婦西湖邊撿無患子,五十多歲狀態驚人,手工禮物見真情

      手工制作阿殲
      2026-01-06 12:13:23
      美軍火船還未抵臺,柯文哲亮焦土政策;島內通告兩岸,已尋求對話

      美軍火船還未抵臺,柯文哲亮焦土政策;島內通告兩岸,已尋求對話

      鐵錘簡科
      2026-01-06 16:24:33
      命中率63%!場均轟30.4分,所有人都說你該退役了,你卻創NBA奇跡

      命中率63%!場均轟30.4分,所有人都說你該退役了,你卻創NBA奇跡

      巴叔GO聊體育
      2026-01-06 15:35:29
      香港知名男星宣布用回舊名,改名轉運事業迎突破,在內地做男主角

      香港知名男星宣布用回舊名,改名轉運事業迎突破,在內地做男主角

      小小李娛
      2026-01-06 09:17:31
      針對孔家在美國的資產,杜魯門下令徹查,拿到結果后,他氣得大罵:“這群人都是強盜!”

      針對孔家在美國的資產,杜魯門下令徹查,拿到結果后,他氣得大罵:“這群人都是強盜!”

      源溯歷史
      2025-12-30 20:23:17
      滬一小區分跨兩區,兩邊都不想吃虧……神操作逆襲

      滬一小區分跨兩區,兩邊都不想吃虧……神操作逆襲

      看看新聞Knews
      2026-01-06 00:52:26
      又一香港183年老字號扛不住,全港最后一間結業,店主自嘲敗家

      又一香港183年老字號扛不住,全港最后一間結業,店主自嘲敗家

      品牌觀察官
      2026-01-03 17:34:23
      性能高出1000倍!中國北斗被某國電磁干擾,他成功破解助北斗建成

      性能高出1000倍!中國北斗被某國電磁干擾,他成功破解助北斗建成

      井普椿的獨白
      2025-11-09 17:42:49
      2026-01-06 17:36:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12062文章數 142530關注度
      往期回顧 全部

      科技要聞

      速看!黃仁勛萬字實錄:甩出"物理AI"王牌

      頭條要聞

      美高官:委官員已私下保證 將滿足美提出的條件和要求

      頭條要聞

      美高官:委官員已私下保證 將滿足美提出的條件和要求

      體育要聞

      從NBA最菜首發控衛,到NBA最強喬治

      娛樂要聞

      朱媛媛遺作《小城大事》定檔1月10日

      財經要聞

      丁一凡:中美進入相對穩定的競爭共存期

      汽車要聞

      摩登出街潮品 實拍奇瑞QQ冰淇淋女王版

      態度原創

      家居
      時尚
      房產
      旅游
      游戲

      家居要聞

      引光之宅 地下室也有生機

      推廣|| 她們新年狀態大開掛?原來悄悄做了這筆“美麗投資”

      房產要聞

      爆發!三亞開年超千畝城更計劃曝光,香港城砸下100億!

      旅游要聞

      二〇二五年旅游總收入預計突破千億大關 三亞:全力推進國際旅游消費中心核心區建設

      突發!經典航天神作國區價格永漲 二代開發組已經被裁

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99人妻| 久激情内射婷内射蜜桃| 亚洲第一区欧美国产综合| 好吊妞| 极品少妇xxxx精品少妇偷拍| 迁安市| 国产伦精品免编号公布| 国内少妇偷人精品视频| 色综合热无码热国产| 日日躁天天躁| 多人伦交性欧美| www.熟女| 亚洲国产中文字幕在线视频综合| 亚洲图片综合| 欧美色日本| 中文字幕av久久激情| 亚洲天堂伊人久久a成人| 国产精品久久久一本精品| 色欲久久久天天天综合网精品| wwww免费网站| 天天摸天天做天天爽| 久久久久久av无码免费看大片| 亚洲AV无码久久精品色欲| 九九国产在线观看| 国产精品69毛片高清亚洲| 成人午夜电影福利免费| 试看做受1分钟小视频| 少妇激情一区二区三区视频小说 | 亚洲成人av在线资源网| 欧美第3页| 久久草视频在线| 长子县| 亚洲高清aⅴ日本欧美视频| 在线精品视频一区二区| 灵宝市| 成人无码一区二区三区网站| 日韩无码专区| 日本免费一区二区三区| 99热视屏| 内射视频在线观看| 超碰aⅴ人人做人人爽欧美|