<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      732M模型超越7B!機器人操控新范式:從視頻中「悟」物理

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導讀】機器人操控的「數據困境」一直是行業痛點:要讓機器人學會精細操作,傳統方法需要大量人工標注的動作演示數據,成本高昂、周期漫長。這個瓶頸能否被突破?

      大型視頻生成模型在海量視頻上訓練,已經隱式地學會了物理世界的運行規律:物體如何運動、力如何傳遞、空間關系如何演化。

      這些知識與機器人操控所需的物理直覺高度一致。

      關鍵問題是能否把這些視頻模型已經掌握的物理先驗,轉移到機器人控制上?

      中山大學王廣潤教授給出了一個創新答案:不靠海量動作數據,直接從視頻生成模型中「借」物理直覺。從PAR(物理自回歸模型)到其進階版本PhysGen(從預訓練視頻模型中學習物理),兩項工作一脈相承,共享同一套物理自回歸核心框架,并與英偉達今年2月發布的DreamDojo在核心思路上高度重合——當兩條獨立探索的路線收斂到同一個方向,這或許意味著某種底層規律正在被揭示。


      PAR論文鏈接:https://arxiv.org/abs/2508.09822

      項目主頁:https://hcplab-sysu.github.io/PhysicalAutoregressiveModel

      論文發表時間:2025年8月13日


      PhysGen論文鏈接:https://arxiv.org/abs/2603.00110

      論文發表時間:2026年2月18日

      傳統方法把「看環境」和「做動作」分成兩個任務。

      PAR反其道而行之:把視頻幀和機器人動作編碼成同一種「物理token」,讓模型在同一個自回歸過程中,既預測「世界接下來會變成什么樣」,也同步輸出「機器人該做什么動作」,這與人類「眼手協調」的直覺高度吻合。

      這樣做的好處是:動作不再是孤立的指令序列,而是與環境演化深度綁定的聯合預測。


      圖1:物理token自回歸的運作方式:預測未來的幀與動作聯合體,與真實環境同步演化

      三個技術要點

      1. 連續表示,不離散化:幀與動作都用連續向量表達,避免離散量化帶來的精度損失

      2. 隱式逆運動學:通過特殊的因果掩碼設計,讓模型在看到未來畫面后再決定當前動作

      3. 高效推理:借鑒LLM的KV-Cache技術,實現實時控制

      效果如何?

      在ManiSkill基準測試中:

      • PushCube任務達到100%成功率

      • 總體平均成功率74%,居所有方法第二,僅次于需要大規模動作預訓練的RDT(84%)

      • 在PickCube與StackCube任務上,同樣超過或接近需要動作預訓練的強基準方法

      • 額外引入參數僅30M


      圖2:ManiSkill基準成功率對比(零動作預訓練,媲美SOTA)

      PhysGen

      對物理自回歸路線的深化

      PhysGen在2026年2月公開發布,是PAR路線的延續。它完整保留了PAR的核心架構(物理token、連續表示、因果掩碼),并在此基礎上做了三處關鍵改進。

      三項升級

      ① 前瞻規劃(Lookahead-MTP)讓模型每次預測時「多看幾步」——同時預測未來3個token,訓練時全監督,推理時只執行第一個。這相當于給機器人配了短期規劃能力

      ② 高效訓練(LoRA微調)用參數高效的方式微調大模型,訓練成本大幅降低——單張A100顯卡,60小時內完成訓練。

      ③ 真實世界驗證不止在仿真環境,PhysGen在Franka Panda真實機械臂上完成了四項任務測試,包括抓取透明物體這種高難度場景。

      效果有多強?

      LIBERO仿真基準:


      圖3:732M參數、在零大規模動作預訓練的前提下,Physgen取得平均90.8%成功率

      真實世界任務:


      圖4: 真實機器人實驗性能對比

      在最考驗物理感知的透明物體抓取任務中,PhysGen反超了需要大規模預訓練的π0模型——這說明從視頻學到的物理直覺,在處理視覺欺騙性強的場景時更有優勢。

      與英偉達DreamDojo的深度同源

      今年2月,英偉達發布了DreamDojo——一個基于大規模視頻訓練的通用機器人世界模型。對比PAR/PhysGen與DreamDojo,會發現兩條路線在核心技術理念上驚人一致。

      兩個系統的本質目標完全一致:預測未來的「物理量」——也就是未來的動作和視頻的聯合體。

      這個設計背后的哲學是:機器人操控不是「先看畫面,再決定動作」的串行過程,而是「世界如何演化」與「機器人如何行動」的聯合預測問題。動作和視頻不是兩個獨立變量,而是物理世界演化的共同結果。


      架構共識:自回歸建模

      在如何預測這個「未來物理量」的問題上,兩個系統不約而同地選擇了自回歸架構

      為什么是自回歸?因為物理世界的演化是序列性、因果性的——當前時刻的狀態決定下一時刻的狀態,下一時刻又影響再下一時刻。自回歸模型天然契合這種逐步展開的物理過程。


      表示共識:連續空間建模

      在如何表達「物理量」的問題上,兩個系統都選擇了連續表示,而非離散化。

      這是一個關鍵決策:物理世界本質上是連續的(位置、速度、力都是連續量),離散化會引入量化誤差,這些誤差在長時序預測中會累積放大。連續表示則能保持物理量的原生精度。


      訓練共識:零動作預訓練

      兩個系統都驗證了同一個重要結論:不需要大規模機器人動作數據預訓練,就能實現強大的操控能力。

      這背后的邏輯是:視頻數據本身已經包含了豐富的物理先驗(物體運動規律、力學關系、空間推理),這些先驗可以直接遷移到機器人控制任務上。


      時間線印證

      中大團隊的PAR在2025年8月公開,PhysGen在2026年3月公開,DreamDojo在2026年2月發布。

      三者獨立推進,卻在四個核心決策上同步收斂:

      ① 預測目標:未來動作+視頻聯合體(物理量)② 架構選擇:自回歸逐步展開(契合物理因果)③ 表示方法:連續空間建模(避免量化誤差)④ 訓練范式:零動作預訓練(視頻物理先驗遷移)

      這不是偶然的相似,而是對同一底層規律的共同發現。

      其中最核心的洞察是:

      世界模型不是為了「看起來好」,而是為了「指導動作」

      這是PAR/PhysGen與傳統視頻生成模型的根本區別。

      傳統視頻生成模型(如Sora、Runway)追求的是視覺保真度——生成的視頻要看起來真實、「美觀流暢

      但對于機器人操控而言,世界模型的根本目的不是生成一段視覺上美觀的未來視頻,而是希望生成的未來視頻能對下一步的物理動作起到實質性的前瞻與指導作用

      核心哲學總結

      對世界模型的理解,可以歸結為一句話:

      世界模型的價值不在于生成「好看的視頻」,而在于生成「對動作有指導意義的物理預測」。視頻只是物理演化的可視化載體,真正重要的是其中蘊含的物理因果關系——這些因果關系決定了「做什么動作會導致什么結果」,而這正是機器人決策的核心依據。

      這也是為什么PhysGen能用732M參數超越7B級模型——它沒有把算力浪費在「讓視頻更美」上,而是專注于「讓物理預測更準」。

      從PAR到PhysGen,正在驗證一條清晰的技術路線:把機器人操控問題重新定義為「預測未來物理量」——未來的動作和視頻聯合體,并用自回歸模型在連續空間中逐步展開這個預測過程

      更重要的是,明確了世界模型的根本目的:不是生成視覺上美觀的未來視頻,而是生成對下一步物理動作有實質指導作用的物理預測。這個理念體現在物理token聯合建模、因果掩碼逆運動學、前瞻多步規劃、真實世界物理挑戰驗證等一系列設計中,并通過732M參數超越7B級模型的效率,以及透明物體抓取超越π0的效果,得到了實踐檢驗。

      而英偉達DreamDojo在預測目標、架構選擇、表示方法、訓練范式四個核心決策上的同步跟進,則從另一個側面印證了這一方向的潛力。

      作者介紹

      王廣潤系國家海外高層次青年人才基金及華為戰略人才基金獲得者,中山大學計算機學院青年研究員、博士生導師,拓元智慧首席科學家。華為「天才少年計劃」最高級別入選者;曾赴英國牛津大學擔任Research Fellow,師從英國皇家科學院院士、皇家工程院院士 Philip H.S. Torr 教授。

      主要從事新一代AI架構、大物理模型與世界模型、多模態生成式AI方向研究。獲吳文俊人工智能優秀博士論文獎(全國僅9人)、《Pattern Recognition》全球當年唯一最佳論文、全球AI華人新星榜(當年機器學習領域全球僅25人);擔任多個CCF A類會議領域主席;在多項國際競賽中獲得金牌;研究成果被圖靈獎得主Yann LeCun引用。

      參考資料:

      https://arxiv.org/abs/2603.00110

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      6億打水漂?投資人揭《美人魚2》不上映原因,劣跡藝人害慘周星馳

      6億打水漂?投資人揭《美人魚2》不上映原因,劣跡藝人害慘周星馳

      查爾菲的筆記
      2025-09-02 00:48:54
      人社部明確:事業編制改革啟動,3100萬人的“鐵飯碗”要變了

      人社部明確:事業編制改革啟動,3100萬人的“鐵飯碗”要變了

      慧眼看世界哈哈
      2026-03-24 06:36:05
      一夜4場險勝!2奪冠熱門全敗,積分榜大洗盤,第3到第6毫無差別

      一夜4場險勝!2奪冠熱門全敗,積分榜大洗盤,第3到第6毫無差別

      老吳說體育
      2026-03-27 23:51:25
      3月以來哪些船只通過了霍爾木茲海峽?海運資訊機構:超6成與伊朗有直接關聯

      3月以來哪些船只通過了霍爾木茲海峽?海運資訊機構:超6成與伊朗有直接關聯

      紅星新聞
      2026-03-27 19:09:16
      李梓萌風波大反轉!同事曝光現狀,離開央視傳聞這下終于真相大白

      李梓萌風波大反轉!同事曝光現狀,離開央視傳聞這下終于真相大白

      離離言幾許
      2026-03-27 13:48:10
      鴻蒙智行電池技術負責人:為延長電池壽命 我們把華為化學家、數學家都投入了進來

      鴻蒙智行電池技術負責人:為延長電池壽命 我們把華為化學家、數學家都投入了進來

      快科技
      2026-03-27 15:22:06
      對陣中國隊登場,庫拉索隊華裔球員陳達毅替補出場

      對陣中國隊登場,庫拉索隊華裔球員陳達毅替補出場

      懂球帝
      2026-03-27 15:54:04
      心內科主任:心臟病最危險信號,不是嘴唇發紫,是頻繁出現5異常

      心內科主任:心臟病最危險信號,不是嘴唇發紫,是頻繁出現5異常

      健康科普365
      2026-03-27 13:35:06
      淪為共享單車的女色虎

      淪為共享單車的女色虎

      深度報
      2026-03-05 22:39:27
      德國外交部長:美國和伊朗在間接接觸,而且有直接會晤的考慮,可能很快在巴基斯坦發生

      德國外交部長:美國和伊朗在間接接觸,而且有直接會晤的考慮,可能很快在巴基斯坦發生

      瀟湘晨報
      2026-03-27 20:14:03
      52歲北京炒股冠軍罕見發聲:如果手里有10萬,建議死啃123戰法!

      52歲北京炒股冠軍罕見發聲:如果手里有10萬,建議死啃123戰法!

      股經縱橫談
      2026-03-27 16:07:23
      突發,要停戰了

      突發,要停戰了

      TopView
      2026-03-27 11:26:27
      巨乳性感綁帶渾圓大腿!日本格斗游戲勁爆手辦預告

      巨乳性感綁帶渾圓大腿!日本格斗游戲勁爆手辦預告

      游民星空
      2026-03-25 19:48:32
      拉斯維加斯的新球隊叫什么名字? 美媒給出11大候選

      拉斯維加斯的新球隊叫什么名字? 美媒給出11大候選

      仰臥撐FTUer
      2026-03-27 10:05:12
      FCC一紙禁令:60%家用路由器將被斷供,你的Wi-Fi要漲價了

      FCC一紙禁令:60%家用路由器將被斷供,你的Wi-Fi要漲價了

      賽博蘭博
      2026-03-25 14:31:11
      因禍得福!燒129年的地下火被滅,新疆憑空多了個“金飯碗”

      因禍得福!燒129年的地下火被滅,新疆憑空多了個“金飯碗”

      夢在深巷aqa
      2026-03-26 08:02:47
      自作自受!瘋狂甩賣球員,導致主場空空蕩蕩,觀眾寥寥無幾

      自作自受!瘋狂甩賣球員,導致主場空空蕩蕩,觀眾寥寥無幾

      體育哲人
      2026-03-27 13:43:42
      鉀是蘋果的8倍,建議中老年人,春天多吃這“高鉀菜”,精神好!

      鉀是蘋果的8倍,建議中老年人,春天多吃這“高鉀菜”,精神好!

      阿龍美食記
      2026-03-26 15:22:03
      央視直播:中國U19戰澳大利亞U19,07國青隊沖擊世青賽

      央視直播:中國U19戰澳大利亞U19,07國青隊沖擊世青賽

      民哥臺球解說
      2026-03-27 20:06:08
      周冬雨劉昊然有孩子了?趙露思被禁止拍戲?宋佳鐘楚曦暗撕?郭敬明害新劇埋了?女歌手折磨工作人員?

      周冬雨劉昊然有孩子了?趙露思被禁止拍戲?宋佳鐘楚曦暗撕?郭敬明害新劇埋了?女歌手折磨工作人員?

      十錘星人
      2026-03-26 23:25:27
      2026-03-28 01:12:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14829文章數 66720關注度
      往期回顧 全部

      科技要聞

      楊植麟張鵬夏立雪羅福莉,聊龍蝦、聊漲價

      頭條要聞

      男醫生給孕妻做彩超 丈夫崩潰撞墻:不過了 明天就離婚

      頭條要聞

      男醫生給孕妻做彩超 丈夫崩潰撞墻:不過了 明天就離婚

      體育要聞

      邵佳一:足球就像一場馬拉松

      娛樂要聞

      范瑋琪加盟,官宣《浪姐7》遭全網抵制

      財經要聞

      我在小吃培訓機構學習“科技與狠活”

      汽車要聞

      與眾08,金標大眾不能輸的一戰

      態度原創

      藝術
      健康
      本地
      數碼
      公開課

      藝術要聞

      黑白呈現的迷離媚態人像,不看你就虧大了!

      干細胞抗衰4大誤區,90%的人都中招

      本地新聞

      在濰坊待了三天,沒遇到一個“濰坊人”

      數碼要聞

      洛斐QQ音樂聯名外設泄露:極地苔原色,瞬間激活432Hz自然聲

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版