<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      無需動作預訓練,物理自回歸模型讓機器人“從視頻學會操作”

      0
      分享至


      不需要動作預訓練,即可同時實現未來視頻預測一致的動作軌跡生成。

      作者丨拓元智慧AI團隊

      該論文作者來自中山大學、拓元智慧AI實驗室團隊,項目負責人為王廣潤博士。王廣潤,國家級“四青人才”、拓元智慧首席科學家、中山大學計算機學院副教授、博士生導師、華為戰略研究院人才基金獲得者、前牛津大學研究員,主要研究方向包括新一代AI架構、大物理模型、多模態生成式AI等。


      論文題目:Physical Autoregressive Model for Robotic Manipulation without Action Pretraining論文鏈接:https://arxiv.org/abs/2508.09822項目主頁:https://hcplab-sysu.github.io/PhysicalAutoregressiveModel/

      近日,由中山大學拓元智慧AI實驗室聯合提出的全新“物理自回歸模型(Physical Autoregressive Model,PAR)”打通了“預判未來視頻幀—生成動作軌跡”的統一鏈路,將視覺幀與動作共同編碼為“物理token”,在無需動作預訓練的前提下即可學習物理世界的動態規律。基于ManiSkill基準,PAR 在PushCube任務上實現100%成功率,并在其余任務上與需要動作預訓練的強基線表現相當,顯示了從大規模視頻預訓練向機器人操控遷移的可行路徑。

      核心技術點:

      • 全局記憶的自回歸框架:構建從過去到現在的所有“觀察-動作”歷史,借鑒GPT等語言模型的工作模式,基于全部N個歷史token預測下一步(N+1步)最合理的行動。

      • 統一的“物理token”表征:將幀與動作拼接為一個序列單元,直接建模機器人與環境的聯合演化;模型以自回歸方式逐步預測下一步視頻與動作。

      • 連續空間的DiT去分詞器(de-tokenizer):以擴散Transformer(DiT)建模幀與動作的連續分布,避免離散量化帶來的誤差累積,并促進兩模態的相互增強。

      • 面向控制的因果掩碼與效率機制:引入“動作對幀的單向注意力”,形成隱式逆運動學;同時結合并行訓練與KV-cache提升推理效率。

      01

      研究背景

      在機器人操控領域,獲取大規模、標注完備的人類示教數據成本高昂。現有不少方法把語言大模型用于行動策略,但文本與動作模態之間存在天然鴻溝。相比之下,自回歸視頻生成模型天生擅長“基于過去預測未來”,與動作生成的目標更一致,因此成為遷移“世界知識”的理想載體。

      此外,要讓機器人“知行合一”,不僅要“想得明白”,更要“做得精準”。現有的方法往往只依賴于“當前幀+前一幀”的“局部觀察”,缺乏對長程歷史的記憶。與之相比,具備全局記憶的自回歸框架,可通過歷史全量token預測未來狀態,實現“視覺-動作”的全局關聯建模,有效降低機器人在動態場景中(如機器人抓取、物體堆疊)因“短視”導致的“動作漂移”問題。

      02

      方法:PAR 如何把“看見的未來”變成“下一步動作”

      整體框架:從“看—想—做”的自回歸閉環
      PAR 的核心想法是把機器人與環境的交互過程,統一描述成一串“物理token”。每個 token 同時包含這一刻的視覺畫面動作片段。模型像講故事一樣按時間讀入這些token,用一個因果式Transformer形成對當前情境的理解,然后同時預測下一張將看到的畫面以及下一步要執行的動作。新的畫面和動作再被接回序列,進入下一輪預測,形成“預測—執行—再預測”的閉環。

      直觀地說,PAR并不是先獨立學會“看視頻”,再額外學會“怎么動”,而是把兩件事合在一起、每一步都邊看邊想邊做。這種端到端的整體建模,避免了兩階段方法常見的分布偏移,也更貼近真實控制場景里“在行動中不斷校正”的節奏。


      圖1:整體框架:從“看—想—做”的物理自回歸閉環

      生成細節:在“連續空間”里同時生成視頻與動作
      傳統做法常把視頻和動作先量化成離散碼,再去預測,這會引入不可忽略的量化誤差。PAR 選擇在連續空間里直接建模:

      • 統一條件,雙分支生成。上述 Transformer 得到的“情境表示”被同時送入兩個生成器:一個負責“把下一張畫面逐步復原出來”(視頻分支),另一個負責“把下一段動作逐步生成出來”(動作分支)。兩個分支共享同一份條件,因此在訓練時能彼此約束、相互增強——看到的未來會直接影響該怎么動,反過來更合理的動作也會促使畫面預測更貼近真實。

      • 逐步細化,貼近真實。兩個分支都采用逐步細化的生成方式(多步從粗到細),這讓結果更加平滑、細節更真實,尤其適合對軌跡連續性和視覺連貫性都很敏感的機器人任務。

      • 輕量動作解碼器。動作本身維度較低,采用更輕量的生成器即可穩定產出可控、平滑的控制量,便于在線部署。

      注意力與控制:時間因果 + 幀內雙向 + 動作←視覺單向
      為把“預測未來”和“生成動作”真正做成控制器可用的能力,PAR 在注意力結構上加入了三條關鍵約束:

      1. 時間因果。跨時間維度只能“看過去、不能看未來”,保證推理時與真實執行一致,避免“偷看答案”。

      2. 幀內雙向。同一幀內部,圖像的各個區域可以相互關注,讓模型準確理解目標、障礙和機械臂之間的空間關系,從而把下一張畫面預測得更可信。

      3. 動作←視覺的單向通道。當前步待預測的動作可以關注同一時刻待預測的視覺表示,但反過來不行;直覺上,這等價于在網絡里植入一種“從期望實現的外觀與相對位置反推該怎么動”的先驗(可把它理解為一種隱式逆運動學)。這使得動作更緊貼關鍵像素區域(例如方塊或目標區),減小偏差累積。
        在工程層面,推理時配合KV-cache等增量計算,只對新增的 token 計算注意力,長序列滾動的時延增長更可控,適合在線控制。

      03

      評測與結果

      • 主要評測結果:在maniskill基準中,PAR在PushCube達到100%成功率,總體成績居第二,僅次于需要動作預訓練的RDT;在PickCube與StackCube上也超過或接近需要動作預訓練的強基準方法(總體平均74%)。

      • 對齊與可解釋性:如圖2所示,可視化顯示預測視頻實際執行在關鍵動作時序與軌跡上高度一致;如圖3所示,注意力圖表明不同頭會在幀/動作token與關鍵像素區域(方塊、目標區、機械臂)之間進行有針對性的聚焦。


      圖 2:預測視頻實際執行關聯可視化


      圖3:注意力圖

      PAR證明了“從視頻世界遷移物理知識”用于機器人操控的有效性:不需要動作預訓練,即可同時實現未來視頻預測一致的動作軌跡生成,為解決示教數據稀缺提供新路徑。

      未經「AI科技評論」授權,嚴禁以任何方式在網頁、論壇、社區進行轉載!

      公眾號轉載請先在「AI科技評論」后臺留言取得授權,轉載時需標注來源并插入本公眾號名片。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      27歲女子從沒來過例假,結婚有生育需求前往醫院,一查竟是“女兒身男兒芯”

      27歲女子從沒來過例假,結婚有生育需求前往醫院,一查竟是“女兒身男兒芯”

      上觀新聞
      2025-12-18 08:17:06
      調查發現:每天都喝酒的人,多數到了65歲以后,身體或變成這樣?

      調查發現:每天都喝酒的人,多數到了65歲以后,身體或變成這樣?

      健康之光
      2025-12-18 09:09:16
      30歲健美冠軍猝死原因疑曝光,好友稱去世前幾天剛做過體檢

      30歲健美冠軍猝死原因疑曝光,好友稱去世前幾天剛做過體檢

      九方魚論
      2025-12-17 22:34:15
      我揣著剛發的工資,去銀行存錢時,發現卡里多了620萬,直接存了定期

      我揣著剛發的工資,去銀行存錢時,發現卡里多了620萬,直接存了定期

      浮生實錄集
      2025-12-18 13:40:06
      海南全島封關,去哪兒:海口春節入境機票預訂翻番

      海南全島封關,去哪兒:海口春節入境機票預訂翻番

      中新經緯
      2025-12-18 14:14:04
      特朗普根本勸不住泰國!洪森這才恍然大悟,中國的做法是對的

      特朗普根本勸不住泰國!洪森這才恍然大悟,中國的做法是對的

      鐵血出鞘
      2025-12-18 19:35:37
      3離4婚,2妻病逝,極品前夫哥許亞軍!

      3離4婚,2妻病逝,極品前夫哥許亞軍!

      凹凹滴
      2025-12-17 18:02:34
      吳越公開84歲父親中風沒去養老院,在家請護工,自己53歲還未育

      吳越公開84歲父親中風沒去養老院,在家請護工,自己53歲還未育

      銀河史記
      2025-12-17 01:26:27
      細思極恐!8800萬捐贈古畫拿去拍賣,3年前該院就有復制品展出…

      細思極恐!8800萬捐贈古畫拿去拍賣,3年前該院就有復制品展出…

      火山詩話
      2025-12-18 05:50:56
      皇帝讓自己姑姑侍寢,姑姑開始反對后來順從,還慫恿他殺自己丈夫

      皇帝讓自己姑姑侍寢,姑姑開始反對后來順從,還慫恿他殺自己丈夫

      銘記歷史呀
      2025-12-17 18:02:13
      央視曝光固態電池重大消息!

      央視曝光固態電池重大消息!

      電動知家
      2025-12-18 10:41:13
      名氣再大也沒用!何晴晚年生活拮據,唯一房子留給兒子,一事成遺憾

      名氣再大也沒用!何晴晚年生活拮據,唯一房子留給兒子,一事成遺憾

      銀河史記
      2025-12-17 16:31:50
      基辛格曾提醒中國:千萬別幫這3個國家,都是白眼狼

      基辛格曾提醒中國:千萬別幫這3個國家,都是白眼狼

      老媹古裝影視解說
      2025-12-16 17:28:55
      瑞典,挪威,芬蘭北歐三國地處惡劣寒地,經濟實力為何如此強大呢

      瑞典,挪威,芬蘭北歐三國地處惡劣寒地,經濟實力為何如此強大呢

      向航說
      2025-12-17 00:05:03
      泰國定義柬埔寨園區為“犯罪團伙”,國人卻稱他們為“電詐人員”

      泰國定義柬埔寨園區為“犯罪團伙”,國人卻稱他們為“電詐人員”

      清書先生
      2025-12-17 17:32:36
      大瓜!曝李湘前夫李厚霖被抓,兄妹受牽連,開直播還數10億債務

      大瓜!曝李湘前夫李厚霖被抓,兄妹受牽連,開直播還數10億債務

      丁丁鯉史紀
      2025-12-18 15:27:31
      官方定調!出生人口,要努力穩定了

      官方定調!出生人口,要努力穩定了

      城市財經
      2025-12-18 11:44:23
      特朗普不小心泄密,拉夫羅夫立下大功,普京身邊“內鬼”被抓

      特朗普不小心泄密,拉夫羅夫立下大功,普京身邊“內鬼”被抓

      兵器評論
      2025-12-18 20:11:40
      快扔掉!戴一天,輻射量相當于拍117次胸片

      快扔掉!戴一天,輻射量相當于拍117次胸片

      FM93浙江交通之聲
      2025-10-28 00:01:43
      53歲吳越自曝單身生活,為父母買上海大平層,坦言孤獨是一種福報

      53歲吳越自曝單身生活,為父母買上海大平層,坦言孤獨是一種福報

      好賢觀史記
      2025-12-16 17:01:31
      2025-12-18 21:48:49
      AI科技評論 incentive-icons
      AI科技評論
      點評學術,服務AI
      7012文章數 20715關注度
      往期回顧 全部

      科技要聞

      2025新一代人工智能創業大賽

      頭條要聞

      “法國政變”視頻在臉書瘋傳 馬克龍想刪卻刪不掉

      頭條要聞

      “法國政變”視頻在臉書瘋傳 馬克龍想刪卻刪不掉

      體育要聞

      巴黎首奪世界級冠軍 加冕6冠王比肩巴薩拜仁

      娛樂要聞

      絲芭放大招了!實名舉報鞠婧祎經濟犯罪

      財經要聞

      尹艷林:呼吁加快2.5億新市民落戶進程

      汽車要聞

      在零下30℃的考場里 凡爾賽C5 X和508L拿到了"穩"的證明

      態度原創

      時尚
      藝術
      游戲
      教育
      親子

      鞋子專場||穿了五年十年,掏心窩子說,最常穿的還是這一雙!

      藝術要聞

      卡洛斯·杜蘭:不只是薩金特的老師!

      TS剛官宣休息又有頂級韓援回歸,曾幫LPL拿S冠,中文比左手還好!

      教育要聞

      初升高|除了關注中考,對于綿陽學生,更重要的是……

      親子要聞

      孩子的無限潛能,需要被開發

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 中文字幕日韩精品亚洲一区| 依依成人精品视频在线观看 | 日韩免费无码人妻波多野| 南澳县| 亚洲人成亚洲人成在线观看| 国产av一区二区三区日韩| 国产二区精品久久| 日本人妻中文| 亚洲无线码一区在线观看| 人人妻人人插视频| 人妻久久精品天天中文字幕| 久草福利| Y111111国产精品久久久| 99精品国产高清一区二区麻豆 | 无码视频一区二区三区| 欧美色综合天天久久综合精品 | 亚洲精品无码你懂的网站| 日韩a无v码在线播放| 亚洲在线成人网| 无码狠狠躁久久久久久久91| a毛片免费在线观看| 国产欧美精品aaaaaa片| 国产99免费视频| 亚洲AV电影冈| 日本视频一两二两三区| 丰满少妇人妻无码| 女人裸体性做爰视频| 博客| 97资源超碰| 久久香蕉欧美精品| 亚洲熟妇自偷自拍另欧美| 一边吃奶一边做动态图| 一本色道久久综合亚洲精品按摩 | 超碰在线91| 91免费在线| 饥渴的熟妇张开腿呻吟视频| 午夜精品久久久久久毛片| 久久人妻av2区| 汶川县| 999国产精品| 玖玖国产|