<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      VLA引入本體狀態(tài),機器人隨時掉鏈子?人大北航攻克難題ICLR26

      0
      分享至


      新智元報道

      編輯:LRST

      【新智元導(dǎo)讀】人大與北航團隊發(fā)現(xiàn):機器人在動作切換時,視覺常被本體感覺「壓制」而失效。他們提出GAP算法,動態(tài)削弱本體信號的訓(xùn)練權(quán)重,讓視覺重獲學(xué)習(xí)機會,顯著提升機器人精準(zhǔn)操作能力。

      本體感覺信息能夠提供機器人狀態(tài)的實時反饋,其與視覺信息的協(xié)同被普遍認(rèn)為有助于提升機器人在復(fù)雜操縱任務(wù)中的性能。

      然而,近期研究在視覺–本體感覺策略的泛化能力方面報告了不一致的觀察結(jié)果:有的策略受益于視覺本體覺的聯(lián)合,而有的卻比純視覺策略表現(xiàn)更差——視覺-本體操縱策略究竟何時會「掉鏈子」?

      近日,人大高瓴GeWu-Lab與北京航空航天大學(xué)聯(lián)合團隊對該問題進(jìn)行了系統(tǒng)性研究,發(fā)現(xiàn)在操縱任務(wù)的運動轉(zhuǎn)變階段,視覺-本體策略中的視覺模態(tài)「失效」了!

      為此,研究團隊提出了基于階段引導(dǎo)的梯度調(diào)整算法(Gradient Adjustment with Phase-guidance,GAP),該研究論文為機器人操縱中視覺-本體感覺策略的設(shè)計與發(fā)展提供了有價值的見解,并已被ICLR 2026接收。


      項目主頁:https://gewu-lab.github.io/GAP/

      代碼倉庫:https://github.com/GeWu-Lab/GAP

      論文鏈接:https://arxiv.org/abs/2602.12032

      研究背景

      隨著深度學(xué)習(xí)的發(fā)展,研究者們開始將本體感覺信息(如關(guān)節(jié)位置、速度等)引入基于視覺的機器人操縱策略。視覺負(fù)責(zé)「看」,本體覺負(fù)責(zé)「感」,兩者的協(xié)同被認(rèn)為有助于提升策略在復(fù)雜環(huán)境中的泛化能力,讓機器人不僅能在熟悉場景中穩(wěn)定操作,也能在任務(wù)條件變化時靈活應(yīng)對。

      然而,現(xiàn)實卻開了個玩笑。多篇研究表明,有時加入了本體信息的策略反而比純視覺策略表現(xiàn)更差。

      這一現(xiàn)象并非個例,而是在不同環(huán)境、不同任務(wù)中均有出現(xiàn)(圖1左)。

      這些發(fā)現(xiàn)讓人困惑:視覺-本體策略究竟何時會失敗?是模態(tài)融合方式的問題,還是訓(xùn)練過程的失衡?是在所有任務(wù)階段都會失敗,還是只在某些關(guān)鍵時刻掉鏈子?理解這一點,不僅能夠解釋已有矛盾,更有助于設(shè)計真正魯棒的機器人操縱策略。

      問題探究


      圖1:視覺-本體策略的泛化性

      為了探究這些問題,來自人大高瓴GeWu-Lab與北京航空航天大學(xué)聯(lián)合團隊的研究者們設(shè)計了一個精巧的控制實驗。他們讓一個純視覺策略執(zhí)行裝配任務(wù),但在某些特定時段(僅10個時間步長),將當(dāng)前動作替換為由視覺–本體策略在相同觀測下預(yù)測的動作。

      如圖1右側(cè)所示,結(jié)果令人驚訝:

      • 在「向前移動」這類穩(wěn)定運動階段,這種替換幾乎沒有影響;

      • 但在「定位底座」、「裝配零件」這類運動轉(zhuǎn)變階段,替換策略后任務(wù)成功率明顯下降。

      這說明在需要視覺發(fā)揮作用的運動轉(zhuǎn)變階段,視覺–本體策略中的視覺模態(tài)「失效」了。為什么視覺會被邊緣化?研究者進(jìn)一步從訓(xùn)練優(yōu)化的角度尋找答案。

      他們發(fā)現(xiàn),在運動轉(zhuǎn)變階段,視覺線索往往非常細(xì)小,有時甚至只是像素級的差異,而本體信號則簡潔、直接。

      在訓(xùn)練過程中,策略會本能地依賴那些能讓損失更快下降的本體信號,使得本體模態(tài)在優(yōu)化中占據(jù)主導(dǎo)地位。這種主導(dǎo)地位反過來抑制了視覺模態(tài)的學(xué)習(xí),導(dǎo)致視覺信息在運動轉(zhuǎn)變階段被嚴(yán)重忽視。

      核心技術(shù)

      針對視覺模態(tài)在運動轉(zhuǎn)變階段被抑制的問題,研究團隊提出了如圖2所示的基于階段引導(dǎo)的梯度調(diào)整算法(Gradient Adjustment with Phase-guidance, GAP)。核心思路是:先識別出任務(wù)中的運動轉(zhuǎn)變階段,然后在這些關(guān)鍵時刻動態(tài)調(diào)整本體覺信號的優(yōu)化強度,為視覺模態(tài)「讓出學(xué)習(xí)空間」。


      圖2:GAP方法架構(gòu)

      為了識別運動轉(zhuǎn)變階段,研究團隊首先利用機械臂末端執(zhí)行器的位置、朝向和開合程度來定義機器人的運動。

      隨后采用變化點檢測算法,通過計算不同時段運動方向的一致性,將軌跡分割為一系列「運動一致階段」,如「持續(xù)向前移動」、「穩(wěn)定抓取」等。在這些階段之間,就是機器人的「運動轉(zhuǎn)變階段」。

      然而,運動的轉(zhuǎn)變是連續(xù)且漸變的,簡單的離散切分難以刻畫該過程的平滑特性。

      為此,研究進(jìn)一步引入時序網(wǎng)絡(luò),利用本體覺信號的時序差異,預(yù)測每個時刻屬于運動轉(zhuǎn)變階段的概率。

      在反向傳播時,GAP會根據(jù)當(dāng)前時刻的轉(zhuǎn)變概率,動態(tài)降低本體覺特征提取模塊的梯度更新幅度。轉(zhuǎn)變概率越高,本體覺的梯度被抑制得越明顯,讓視覺模態(tài)有機會被充分學(xué)習(xí)。

      性能亮點

      GAP算法的有效性在大量實驗中得到了充分驗證。無論是在仿真環(huán)境還是真實機器人上,無論是單臂還是雙臂任務(wù),GAP加持下的視覺–本體策略都交出了亮眼的成績單。




      可以看到,在操縱任務(wù)「移交」中,純視覺策略難以完成精細(xì)的放置操作,而視覺-本體策略在抓取失敗后忽視視覺反饋,仍按照本體的經(jīng)驗繼續(xù)執(zhí)行動作。應(yīng)用GAP的視覺-本體策略則得益于兩者的協(xié)同,順利地完成了任務(wù)。




      如表1所示,在多樣的任務(wù)設(shè)置中,GAP不僅幫助了視覺-本體策略超越純視覺策略,真正利用模態(tài)協(xié)同的優(yōu)勢,同時還超越了多種現(xiàn)有的基線方法。


      表1:對比實驗結(jié)果

      研究團隊同時也驗證了GAP是否適用于視覺-語言-動作模型(VLA)。如表2所示,在多個任務(wù)上,加入本體覺的Octo-VP反而比純視覺的Octo-V表現(xiàn)更差,而GAP的介入則徹底扭轉(zhuǎn)了這一局面。


      表2:VLA實驗結(jié)果

      研究團隊同時也驗證了GAP對多種常見的模態(tài)融合方式的兼容性(表3),并觀察了GAP預(yù)測的運動轉(zhuǎn)變概率與任務(wù)RGB圖像和視覺不確定性的關(guān)系(圖3),以提升方法的可解釋性。


      表3:模態(tài)融合方式實驗


      圖3:運動轉(zhuǎn)變概率可視化

      結(jié)語

      從多篇研究的反直覺現(xiàn)象一步步深入,該研究揭示了運動轉(zhuǎn)變階段中被抑制的視覺模態(tài)學(xué)習(xí)。

      研究團隊據(jù)此提出了GAP算法,使得兩種模態(tài)在機器人操縱任務(wù)中更好地協(xié)同。真正的多模態(tài)具身智能,必須建立在對模態(tài)之間動態(tài)關(guān)系的深刻理解之上。

      而GAP通過運動轉(zhuǎn)變階段提供了一種分析框架,為具身智能中的高質(zhì)量多模態(tài)融合與交互提供了全新的視角。

      參考資料:

      https://arxiv.org/pdf/2602.12032

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      30+10+5次數(shù)比肩約基奇東契奇!老鷹21歲小將悄悄殺入巨星行列

      30+10+5次數(shù)比肩約基奇東契奇!老鷹21歲小將悄悄殺入巨星行列

      大眼瞄世界
      2026-03-08 09:55:08
      西方至今想不通:憑什么秦始皇死了2000年,中國還在他的布局里?

      西方至今想不通:憑什么秦始皇死了2000年,中國還在他的布局里?

      掠影后有感
      2026-03-05 10:31:38
      大型翻車現(xiàn)場!麥當(dāng)勞CEO試吃被群嘲

      大型翻車現(xiàn)場!麥當(dāng)勞CEO試吃被群嘲

      鞭牛士
      2026-03-08 12:45:07
      馬筱梅三八節(jié)抱兒子出鏡!穿粉色月子服和閨蜜合影,大方曬禮物盒

      馬筱梅三八節(jié)抱兒子出鏡!穿粉色月子服和閨蜜合影,大方曬禮物盒

      阿廢冷眼觀察所
      2026-03-08 16:20:10
      補時絕殺!榜首易主:沙特豪門登頂,瘋狂13連勝,C羅爭冠有戲

      補時絕殺!榜首易主:沙特豪門登頂,瘋狂13連勝,C羅爭冠有戲

      足球狗說
      2026-03-08 05:04:04
      中東還沒結(jié)束,亞太又出問題?朝鮮突發(fā)導(dǎo)彈,特朗普收到一封挑戰(zhàn)書

      中東還沒結(jié)束,亞太又出問題?朝鮮突發(fā)導(dǎo)彈,特朗普收到一封挑戰(zhàn)書

      策略述
      2026-03-06 17:26:03
      18歲亞馬爾復(fù)制梅西經(jīng)典:彩虹球進(jìn)死角 對手倒下!生涯50球

      18歲亞馬爾復(fù)制梅西經(jīng)典:彩虹球進(jìn)死角 對手倒下!生涯50球

      葉青足球世界
      2026-03-08 08:32:15
      空腹血糖標(biāo)準(zhǔn)已公布,不再6.1,血糖異常者,早知早好

      空腹血糖標(biāo)準(zhǔn)已公布,不再6.1,血糖異常者,早知早好

      華庭講美食
      2026-03-08 14:11:36
      牡丹花下死!不顧央視警告,與劉濤傳出緋聞的楊爍,終究難逃惡果

      牡丹花下死!不顧央視警告,與劉濤傳出緋聞的楊爍,終究難逃惡果

      動物奇奇怪怪
      2026-03-08 16:21:58
      伊朗發(fā)動毀天滅地的報復(fù),美專家情緒失控:老天爺,這下出大事了

      伊朗發(fā)動毀天滅地的報復(fù),美專家情緒失控:老天爺,這下出大事了

      東極妙嚴(yán)
      2026-03-07 16:39:53
      摳門天王和小美的瓜!

      摳門天王和小美的瓜!

      八卦瘋叔
      2026-03-08 11:14:12
      渾身都是“寄生蟲”的3種魚,賣魚商販都不敢吃,白送也千萬別要

      渾身都是“寄生蟲”的3種魚,賣魚商販都不敢吃,白送也千萬別要

      哄動一時啊
      2026-02-27 23:35:44
      方言的消失是中華文明的悲哀

      方言的消失是中華文明的悲哀

      虔青
      2026-03-02 07:24:07
      霍爾木茲炮火揭開真相:造艘船要等3年,中國壟斷67%全球訂單

      霍爾木茲炮火揭開真相:造艘船要等3年,中國壟斷67%全球訂單

      洋堂主故事匯
      2026-03-08 14:32:54
      “臺灣永遠(yuǎn)都不會是中國的一部分”,她被全民唾罵,被明星扇耳光

      “臺灣永遠(yuǎn)都不會是中國的一部分”,她被全民唾罵,被明星扇耳光

      閱微札記
      2026-02-28 20:01:18
      劉濤這美臀,算是圈內(nèi)第一了吧,麻花辮配包臀裙太顯年輕了?

      劉濤這美臀,算是圈內(nèi)第一了吧,麻花辮配包臀裙太顯年輕了?

      娛樂領(lǐng)航家
      2026-02-25 23:00:03
      女毒梟阮氏慧花5000萬買精液逃避死刑,結(jié)果如何?

      女毒梟阮氏慧花5000萬買精液逃避死刑,結(jié)果如何?

      命運自認(rèn)幽默
      2026-03-06 05:11:15
      山姆1.38公斤冰塊賣37.9元,消費者稱比冰塊融化速度慢,而且顏值高,門店工作人員:銷量不錯,現(xiàn)貨極少

      山姆1.38公斤冰塊賣37.9元,消費者稱比冰塊融化速度慢,而且顏值高,門店工作人員:銷量不錯,現(xiàn)貨極少

      觀威海
      2026-03-04 10:39:05
      軍事專家稱:照這么打下去,等伊朗導(dǎo)彈打光了,美國就笑到最后了

      軍事專家稱:照這么打下去,等伊朗導(dǎo)彈打光了,美國就笑到最后了

      我心縱橫天地間
      2026-03-08 14:01:34
      5分鐘兩次爭議判罰!托利奇被撞倒無點,樸鎮(zhèn)燮肘擊,媒體人不滿

      5分鐘兩次爭議判罰!托利奇被撞倒無點,樸鎮(zhèn)燮肘擊,媒體人不滿

      奧拜爾
      2026-03-08 16:32:32
      2026-03-08 17:23:00
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      14669文章數(shù) 66667關(guān)注度
      往期回顧 全部

      科技要聞

      OpenClaw最大的推手是閑魚和小紅書

      頭條要聞

      伊朗軍方公布"家底":具備打至少6個月高強度戰(zhàn)爭能力

      頭條要聞

      伊朗軍方公布"家底":具備打至少6個月高強度戰(zhàn)爭能力

      體育要聞

      大傷后被交易,他說:22歲的我已經(jīng)死了

      娛樂要聞

      周迅新戀情曝光,李亞鵬等人已成過去

      財經(jīng)要聞

      油價要失控?

      汽車要聞

      9分鐘充飽 全新騰勢Z9GT首搭閃充技術(shù)26.98萬起

      態(tài)度原創(chuàng)

      數(shù)碼
      教育
      健康
      家居
      游戲

      數(shù)碼要聞

      18核干掉96核!蘋果M5 Max完虐AMD旗艦撕裂者9995WX

      教育要聞

      第一次考英語四級,如何規(guī)劃復(fù)習(xí)才能順利通過,最好突破550分

      轉(zhuǎn)頭就暈的耳石癥,能開車上班嗎?

      家居要聞

      暖棕撞色 輕法奶油風(fēng)

      外媒盤點六大利器!新Xbox能否終結(jié)主機戰(zhàn)爭劣勢?

      無障礙瀏覽 進(jìn)入關(guān)懷版