<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      1米3宇樹G1完美上籃!港科大解鎖全球首個真實籃球機器人Demo

      0
      分享至

      henry 發(fā)自 凹非寺
      量子位 | 公眾號 QbitAI

      1米3的機器人小土豆,三步上籃也可以如此絲滑。



      別誤會,這臺宇樹G1暫時還不準備參加NBA選秀,但它剛解鎖的 “現(xiàn)實世界打籃球” 技能,離上“村BA”首發(fā)應該不遠了。

      據(jù)悉,這是全球首個能在真實場景中完成籃球動作的機器人demo,來自香港科技大學的研究團隊。



      雖然團隊還沒公開完整的技術細節(jié),但結(jié)合他們此前讓機器人“打籃球”的工作,這次很可能是在之前研究的基礎上,進一步改良而來。

      接下來,讓我們一窺究竟。

      SkillMimic-v2

      首先是被收錄于SIGGRAPH 2025SkillMimic-V2: Learning Robust and Generalizable Interaction Skills from Sparse and Noisy Demonstrations



      SkillMimic-V2旨在解決交互演示強化學習(RLID)中演示軌跡稀疏、含噪且覆蓋不足的難題。

      其通過引入拼接軌跡圖(STG)狀態(tài)轉(zhuǎn)移場(STF)自適應軌跡采樣(ATS)等技術,成功地在低質(zhì)量數(shù)據(jù)條件下,訓練出了兼具魯棒恢復能力與技能遷移能力的復雜交互策略 。



      當前,通過動作捕捉等方式收集的數(shù)據(jù)往往存在以下缺陷:

      • 稀疏性 (Sparse):演示數(shù)據(jù)僅覆蓋了有限的技能變體,缺乏技能之間的過渡軌跡。
      • 不連貫性 (Disconnected):不同的技能片段是獨立的,缺乏自然的連接。
      • 噪聲 (Noisy):數(shù)據(jù)中包含物理上不可行的狀態(tài)或誤差(例如手與物體的穿模、接觸位置偏差),這在精細操作任務中會導致嚴重的訓練失敗。

      這些有缺陷的數(shù)據(jù)無法捕捉到技能變體和轉(zhuǎn)換的完整頻譜。

      不過,相比直接去收集更好的數(shù)據(jù),研究認為盡管演示數(shù)據(jù)是稀疏和嘈雜的,但存在無限的物理可行軌跡

      這些潛在的軌跡天然地能夠橋接不同的技能,或者從演示狀態(tài)的鄰域中涌現(xiàn)出來。

      這就形成了一個連續(xù)的、可能的技能變體和轉(zhuǎn)換空間,從而可以利用這些不完美的演示數(shù)據(jù),訓練出平滑、魯棒的策略。



      基于以上認識,研究提出三個關鍵步驟發(fā)現(xiàn)并學習這些潛在軌跡:

      • 拼接軌跡圖 (Stitched Trajectory Graph, STG):為了解決技能間的連接問題(如從運球切換到投籃),算法在不同演示軌跡之間尋找相似狀態(tài)。如果在兩個不同技能的軌跡中發(fā)現(xiàn)相似狀態(tài),就建立一條連接,并用掩碼標記中間的過渡幀。這構(gòu)建了一個宏觀的圖結(jié)構(gòu),允許策略學習未在原始數(shù)據(jù)中出現(xiàn)的技能轉(zhuǎn)換。
      • 狀態(tài)轉(zhuǎn)移場 (State Transition Field, STF):訓練時不只從參考軌跡的特定點開始,而是從其鄰域內(nèi)隨機采樣狀態(tài)初始化。對于鄰域內(nèi)的任意采樣狀態(tài),計算其與參考軌跡中所有狀態(tài)的相似度,找到最佳匹配目標。如果起點與目標點距離較遠,算法會插入N個掩碼狀態(tài)(Masked States)。這些狀態(tài)不計算獎勵,僅作為時間緩沖,迫使RL策略學習如何從偏離狀態(tài)“歸位”到參考軌跡,從而形成一個具有恢復能力的“場” 。
      • 自適應軌跡采樣 (Adaptive Trajectory Sampling, ATS):根據(jù)當前策略在某段軌跡上的表現(xiàn)(獎勵值)動態(tài)調(diào)整采樣概率。獎勵越低(越難學)的片段,被采樣的概率越高。這解決了長序列中因局部失敗導致整個鏈條斷裂的問題。

      由此,技能轉(zhuǎn)換和泛化能力能夠遠超最初不包含任何技能轉(zhuǎn)換或錯誤恢復的稀疏演示,實現(xiàn)更高效地技能學習與泛化性。

      比如,在仿真環(huán)境(Isaac Gym)中,機器人可以在受到干擾時,仍可以完成上籃動作。



      還能實現(xiàn)運球-投籃間的技能轉(zhuǎn)換。

      實驗表明,相比此前的SOTA (SkillMimic)方法,SkillMimic-V2在困難技能(如 Layup)上的成功率從0提升到了91.5%。技能轉(zhuǎn)換成功率 (TSR) 更是從2.1%飆升至94.9%



      SkillMimic

      接下來是SkillMimic-V2的前作——SkillMimic: Learning Basketball Interaction Skills from Demonstrations,這篇論文入選了CVPR 2025 Highlight。



      SkillMimic旨在解決物理模擬人-物交互(HOI)中傳統(tǒng)方法依賴繁瑣手工獎勵設計且難以在統(tǒng)一框架下掌握多樣化技能的難題。

      其通過引入統(tǒng)一HOI模仿獎勵接觸圖(Contact Graph)分層技能復用等技術,成功地在單一獎勵配置下,訓練出了兼具精準接觸控制與長程任務組合能力的通用交互策略。



      研究pipeline包含三個部分:

      • 首先,采集真實籃球運動技能,構(gòu)建一個龐大的人機交互(HOI)運動數(shù)據(jù)集。
      • 其次,訓練一個技能策略,通過模仿相應的HOI數(shù)據(jù)來學習交互技能,設計了一個統(tǒng)一的HOI模仿獎勵機制,用于模仿各種不同的HOI狀態(tài)轉(zhuǎn)換。
      • 最后,是訓練一個高級控制器(HLC),用于復用已學習的技能來處理復雜任務,同時使用極其簡單的任務獎勵。

      其中,SkillMimic方法的關鍵在于:

      • 統(tǒng)一的HOI模仿獎勵(Unified HOI Imitation Reward):放棄針對每種技能單獨設計獎勵,而是設計一套通用的獎勵配置,通過模仿HOI數(shù)據(jù)集來學習所有技能 。
      • 分層學習架構(gòu)(Hierarchical Solution):低層:交互技能策略(IS Policy):通過SkillMimic框架學習各種基礎交互技能(如運球、上籃)。高層:高級控制器(HLC):訓練一個高級策略來復用和組合已習得的IS策略,以完成長程復雜任務(如連續(xù)得分)。
      • 數(shù)據(jù)驅(qū)動:構(gòu)建了兩個數(shù)據(jù)集BallPlay-V(基于視頻估算)和BallPlay-M(基于光學動捕,精度更高),包含約35分鐘的多樣化籃球交互數(shù)據(jù) 。

      實驗表明,SkillMimic能夠使用同一套配置學會多種風格的籃球技能(運球、上籃、投籃等),成功率顯著高于DeepMimic和AMP。



      在演示中,我們可以看到,仿真環(huán)境的機器人能夠?qū)崿F(xiàn)繞圈運球等高級技能。

      PhysHOI

      如果追溯SkillMimic作者的工作,就會發(fā)現(xiàn)早在2023年,論文PhysHOI: Physics-Based Imitation of Dynamic Human-Object Interaction就試圖讓仿真中的機器人能夠根據(jù)演示學習籃球技能。



      為實現(xiàn)這一點,

      PhysHOI在當時提出了一種基于物理仿真的動態(tài)人-物交互(HOI)模仿學習框架。



      簡單來說,給定參考的HOI數(shù)據(jù),將當前的模擬HOI狀態(tài)與參考HOI狀態(tài)一起輸入策略模型。

      策略輸出動作,并通過物理模擬器生成下一步的模擬HOI狀態(tài),然后將運動學獎勵與接觸-抓取(CG)獎勵加權(quán)結(jié)合,并優(yōu)化策略以最大化期望回報。

      重復上述過程直至收斂,即可復現(xiàn)參考數(shù)據(jù)中的HOI技能。



      除此之外,為防止運動學模仿獎勵陷入最優(yōu)解,研究還引入了接觸圖(Contact Graph)

      給定一個HOI幀,接觸圖節(jié)點包含所有身體部位和物體。每條邊都是一個二元接觸標簽,表示接觸與否。為了簡化計算,還可以將多個身體部位聚合到一個節(jié)點中,形成聚合接觸圖。

      同時,為了彌補HOI場景的不足,研究還引入了全身籃球技巧的BallPlay數(shù)據(jù)集。



      在實驗中,PhysHOI在不同大小的籃球操作上表現(xiàn)出了魯棒性。

      One more thing

      值得一提的是,在PhysHOI、SkillMimic 、SkillMimic-v2三篇工作中,王蔭槐都擔任了核心角色,網(wǎng)友調(diào)侃他是“籃球科研第一人”。



      王蔭槐是香港科技大學的博士二年級學生,導師為譚平教授。

      在此之前,他碩士就讀于北京大學,本科畢業(yè)于西安電子科技大學,并于IDEA Research、宇樹科技以及上海人工智能實驗室等機構(gòu)進行實習。

      從2023年在仿真環(huán)境的小試牛刀,到這次直接讓機器人在真實環(huán)境中打球,得益于機器人本體的發(fā)展,這速度真是很快了!



      [1]https://x.com/NliGjvJbycSeD6t/status/1991536374097559785

      [2]https://wyhuai.github.io/info/

      [3]https://ingrid789.github.io/SkillMimicV2/

      [4]https://wyhuai.github.io/physhoi-page/[5]https://ingrid789.github.io/SkillMimic/

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      得知被判死緩,對被害人一家破口大罵

      得知被判死緩,對被害人一家破口大罵

      中國新聞周刊
      2025-12-07 10:50:19
      一部《芳華》,為何在今天突然刺痛了這么多人?

      一部《芳華》,為何在今天突然刺痛了這么多人?

      草莓解說體育
      2025-12-08 09:46:53
      詐騙14億!王麗坤全網(wǎng)社死前夫被法拍清單流出 才知他們有多奢靡

      詐騙14億!王麗坤全網(wǎng)社死前夫被法拍清單流出 才知他們有多奢靡

      千言娛樂記
      2025-11-27 22:16:17
      豪門球隊贊助商費用曝光!AC米蘭2.5億元 不如曼城和曼聯(lián)的一半

      豪門球隊贊助商費用曝光!AC米蘭2.5億元 不如曼城和曼聯(lián)的一半

      漫川舟船
      2025-12-08 11:09:34
      壽命與大便次數(shù)有關?研究發(fā)現(xiàn):壽命長的人,每天排便在這個次數(shù)

      壽命與大便次數(shù)有關?研究發(fā)現(xiàn):壽命長的人,每天排便在這個次數(shù)

      DrX說
      2025-10-24 14:15:19
      剛訪完印度,普京收到壞消息,通往中國的鐵路不得不叫停了

      剛訪完印度,普京收到壞消息,通往中國的鐵路不得不叫停了

      陳博世財經(jīng)
      2025-12-08 10:30:23
      林徽因落選的國徽方案,網(wǎng)友看后感嘆:審美確實一絕,但真不合適

      林徽因落選的國徽方案,網(wǎng)友看后感嘆:審美確實一絕,但真不合適

      元哥說歷史
      2025-12-03 11:25:03
      中組部:公職人員退休后未經(jīng)批準經(jīng)商(包括當律師)的,不再保留黨政機關退休金等待遇

      中組部:公職人員退休后未經(jīng)批準經(jīng)商(包括當律師)的,不再保留黨政機關退休金等待遇

      新浪財經(jīng)
      2025-11-18 12:46:38
      中國乘勝追擊:既然日本首相稱立場沒變,那就把對華承諾復述一遍

      中國乘勝追擊:既然日本首相稱立場沒變,那就把對華承諾復述一遍

      成視Talk
      2025-12-08 11:06:10
      中美日首次世界500強排名斷崖差距:美151家,日149家,中國呢?

      中美日首次世界500強排名斷崖差距:美151家,日149家,中國呢?

      阿柒的訊
      2025-12-04 19:39:35
      蘇群:楊瀚森在同一場比賽內(nèi),上下半場呈現(xiàn)不同的面貌是重要優(yōu)點

      蘇群:楊瀚森在同一場比賽內(nèi),上下半場呈現(xiàn)不同的面貌是重要優(yōu)點

      狼叔評論
      2025-12-08 10:22:09
      俄羅斯已無力支付軍餉,地方財政告急

      俄羅斯已無力支付軍餉,地方財政告急

      桂系007
      2025-12-05 21:32:16
      兵敗如山倒!9人皇馬0比2塞爾塔 距榜首巴薩已有4分

      兵敗如山倒!9人皇馬0比2塞爾塔 距榜首巴薩已有4分

      愛奇藝體育
      2025-12-08 10:40:08
      張本老爸氣到離場:這屆娃帶不動啊!

      張本老爸氣到離場:這屆娃帶不動啊!

      喜歡歷史的阿繁
      2025-12-08 09:53:34
      弘一法師:再大的事,三年后都是小事,何不提前“預支”那份坦然

      弘一法師:再大的事,三年后都是小事,何不提前“預支”那份坦然

      杏花煙雨江南的碧園
      2025-11-08 10:00:03
      中北大學學生吐槽吹頭發(fā)還要付費:3分鐘0.5元!校方回應

      中北大學學生吐槽吹頭發(fā)還要付費:3分鐘0.5元!校方回應

      極目新聞
      2025-12-07 14:02:10
      大約價值1300萬元!湖北一地公安公告:尋找190萬枚USDT幣原主人,6個月后若仍無人認領,將依法上繳國庫

      大約價值1300萬元!湖北一地公安公告:尋找190萬枚USDT幣原主人,6個月后若仍無人認領,將依法上繳國庫

      每日經(jīng)濟新聞
      2025-12-07 09:38:08
      勒沃庫森師徒把兩大豪門坑慘了,阿隆索更是直接把皇馬帶到溝里!

      勒沃庫森師徒把兩大豪門坑慘了,阿隆索更是直接把皇馬帶到溝里!

      田先生籃球
      2025-12-08 10:37:32
      新疆網(wǎng)紅wu木三亞去世,人長的帥,朋友曝死因,上個月新店才開業(yè)

      新疆網(wǎng)紅wu木三亞去世,人長的帥,朋友曝死因,上個月新店才開業(yè)

      鋭娛之樂
      2025-12-07 19:58:59
      小米粥再次被關注,調(diào)查發(fā)現(xiàn):高血糖患者喝小米粥,或有4大改善

      小米粥再次被關注,調(diào)查發(fā)現(xiàn):高血糖患者喝小米粥,或有4大改善

      九哥聊軍事
      2025-12-07 10:00:20
      2025-12-08 12:04:49
      量子位 incentive-icons
      量子位
      追蹤人工智能動態(tài)
      11820文章數(shù) 176340關注度
      往期回顧 全部

      科技要聞

      萬億蘋果,正在經(jīng)歷一場嚴重的“大失血”

      頭條要聞

      媒體:美國重返西半球 若從亞太撤離或挑撥中日干一架

      頭條要聞

      媒體:美國重返西半球 若從亞太撤離或挑撥中日干一架

      體育要聞

      厲害的后衛(wèi)何其多 想想還少了哪一個

      娛樂要聞

      郭麒麟也救不了的德云社了?

      財經(jīng)要聞

      養(yǎng)牛場未見一頭牛 每天開采礦石倒賣

      汽車要聞

      挑戰(zhàn)深圳地獄級路況 魏牌藍山VLA上車會思考聽得懂人話

      態(tài)度原創(chuàng)

      家居
      數(shù)碼
      手機
      藝術
      公開課

      家居要聞

      有限無界 打破慣有思維

      數(shù)碼要聞

      狼途推出T87系列燈箱三模機械鍵盤:12000mAh電池,可選8kHz

      手機要聞

      iPhone 17系列太恐怖,這一組數(shù)據(jù)就是證明

      藝術要聞

      從3萬人的“小香港”到十室九空!江西深山被廢棄的煤礦小鎮(zhèn)

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 久久日产一线二线三线| 色宗网| www.色人妻.com| 老子午夜精品无码| 毛片亚洲AV无码精品国产午夜| 久热天堂| 国产野战AV| 欧美高清第6页| 闺蜜张开腿让我爽了一夜| 欧美亚洲h在线一区二区| 韩城市| 蜜桃久久精品成人无码av| 区。| 她也色tayese在线视频| 五级黄高潮片90分钟视频| 富婆熟妇熟女二区三区| 兴化市| av淘宝国产在线观看| 亚洲成a人片77777kkkk| 狠狠干奇米| 少妇粗大进出白浆嘿嘿视频| 亚洲中文在线观看| 中国一区二区三区| 久久99精品国产自在现线小黄鸭| 日本免费人成视频在线观看| 乱人伦人妻精品一区二区| 国产ts| 精品a片| 亚洲男女羞羞无遮挡久久丫 | 德阳市| 国产精品久久久久久久久久| 99r久久| 国产精品成人三级| 四川丰满少妇被弄到高潮| 亚洲中文字幕在线精品一区| 日日碰狠狠躁久久躁96avv| 妺妺窝人体色www看美女| 国产xxxxxx| 中文国产| 欧美激情内射喷水高潮| 家庭激情网|