人形機(jī)器人也能輕松操控滑板了?近日,中國(guó)電信人工智能研究院聯(lián)合上海交通大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、上海科技大學(xué)等機(jī)構(gòu)的研發(fā)團(tuán)隊(duì),提出了 HUSKY 物理感知全身控制框架。依托 Unitree G1 人形機(jī)器人平臺(tái),這套框架讓人形機(jī)器人真正掌握了滑板的推進(jìn)、轉(zhuǎn)向技能,還能流暢完成推滑與轉(zhuǎn)向之間的動(dòng)作切換。無論是室內(nèi)平整地面,還是戶外各類場(chǎng)景,它都能穩(wěn)定滑行,遭遇外部干擾時(shí),也能及時(shí)調(diào)整姿態(tài)、保持平衡不摔倒。
![]()
01.
人形機(jī)器人滑板,難在比想象中更復(fù)雜的動(dòng)態(tài)控制
沒人會(huì)覺得人形機(jī)器人玩滑板是件容易事,這背后的技術(shù)難點(diǎn),遠(yuǎn)不止讓機(jī)器人站在滑板上不晃那么簡(jiǎn)單。和機(jī)器人以往面對(duì)的靜態(tài)環(huán)境不同,滑板本身是一個(gè)欠驅(qū)動(dòng)的輪式平臺(tái),運(yùn)動(dòng)時(shí)受非完整約束限制,機(jī)器人和滑板之間的人機(jī)耦合作用,會(huì)讓整個(gè)系統(tǒng)的動(dòng)力學(xué)特性變得高度非線性。
![]()
簡(jiǎn)單來說,機(jī)器人需要同時(shí)控制自身身體平衡,還要間接操控腳下這個(gè)一直在移動(dòng)的支撐基座。這種緊密耦合的欠驅(qū)動(dòng)狀態(tài),稍有控制不當(dāng)就會(huì)失穩(wěn)。此前傳統(tǒng)的模型基方法,大多靠簡(jiǎn)化的動(dòng)力學(xué)模型做軌跡規(guī)劃,但滑板的真實(shí)運(yùn)動(dòng)特性太過復(fù)雜,簡(jiǎn)化模型根本捕捉不到核心細(xì)節(jié);再加上求解高維非凸優(yōu)化問題的計(jì)算成本極高,完全滿足不了滑板動(dòng)態(tài)運(yùn)動(dòng)的實(shí)時(shí)控制需求。
近幾年興起的深度強(qiáng)化學(xué)習(xí),雖在四足機(jī)器人滑板、人形機(jī)器人輪滑等任務(wù)中展現(xiàn)出一定優(yōu)勢(shì),可面對(duì)人形機(jī)器人本身的高維狀態(tài)和動(dòng)作空間,再疊加滑板的動(dòng)態(tài)耦合效應(yīng),想要實(shí)現(xiàn)穩(wěn)健的全身協(xié)調(diào)控制難度極大。即便有些方案能在仿真環(huán)境中做出滑板動(dòng)作,也因忽略了真實(shí)硬件的物理約束,以及仿真與現(xiàn)實(shí)之間的固有差距,始終無法落地到真實(shí)場(chǎng)景中。
![]()
研究團(tuán)隊(duì)提出的 HUSKY 框架,先從拆解滑板的物理特性入手,細(xì)致分析了滑板的甲板、轉(zhuǎn)向架、車輪等核心結(jié)構(gòu),再通過深入研究轉(zhuǎn)向架的機(jī)械幾何關(guān)系,推導(dǎo)出板體傾斜角和轉(zhuǎn)向架轉(zhuǎn)向角之間的硬性約束公式 ——tanσ=tanλ?sinγ(其中 λ 是滑板的固定前角,σ 是轉(zhuǎn)向架轉(zhuǎn)向角,γ 是板體傾斜角),這套物理模型也成了后續(xù)所有控制策略的基礎(chǔ)。
02.
讓機(jī)器人像人一樣發(fā)力,不僵硬更穩(wěn)定
推動(dòng)滑板向前,推進(jìn)環(huán)節(jié)的分寸感極難拿捏。腳蹬地面的力度要恰到好處,既能產(chǎn)生持續(xù)的動(dòng)力,又不能破壞單腳踩板時(shí)的身體重心。同時(shí),動(dòng)作必須自然流暢,否則無法應(yīng)對(duì)多變的滑行速度,也難以精準(zhǔn)把控腳與地面、滑板的接觸時(shí)機(jī)。
傳統(tǒng)的參考軌跡跟蹤方法并不適用這類場(chǎng)景。這類方法將動(dòng)作固化為預(yù)設(shè)模板,執(zhí)行起來機(jī)械僵硬,一旦現(xiàn)實(shí)環(huán)境出現(xiàn)微小偏差,整個(gè)系統(tǒng)就可能失去控制。
團(tuán)隊(duì)為此引入了對(duì)抗性運(yùn)動(dòng)先驗(yàn)(AMP)技術(shù),核心是讓機(jī)器人從人類的滑板推滑數(shù)據(jù)中自主學(xué)習(xí)。他們?yōu)闄C(jī)器人構(gòu)建了一個(gè)包含五個(gè)時(shí)間步的運(yùn)動(dòng)窗口,通過判別器持續(xù)對(duì)比機(jī)器人的動(dòng)作軌跡與人類的示范軌跡,在反復(fù)的對(duì)抗訓(xùn)練中,引導(dǎo)機(jī)器人的控制策略向人體的運(yùn)動(dòng)力學(xué)邏輯靠攏。
這種學(xué)習(xí)方式徹底打破了固定軌跡的枷鎖。實(shí)驗(yàn)數(shù)據(jù)的對(duì)比極為鮮明:?jiǎn)渭兏檯⒖紕?dòng)作的方案,任務(wù)成功率僅為 11.12%;而搭載 AMP 技術(shù)的推進(jìn)策略,成功率高達(dá) 100%,速度跟蹤誤差低至 0.056。關(guān)節(jié)動(dòng)作的流暢度顯著提升,腳與滑板、地面的接觸誤差也幾乎可以忽略不計(jì)。此刻的機(jī)器人,不再是生硬地執(zhí)行 “蹬地” 指令,而是通過更協(xié)調(diào)的全身動(dòng)作自然發(fā)力,實(shí)現(xiàn)了高效與穩(wěn)定的統(tǒng)一。
03.
物理制導(dǎo)轉(zhuǎn)向:靠身體傾斜控向,精準(zhǔn)又省力
滑板的轉(zhuǎn)向,核心原理就是靠身體傾斜帶動(dòng)板體傾斜,進(jìn)而驅(qū)動(dòng)轉(zhuǎn)向架轉(zhuǎn)動(dòng)實(shí)現(xiàn)變向。HUSKY 框架將這一物理原理發(fā)揮到極致,專門打造了物理制導(dǎo)的轉(zhuǎn)向策略。
![]()
團(tuán)隊(duì)借鑒車輛動(dòng)力學(xué)中的自行車模型,刻意忽略次要的橫向滑動(dòng)和垂直動(dòng)力學(xué)影響,將焦點(diǎn)完全放在滑板的偏航運(yùn)動(dòng)上。他們先把滑板的偏航率與板體傾斜角建立關(guān)聯(lián),再結(jié)合之前推導(dǎo)出的板體傾斜與轉(zhuǎn)向架轉(zhuǎn)動(dòng)的物理約束,最終精準(zhǔn)計(jì)算出實(shí)現(xiàn)目標(biāo)轉(zhuǎn)向所需的板體傾斜角參考值。簡(jiǎn)單來說,機(jī)器人一旦接收到轉(zhuǎn)向指令,就能根據(jù)當(dāng)前滑板速度、目標(biāo)航向,精確算出需要傾斜的角度,再通過自身身體傾斜誘導(dǎo)板體完成對(duì)應(yīng)動(dòng)作,整個(gè)轉(zhuǎn)向過程都嚴(yán)格貼合物理規(guī)律。
![]()
為了進(jìn)一步提升機(jī)器人轉(zhuǎn)向時(shí)的平衡穩(wěn)定性,團(tuán)隊(duì)還在滑板轉(zhuǎn)向架上方設(shè)置了兩個(gè)虛擬標(biāo)記點(diǎn),專門引導(dǎo)機(jī)器人將雙腳精準(zhǔn)放置在這個(gè)最優(yōu)位置。實(shí)驗(yàn)對(duì)比的結(jié)果十分直觀:沒有物理制導(dǎo)的傾斜參考時(shí),機(jī)器人只能自主摸索傾斜角度,不僅航向跟蹤誤差高達(dá) 0.233,可到達(dá)的航向范圍也十分狹窄;加入物理制導(dǎo)后,航向跟蹤誤差直接降至 0.208,轉(zhuǎn)向精準(zhǔn)度大幅提升,可實(shí)現(xiàn)的轉(zhuǎn)向范圍也顯著擴(kuò)大,即便是連續(xù)轉(zhuǎn)向動(dòng)作,也能平穩(wěn)完成。
04.
破解推滑轉(zhuǎn)向切換的最大難題
推進(jìn)和轉(zhuǎn)向,是滑板運(yùn)動(dòng)中兩個(gè)截然不同的動(dòng)作相位:推進(jìn)時(shí)單腳踩板、單腳蹬地,轉(zhuǎn)向時(shí)雙腳均需置于板上。二者的身體姿態(tài)、接觸動(dòng)力學(xué)、控制目標(biāo)差異極大,直接切換極易導(dǎo)致機(jī)器人失穩(wěn),這也是此前很多方案難以實(shí)現(xiàn)連續(xù)滑板的核心卡點(diǎn)。
![]()
針對(duì)這一痛點(diǎn),HUSKY 框架專門設(shè)計(jì)了軌跡引導(dǎo)過渡機(jī)制,本質(zhì)就是為機(jī)器人規(guī)劃一套平滑的中間動(dòng)作,幫助它從推進(jìn)姿態(tài)平穩(wěn)過渡到轉(zhuǎn)向姿態(tài),反之也能順暢切換。團(tuán)隊(duì)篩選出能代表機(jī)器人核心運(yùn)動(dòng)的關(guān)鍵身體部位,用 n 階貝塞爾曲線規(guī)劃這些部位的平移軌跡,確保移動(dòng)過程平滑無頓挫;同時(shí)采用球面線性插值(slerp)處理這些部位的姿態(tài)轉(zhuǎn)換,避免轉(zhuǎn)動(dòng)時(shí)出現(xiàn)突兀感和失衡問題。
![]()
這套過渡機(jī)制摒棄了固定的預(yù)設(shè)動(dòng)作,而是以機(jī)器人當(dāng)前相位的實(shí)際末端姿態(tài)為起點(diǎn),以目標(biāo)相位的標(biāo)準(zhǔn)穩(wěn)定姿態(tài)為終點(diǎn),動(dòng)態(tài)生成中間參考軌跡,完美貼合機(jī)器人的實(shí)時(shí)運(yùn)動(dòng)狀態(tài)。實(shí)驗(yàn)數(shù)據(jù)的對(duì)比十分清晰:僅靠參考動(dòng)作引導(dǎo)過渡,機(jī)器人的接觸誤差會(huì)高達(dá) 0.394,腳位錯(cuò)誤頻發(fā);只規(guī)劃平移軌跡、忽略姿態(tài)調(diào)整,會(huì)導(dǎo)致航向跟蹤失常,機(jī)器人也無法擺好轉(zhuǎn)向姿態(tài);而 HUSKY 的完整過渡策略,將接觸誤差控制在 0.001,讓推進(jìn)到轉(zhuǎn)向、轉(zhuǎn)向到推進(jìn)的切換實(shí)現(xiàn)無縫銜接,真正達(dá)成了連續(xù)的滑板循環(huán)。
05.
精準(zhǔn)還原物理特性,突破虛實(shí)鴻溝
讓仿真里訓(xùn)練好的機(jī)器人,在真實(shí)世界中也能穩(wěn)定滑板,關(guān)鍵在于抹平仿真與現(xiàn)實(shí)之間的物理差距。
![]()
首先是滑板物理參數(shù)的精準(zhǔn)識(shí)別。團(tuán)隊(duì)通過自由衰減滾動(dòng)響應(yīng)實(shí)驗(yàn),讓真實(shí)滑板完成傾斜后的自由擺動(dòng),精準(zhǔn)測(cè)量擺動(dòng)周期、振幅衰減等關(guān)鍵數(shù)據(jù),進(jìn)而計(jì)算出滑板轉(zhuǎn)向架襯套的扭轉(zhuǎn)剛度和阻尼系數(shù)。結(jié)合滑板的轉(zhuǎn)動(dòng)慣量,他們?cè)诜抡姝h(huán)境中搭建出與真實(shí)滑板高度一致的彈簧 - 阻尼模型。如此一來,仿真里的滑板物理特性與現(xiàn)實(shí)幾乎無異,機(jī)器人在仿真中習(xí)得的動(dòng)作,到了真實(shí)場(chǎng)景才不會(huì) “水土不服”。
其次是領(lǐng)域隨機(jī)化訓(xùn)練。為提升機(jī)器人控制策略的魯棒性,團(tuán)隊(duì)在仿真訓(xùn)練階段,特意對(duì)機(jī)器人質(zhì)心、滑板質(zhì)心、機(jī)器人與滑板的摩擦系數(shù)、關(guān)節(jié)初始位置等參數(shù)進(jìn)行隨機(jī)擾動(dòng),讓機(jī)器人在訓(xùn)練過程中逐步適應(yīng)各種微小的環(huán)境變化。這樣一來,當(dāng)它進(jìn)入真實(shí)世界,即便遇到不可預(yù)測(cè)的物理偏差,也能保持穩(wěn)定運(yùn)行。
在 Unitree G1 人形機(jī)器人的真實(shí)測(cè)試中,這套框架的表現(xiàn)十分亮眼:機(jī)器人以 50Hz 的控制頻率穩(wěn)定運(yùn)行,關(guān)節(jié)位置由 500Hz 的 PD 控制器精準(zhǔn)跟蹤,可順利完成連續(xù)的滑板循環(huán)。無論是室內(nèi)平整地面,還是戶外各類場(chǎng)景,它都能穩(wěn)定推進(jìn)、靈活轉(zhuǎn)向;即便換上不同剛度的滑板,也能快速適配;遭遇輕微外部干擾時(shí),還能迅速調(diào)整身體姿態(tài),穩(wěn)穩(wěn)保持平衡不摔倒。更值得一提的是,機(jī)器人動(dòng)作切換時(shí)的腳部運(yùn)動(dòng),和人類極為相似:蹬地發(fā)力后平穩(wěn)抬腳,精準(zhǔn)落在滑板的標(biāo)記位置,落板后還會(huì)輕輕調(diào)整身體,讓軀干與滑板甲板保持垂直,為后續(xù)轉(zhuǎn)向做好充分準(zhǔn)備。
06.
不止是“玩滑板”,為動(dòng)態(tài)人機(jī)交互控制打開新思路
HUSKY 框架的提出,不僅讓人形機(jī)器人解鎖了一項(xiàng)酷炫技能,更重要的是,它為解決高動(dòng)態(tài)、強(qiáng)耦合的復(fù)雜控制問題,提供了一套可復(fù)用的思路,它將物理建模與強(qiáng)化學(xué)習(xí)深度融合,先從物理本質(zhì)出發(fā)摸清被控對(duì)象的規(guī)律,再用學(xué)習(xí)型方法實(shí)現(xiàn)精準(zhǔn)的全身控制,讓機(jī)器人的動(dòng)作既有扎實(shí)的物理依據(jù),也具備足夠的靈活性和魯棒性。
當(dāng)然,目前這套框架仍有繼續(xù)拓展的空間。現(xiàn)階段,機(jī)器人的控制主要依賴本體感知信息,相機(jī)的視野局限了它對(duì)滑板狀態(tài)、輪地交互的觀察;后續(xù)加入視覺狀態(tài)估計(jì),實(shí)現(xiàn)感知驅(qū)動(dòng)的閉環(huán)控制,機(jī)器人的滑板能力便能再上一個(gè)臺(tái)階。當(dāng)前的實(shí)驗(yàn)也主要在平坦的簡(jiǎn)單地形開展,若想讓機(jī)器人像人類滑板手一樣,在滑板公園完成轉(zhuǎn)彎、過障礙甚至簡(jiǎn)單的特技動(dòng)作,還需要融入更豐富的人類運(yùn)動(dòng)先驗(yàn),設(shè)計(jì)出適配復(fù)雜地形的自適應(yīng)控制策略。
未來,這套融合物理感知的全身控制思路,還能遷移到更多人形機(jī)器人的動(dòng)態(tài)任務(wù)中,比如輪滑、騎行,或是非結(jié)構(gòu)化地形中的移動(dòng)作業(yè)。這會(huì)讓人形機(jī)器人在動(dòng)態(tài)環(huán)境中的適應(yīng)能力不斷提升,也讓它離真正走進(jìn)現(xiàn)實(shí)生活、完成多樣化任務(wù),又近了一步。
論文地址:https://arxiv.org/pdf/2602.03205
項(xiàng)目地址:https://husky-humanoid.github.io/
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.