- henry 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
平時(shí)一看機(jī)器人比賽,就說遙操,遙操。今兒個(gè),鼓勵(lì)“自力更生的”,來了!
就在這周末剛剛收官的ATEC2025線下挑戰(zhàn)賽,主辦方不僅鼓勵(lì)機(jī)器人自主完成任務(wù),還首次在無遙操的情況下,把機(jī)器人從實(shí)驗(yàn)室拉到戶外遛了一圈。
![]()
拱橋、山地、緩坡、吊橋、操場,全靠AI自主闖關(guān),而且還是one-shot。
對于這次比賽的難度,作為“出題人”的主辦方可謂相當(dāng)自信,比賽還未開打,就提前透露:
- 這可能會(huì)是一場翻車無數(shù)的比賽!
只不過,有看頭的比賽從來不缺反轉(zhuǎn)。
原以為是主辦方預(yù)判的翻車局,選手們卻一個(gè)比一個(gè)能整活,奇招不斷,狠狠破局。
經(jīng)過兩天的激烈較量,前三賽隊(duì)新鮮出爐:浙江大學(xué)Wongtsai摘得桂冠,上海交通大學(xué)IRMV和北京理工大學(xué)CyberPrime團(tuán)隊(duì)緊隨其后,分獲亞軍、季軍。(均為機(jī)器狗方案)
![]()
浙江大學(xué)Wongtsai賽隊(duì)
更離譜的是——浙大團(tuán)隊(duì)在奪冠后還“凡爾賽”地說,他們其實(shí)準(zhǔn)備了更難的預(yù)案。
所以,這究竟是一場怎樣的“機(jī)器人大賽”?
賽前預(yù)警翻車?選手:不存在的
這次第五屆ATEC科技精英賽線下賽由香港中文大學(xué)主辦、ATEC前沿科技探索社區(qū)、北京大學(xué)、北京師范大學(xué)、螞蟻集團(tuán)聯(lián)合承辦,于12月6-7日周末兩天,在港中文嶺南體育場與 “小橋流水” 生態(tài)區(qū)正式打響。
本次賽事的專家評審陣容包括劉云輝謝立華Masayoshi Tomizuka等多位國際知名機(jī)器人學(xué)者。
線下賽共設(shè)置:垃圾分揀自主澆花定向越野吊橋穿越四個(gè)真實(shí)世界挑戰(zhàn),將基礎(chǔ)操作到跨地形移動(dòng)一網(wǎng)打盡:
垃圾分揀:機(jī)器人從初始位置出發(fā)(下同),識(shí)別香蕉皮、透明塑料瓶和紙盒、抓取、移動(dòng)、放入對應(yīng)顏色的垃圾桶。這一任務(wù)旨在考察機(jī)器人視覺感知、目標(biāo)識(shí)別、移動(dòng)操作與長程任務(wù)的能力。
![]()
自主澆花:完成拿水壺、接水、找到花籃、澆花和把水壺放回原處等一系列操作,這對機(jī)器人的空間定位、穩(wěn)定抓取和精細(xì)操作都是考驗(yàn)。
![]()
定向越野:自主穿越拱橋、山地、陡峭樓梯等復(fù)雜戶外路線,這里的重點(diǎn)是全局規(guī)劃、地形理解與長程穩(wěn)定行走。
![]()
吊橋穿越:穿過三段間距不等的吊橋,并在第三段拉繩搭橋,使中斷處可通過,這一任務(wù)旨在考察機(jī)器人在不同路面行走的魯棒性以及工具使用能力。
![]()
總體而言,比賽規(guī)則強(qiáng)調(diào)鼓勵(lì)自主、限制干預(yù):遙操作越少,自主完成越多,得分就越高。
針對這一規(guī)則,選手在實(shí)際比賽中普遍采取了先遙操保底、再自主沖高分的策略,而在具體的項(xiàng)目上,則更是臨場發(fā)揮,奇招盡出。
比如,為了挺過吊橋,選手們紛紛給機(jī)器人安上了“大腳板”和“雪橇”,以防機(jī)器人的足部卡在縫隙中。
![]()
而上交的IRMV賽隊(duì)甚至干脆略過拉繩搭橋的環(huán)節(jié),讓機(jī)器狗跳過50cm的空隙。

澆花任務(wù)也稱得上是百花齊放:橫握、倒抓、夾持、撐開……各種“拿壺姿勢”,一看一個(gè)不吱聲。
![]()
在垃圾分揀任務(wù)中,冠亞軍隊(duì)伍Wongtsai和IRMV表現(xiàn)出了極強(qiáng)的統(tǒng)治力,各自的機(jī)器狗完全依靠自主模塊通關(guān),穩(wěn)穩(wěn)拿下無遙操的額外加分。
![]()
戶外越野方面,Wongtsai則繼續(xù)領(lǐng)先,成為比賽中第一個(gè)全自主跑完越野賽題的四足機(jī)器人隊(duì)伍。
![]()
最終,Wongtsai憑借在機(jī)器人全自主智能方面的卓越表現(xiàn),摘得15萬美元冠軍大獎(jiǎng)。
不是黑歷史,而是具身智能的來時(shí)路
除了選手們的精彩臨場發(fā)揮,作為全球首個(gè)聚焦實(shí)景極端環(huán)境的人工智能與機(jī)器人賽事,比賽內(nèi)容也著實(shí)暴露了不少在實(shí)驗(yàn)室環(huán)境中不易看到的問題,主要集中在以下四個(gè)層面:
本體——人形VS四足差距明顯
如果按“一場論”來說:四足機(jī)器人(機(jī)器狗)在所有任務(wù)的表現(xiàn)均明顯優(yōu)于雙足(人形)
![]()
在人形機(jī)器人“失手”最多的定向越野項(xiàng)目中,解說員表示:人形機(jī)器人重心高、觸點(diǎn)少,在復(fù)雜地形明顯吃虧,上坡、陡梯、碎石路都顯得十分吃力。
而在澆花、垃圾分揀這類需要穩(wěn)定抓取和精細(xì)操作的項(xiàng)目里,人形機(jī)器人同樣表現(xiàn)不佳——
結(jié)構(gòu)復(fù)雜、控制鏈條長,一旦定位不準(zhǔn)或手部調(diào)節(jié)稍有偏差,就難以完成有效抓取。即便有遙操作輔助,也依然容易失手。
![]()
相比之下,四足機(jī)器人則穩(wěn)得多,既能在澆花、分揀等任務(wù)中用背部夾爪完成任務(wù),又在戶外越野和吊橋穿越中展現(xiàn)出了統(tǒng)治級的表現(xiàn)。
![]()
最令人驚喜的是,Wongtsai和CyberPrime的機(jī)器狗甚至實(shí)現(xiàn)了全自主的垃圾分揀任務(wù)。
此外,在比賽中,并非所有隊(duì)伍的“臨時(shí)改裝”都帶來了正向效果。上面提到的“物理外掛”還引發(fā)了軟硬件協(xié)同的co-design問題。
例如,一些隊(duì)伍為了提升穩(wěn)定性臨時(shí)把腳板加寬,反而導(dǎo)致了機(jī)器人的感知與步態(tài)控制失衡,從而卡腳摔倒。
![]()
感知——室外帶來的非線性難度躍升
這次全戶外的環(huán)境也給機(jī)器人的感知能力帶來了不小的挑戰(zhàn):來自光照、風(fēng)、陰影等細(xì)微環(huán)境變化的擾動(dòng)會(huì)不斷累積成誤差,成為影響任務(wù)成功率的關(guān)鍵變量。
在垃圾分揀任務(wù)中,透明的塑料瓶在室外由于反光以及背景等因素,導(dǎo)致機(jī)器人經(jīng)常識(shí)別失敗。
![]()
而在戶外越野任務(wù)中,樹蔭下的局部強(qiáng)/弱光交替則增加了機(jī)器人感知外界環(huán)境的難度。
甚至一點(diǎn)“風(fēng)吹草動(dòng)”,也會(huì)影響物體的位置,進(jìn)而改變可抓取姿態(tài),迫使affordance估計(jì)必須實(shí)時(shí)更新。
在比賽中,上一秒香蕉皮的位置還很準(zhǔn)確,但當(dāng)機(jī)器人準(zhǔn)備下爪抓取時(shí),一陣風(fēng)吹來,香蕉皮被吹偏,感知瞬間被打亂。
![]()
此外,相比于室內(nèi),在信號弱的野外,機(jī)器人更依賴自身IMU(慣性測量單元)、激光雷達(dá)與本地推理能力,難度再上臺(tái)階。
規(guī)劃——能做動(dòng)作,卻不知道下一步怎么接
在規(guī)劃層面,賽場上暴露出的一個(gè)普遍現(xiàn)象是:機(jī)器人即便能完成單個(gè)動(dòng)作,也常常出現(xiàn)“拿起香蕉后不知道接下來做什么”的現(xiàn)象。
在吊橋任務(wù)中,盡管多數(shù)隊(duì)伍能在遙控的輔助下通過不連續(xù)的木板,但幾乎沒有隊(duì)伍能在無輔助的情況下“把繩子拉下、把木板當(dāng)橋板用”,這暴露出當(dāng)前機(jī)器人在多步驟關(guān)聯(lián)推理環(huán)境改造能力上的明顯短板。
![]()
操作——上半身與下半身的解耦
在這次比賽中,與長程任務(wù)同等重要的,還有對loco-manipulation(移動(dòng)操作)的考驗(yàn)。
這要求機(jī)器人在移動(dòng)過程中精準(zhǔn)完成定位與姿態(tài)調(diào)整,以實(shí)現(xiàn)抓取或其他精細(xì)操作。
在比賽中,常見的失敗模式包括:
- 機(jī)器人無法精確停到抓取位,導(dǎo)致執(zhí)行器無法接觸目標(biāo)。
- 在抓取或搬運(yùn)時(shí)出現(xiàn)力控/穩(wěn)定性失衡(抓取位置不當(dāng),物體脫落),無法完成后續(xù)動(dòng)作。
對于這一現(xiàn)象,我們在賽后采訪中得知,多數(shù)隊(duì)伍采用的是上半身操作與下半身移動(dòng)解耦的架構(gòu)。
也就是說,機(jī)器人缺少一套統(tǒng)一的全身運(yùn)動(dòng)與操作控制框架。
結(jié)果在賽場上常見的場景是:下半身可以自主行走,但機(jī)械臂與夾爪還得靠人工遙控完成關(guān)鍵操作
這一現(xiàn)象并非偶然。
當(dāng)前許多前沿VLA型模型(如 RT-2、OpenVLA、RDT、Pi0.5)主要聚焦上半身操作能力——解決“手如何推斷、如何執(zhí)行”的問題,但對“移動(dòng)-操作”的端到端整合的支持仍十分有限。
從這個(gè)角度看,未來真正值得期待的突破,可能來自能同時(shí)統(tǒng)一移動(dòng)與操作、實(shí)現(xiàn)全身自主控制的端到端機(jī)器人模型。
這或許將成為下一代具身智能的重要方向,也將決定機(jī)器人能否真正走向復(fù)雜的真實(shí)世界。
真實(shí)世界,才是最終考場
總的來說,這次比賽不僅是一片檢驗(yàn)機(jī)器人真實(shí)能力的練兵場,也像是給未來機(jī)器人測評體系遞來的一張草圖。
現(xiàn)有的具身智能benchmark,無論是偏仿真的ManiSkill,還是偏室內(nèi)流程的RoboChallenge更像是切片式測評,只能看到機(jī)器人的某一面。
而像ATEC這樣的真實(shí)世界挑戰(zhàn),則給行業(yè)提供了另一種可能:既更接近機(jī)器人最終要面對的場景,也更有機(jī)會(huì)推動(dòng)我們重新思考“能力”以及“如何衡量能力”這兩個(gè)根本問題。
或許幾年后回頭看,這場比賽的意義不會(huì)只在于誰走上了坡、誰沒踩穩(wěn)拱橋,而在于它讓整個(gè)行業(yè)看到:機(jī)器人離“走進(jìn)世界”還有多遠(yuǎn),又應(yīng)該往哪個(gè)方向繼續(xù)補(bǔ)課。
正如賽事專家委員會(huì)主席、香港工程院院士劉云輝教授所說:
- 我們希望通過極限挑戰(zhàn),推動(dòng)機(jī)器人從演示可行,走向應(yīng)用可靠。
作為賽事發(fā)起單位之一,螞蟻集團(tuán)技術(shù)戰(zhàn)略部負(fù)責(zé)人表示,螞蟻集團(tuán)長期支持ATEC賽事,源于一個(gè)信念:
- AGI技術(shù)發(fā)展的未來,是實(shí)現(xiàn)機(jī)器智能與物理世界的深度融合,讓機(jī)器人面對真實(shí)世界的擾動(dòng)。因此,ATEC設(shè)計(jì)的每一道題,都不是為了讓它“完成得好看”,而是為了讓它在碰撞中暴露真正的弱點(diǎn)。因?yàn)槿绻麊栴}不是真實(shí)的,就不會(huì)牽引出真實(shí)的技術(shù)進(jìn)步。只有“真問題”,才能讓行業(yè)知道下一步要突破什么。
換句話說,實(shí)驗(yàn)室里永遠(yuǎn)不會(huì)出現(xiàn)的光照、氣流、遮擋,踩空與翻車恰恰是讓機(jī)器人邁向可用、可信的真正門檻。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.