![]()
智東西
作者 許麗思
編輯 漠影
機器人花式后空翻、拳擊、擬人化奔跑、跳舞……這些高難度炫技已經讓人見怪不怪,進工廠干分揀、組裝、巡檢也越來越多,有時候容易讓公眾覺得,機器人看上去很聰明能干,距離走進日常生活不遠了。
但把視角從屏幕拉回到產業現場,畫風卻不太一樣。行業整體處在試點多、規模化少的早期階段,多數項目仍停留在實驗室demo和展會秀場,技術路徑、商業模式都還在探索,真正能落地的少之又少。
這種觀感上領先、應用上滯后的強烈反差感,不由得讓人追問,無遙操、全自主的機器人距離走進人類生活到底還有多遠?
ATEC2025賽事專家委員會主席、香港工程院院士劉云輝教授提出,機器人有三大核心能力,行走、操作、改造環境。這也是判斷機器人能否適應真實環境的重要依據。再具體一些,從機器人完整的“感知-決策-執行”的流程上來看,機器人需要準確感知真實環境,進行全自主決策,并完成最終的長鏈條任務執行。
問題是,這些能力在今天的機器人身上,究竟到了哪一步?行業需要一個盡量接近真實又能公開觀察的窗口。
![]()
近日,第五屆ATEC科技精英賽構建了一套真實世界適應力測試框架,比賽由香港中文大學主辦,ATEC前沿科技探索社區、北京大學、北京師范大學、螞蟻集團聯合承辦,專家評審陣容包括劉云輝、謝立華、Masayoshi Tomizuka等多位國際知名機器人學者。
賽事在全戶外場景下考察行走、操作、改造環境等多項能力,來自全球的13支頂尖賽隊完成了吊橋穿越、定向越野、自主澆花與垃圾分揀等系列任務。
就像螞蟻集團技術戰略部負責人所說,“設計的每一道題,都不是為了讓它‘完成得好看’,而是為了讓它在碰撞中暴露真正的弱點。因為如果問題不是真實的,就不會牽引出真實的技術進步。只有“真問題”,才能讓行業知道下一步要突破什么。”
一、拒絕標準化環境,機器人須進入非結構化的真實場景
當前,多數機器人技術驗證,基本都是在燈光可控、地面平整、障礙物規則的標準化環境中。
結果就是,這種設置屏蔽了真實世界的大量不確定性,就算取得不錯的表現,也難以拓展到其他場景的應用中。這是在判斷全自主機器人能否進入人類生活場景時,最先被標準場地抬高預期的第一個維度——環境感知能力。
感知到底難在哪?對機器人來說,要求它能習慣各種亂七八糟的光影、背景和雜物,能實現多模態信息融合,還要在目標和環境不斷變化的情況下,保持輸出穩定。
ATEC2025賽事組專家、香港中文大學(深圳)理工學院助理教授鐘仿洵提到,“真實環境里最大的問題是不確定性和高動態性,你看到的不一定是真的。”機器人必須具備識別并處理感知信息中“不確定性”的能力,這是實現高級自主的前提。
垃圾分揀就是一個很典型的例子,這樣的任務尤其注重機器人的環境識別能力:垃圾類型、材質、形狀都各不相同,還可能有污漬、遮擋、隨意堆疊。同一個物體只要在堆疊順序、污漬上變一下,在實驗室里訓練出來的識別能力很可能一下子就無法正常工作了。
![]()
多支賽隊在采訪時提到,實驗室里的精準識別,到了真實場景可能瞬間失效。比如,比賽當天,香港大晴天的太陽光線非常強烈,香蕉皮在被反復抓取后發生不可回彈形變;實驗室采集的桌子數據完全不適用,現場桌子反光影響了激光相機點云;透明物品比如礦泉水瓶由于反光等原因,導致多臺機器人識別失敗;有的機器人垃圾還沒抓取到,就急著往垃圾桶走……
這與很多機器人應用試點中,換一個工位、燈光,應用效果就大打折扣的情況高度相似。它們指向的都是同一個行業事實:機器人在真實環境的感知能力,是可大規模部署的基本前提。
在運動場景中,類似的問題同樣存在。定向越野比賽,復雜蜿蜒的林間小路光影搖曳,樹蔭和坑洼不斷交錯,機器人必須判斷眼前的暗塊到底是可以踩上去的土路,還是需要回避的坑洼,需要感知系統可靠估計地形、識別可通行區域。
劉云輝教授表示,這類任務強調是在自然場景下測試運動能力和環境識別,在一些有限引導下,看看機器人能不能通過實時反應克服障礙、爬山涉水。
作為冠軍選手的浙大Wongtsai團隊稱,面對復雜的真實環境,他們在Isaac LAB中搭建了一個盡可能還原比賽場景的環境,甚至專門對RealSense相機的噪聲,比如雙目視差、散斑投射、紋理缺失等問題進行模擬。這種“仿真到真實”的閉環設計,讓他們的四足機器人成為首個全自主跑完全程定向越野的參賽選手。
![]()
行業正加快從標準場地可用走向真實場景可用,真實環境是機器人走出Demo、能在更多場景復制落地的必修課。
如果機器人能學會全自主垃圾分揀,解決了背后復雜視覺感知、多材質物體識別、穩定抓取上的長期難題,就有望在工廠、環衛、物流等“臟亂差”場景應用;如果機器人能自主完成定向越野,就能解決未來在園區巡檢、戶外勘探、災害救援等復雜地形場景中遇到的真實難題。
二、擺脫人類遙控,機器人大規模落地需要自主決策
現在,我們看到的許多炫酷的機器人能力展示,很多都是由人類操作員遙控操作,機器人更多扮演遠程操作平臺,而非具備真正決策能力的智能體。這種機制,在產業發展早期,確實能夠更快速驗證機器人能力、收集數據、積累經驗等。
但是,機器人的表現很大程度上來自人類的經驗判斷和臨場操作,是人腦在替機器人的大腦工作,容易掩蓋了機器人在感知、決策等的短板,難以真實反映其在無人干預下的表現。這是在判斷全自主機器人能否進入人類生活場景時,最容易被遙控表現美化的第二個能力——決策自主性。
一些頭部公司已經做出調整,以特斯拉Optimus為例,年中,其宣布放棄了傳統遙控操作學習的方式,之后,馬斯克10月發表對Optimus功夫視頻的評論:“是AI,不是遙控”,這都說明,無遙控已經成為具身企業未來發展的清晰共識。
全自主、無遙操是行業發展的重要趨勢所在,賽事通過評分規則,明確獎勵無遙操的參賽選手。但這也極具挑戰性,浙大Wongtsai團隊的隊長朱承睿形容,從人類遠程遙控操作到自主控制,大概是蒸汽機時代到電氣化時代的飛躍。
吊橋穿越任務中,機器人需要通過三種不同間距的橋面段,自主識別橋面結構,決定是否需要借助工具通過、是否拉繩搭橋等。有的選手給機器人裝上寬大的“腳底板”,避免穿越過程中被縫隙卡住;有的機器狗通過跳躍繞開縫隙,還省略了拉繩搭橋的步驟。
在劉云輝院士看來,這類任務的核心是決策與規劃,因為橋板位置不一樣,機器人要自己做思考、做決策,比如拿起板來填充,從而改變環境,適應自己的運動。這是包含了環境評估、工具使用、任務規劃的高級智能行為。
![]()

港中文CUMAE團隊談道,比賽中的不同任務對機器人的硬件和AI能力有不同要求,AI和機器人的發展應在一個大系統里相互配合、發揮優勢,而不是彼此單獨發展,這給了團隊在未來解決類似問題的一個思路。
目前,機器人在小腦的運動控制與運動性能進步飛快,但在大腦部分的AI能力還很基礎,不少業界人士都曾表示,AI能力不足也導致了機器人沒能真正大規模落地。
隨著行業向規模化落地邁進,全自主能力必然會成為機器人企業的核心競爭壁壘,也是機器人從“工具”邁向“伙伴”的核心標志。
三、不止單一能力,機器人需要穩定跑完一整條長程任務鏈
即使感知、決策能力都過關,機器人能否進入人類生活場景,還取決于第三個維度:能不能穩定執行具有一連串復雜動作的長程任務鏈,而不是只完成某一個精彩動作。
不少演示都是通過遙控來實現對機器人單一動作能力極限的展示,但是在倉儲揀選、園區巡檢、災害救援等真正應用場景中,機器人需要完成的是具有多個步驟的長程任務鏈。
家庭場景也是如此,疊衣服、澆花、洗碗、收納等也是長程任務,以家庭澆花這樣看似小事的精細任務為例:機器人需完成取水壺、接水、走到花盆前、控制澆水、再歸位的全流程,水壺重量和重心在過程中持續變化,這考驗的是從感知、規劃到力控、步態協同的一整套能力。
在ATEC的自主澆花任務中,這種系統性挑戰被直觀呈現:有的機器人在拿起水壺后頻頻搖晃、對不準澆花位置等,需要多次調試,人工多次干預;少數隊伍能完成全流程,但往往速度較慢。這些場景與現實中“機器人總是要人去救場”的情況非常相似。
“VLA模型有一定的泛化能力,但它只能理解圖像和語言指令,無法將這些指令與真正的物理交互相對應,在物理世界的理解和交互能力方面存在不足。”浙大Wongtsai團隊說。最終,團隊還是選擇了傳統的視覺識別+機械臂規劃的方案。
北理工CyberPrime團隊提到,自主澆花任務難以全自主完成的原因主要有兩方面:硬件上,傳統高精度機械臂重量大、速度慢,搭載在四足機器人平臺上不穩;軟件上,操作算法泛化能力有限,實驗室用少量道具訓練的策略,到了比賽現場完全不適用。在他們看來,機器人走入生活,硬件運動能力沒問題,主要瓶頸在于操作精度、安全性和自主性,這也是實驗室未來幾年主要攻破的方向。
這也揭示了具身智能正面臨的處境:各種模型、算法看上去很聰明,但一落到具體機器人的執行層面上就處處受限,軟硬件脫節;機器人下半身能夠順利移動,但是上半身操作環節卻格外吃力。更嚴格地說,即便能跑起來,在長時間、多輪次、多場景的任務鏈下,它們也很難保持一貫的穩定性和可維護性。
未來,真正落地的機器人產品,必須要面對長程任務鏈這道坎,重視系統可靠性、任務完整性實現移動與操作的統一。
結語:真實世界“翻車”很正常,是具身智能落地的必經之路
兩天的比賽看下來,任務挑戰大,全自主太難,機器人翻車情況確實存在。
不過,劉云輝院士覺得,翻車很正常,也是一個進步,至少把機器人拿到場景下測試了,失敗也是一個結果,但能夠給到反饋,讓開發者反思哪里做的不夠好、技術應該怎么改進。“我覺得你沒有失敗,其實就永遠不可能有成功的一天。”
![]()
針對戶外復雜場景,各參賽隊伍嘗試了多樣化的技術路徑與創新方案:有的團隊將傳統模塊化算法與前沿的端到端大模型方案并行測試,尋找穩定性與智能化的最佳平衡;有的為應對吊橋的動態晃動,設計出輕量化控制與實時環境建模相結合的獨特策略。這些充滿創造力的技術探索,為機器人場景落地積累了寶貴實踐經驗。
不少參賽選手在采訪中都提到,ATEC的比賽設置貼近現實場景,對技術發展來說具有更實際的意義。他們基本都懷抱著強烈的使命感,期待著機器人未來更多地去完成人類無法完成的工作,讓機器人去承擔人類危險的工作,這種真實世界極限挑戰就是通往那條路的起點。
具身智能要從風口上的故事變成基礎設施,需要一套能經得住時間考驗的測試場和評價體系。
幾年后回頭看,這場沒那么多“爽感”的基于真實場景的大賽,或許正是這套體系的早期雛形。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.