![]()
新智元報道
編輯:Aeneas 犀牛
【新智元導讀】一只四足機器狗,無需預設路線、無需人工遙控,在開放城市環境中自己認路、自己走、自己干活——這是高德「途途」正在上演的真實場景。背后的秘密,是一套終結「一機一圖」困局的具身智能Harness——ABot-Claw。
具身智能的破曉時刻來了!
就在剛剛,2026北京亦莊機器人半程馬拉松上,阿里巴巴旗下高德正式公開全球首款開放環境全自主具身機器人「高德途途」。
![]()
這款四足機器人成功協助視障人士完成復雜避障、人群穿行等實戰挑戰,突破了「實驗室」到「開放環境」之間的技術鴻溝。
我們早已習慣LLM在數字世界的無所不能,然而一旦觸及物理實體,以前的具身智能往往會碰壁。
比如,你對著一只機器狗說:帶我去最近的公園放松一下。
傳統機器人會大概率是一臉茫然——它不知道公園在哪,不知道怎么走,更不知道「放松」意味著什么。
就算你把路線告訴它,它也只能按圖索驥,遇到施工封路就徹底抓瞎。
這種「知識孤島」的工程瓶頸,正是具身智能通往通用AGI的最大絆腳石。
現在,高德正式發布了全球首個面向AGI的全棧具身技術體系ABot,以及智能導盲犬高德途途。
這不僅是一臺「能出門、會思考、能導盲」的四足機器人,更是一次對具身智能底層邏輯的重構。
跟傳統的機器狗不一樣,高德的四足機器人途途會先理解你的意圖——你累了、想透氣,接著查詢自己的「記憶庫」找到最近的公園坐標,然后把任務拆解成一系列子目標,最后一路導航到目的地。
如果中途遇到障礙,它會實時調整路線,甚至在你沒察覺的情況下繞開一群正在遛彎的大爺大媽。
比如,它甚至可以直接出門到咖啡店里給你取一杯咖啡。
特別是作為體系中樞的ABot-Claw,它的出現,意味著具身智能終于迎來了屬于自己的「Harness」(智能駕馭中樞)。
![]()
高德,正在用自己的空間智能沉淀,開啟具身智能通向AGI的大門。
傳統具身智能的致命傷
一機一圖、知識孤島、單體脆弱
長期以來,具身智能領域有一個幾乎無解的工程困境,業內稱之為「一機一圖」。
什么意思?
每臺機器人部署到新環境時,必須從零開始:獨立建圖、獨立冷啟動、獨立訓練。
今天這臺機器人在A辦公室學會了怎么找會議室,明天換一臺新機器人到B辦公室,一切就得從頭再來,經驗無法沉淀,知識無法復用。
這就像一家公司每招一個新員工,都得從幼兒園開始教——認字、學加減法、了解公司業務,從零培養到能上手,然后他一離職,下一個人再來一遍。
這就是當前機器人行業的普遍現狀。
更致命的是,單體機器人極度脆弱。它們只能圍繞眼前的世界建模,眼睛看不到的地方就是未知黑洞。
電梯門關了,它不知道樓上是什么;前方轉角有人走過來,它無法預判。
沒有記憶、沒有協同、沒有容錯——這就是為什么大部分機器人只能在封閉場景里做做搬運工作,一旦走出實驗室,立刻變成不會走路的「科技盲人」。
答案來了:從「單體能力展示」到「系統級解法」
高德途途的出現,打破了這一僵局!
作為一個「開了天眼」的四足機器人,它在開放環境下無需預設路線,無需人工遙控,就能自己認路、自己走。 哪怕是超視距外的路況變化,它也能提前預判。
之所以能支撐這種通用能力,真正的秘密在于,它換了一套底層操作系統——ABot-Claw。
如果把機器人比作一匹馬,過去的做法是不斷給馬喂更好的飼料、做更多的訓練,希望它跑得更快更遠。
而Harness的思路是:給馬裝上韁繩和馬鞍,讓騎手能真正駕馭它。
ABot-Claw處于ABot技術體系的Agent層,承上啟下:向下接收ABot-M0(操作模型)和ABot-N0(導航模型)的能力輸出,向上統一調度四足、輪式、人形等不同形態的機器人本體。
![]()
它不是又一個基座模型,而是讓基座模型能力真正落地的「中樞神經系統」,從此,機器人從「被動執行器」升級為「主動調度者」。
它不再是一個只會聽命令的工具,而是一個能理解意圖、規劃路徑、執行任務、自我糾錯的智能體。
從此,具身智能從「單體試錯」時代,正式邁入「體系智能」階段。
值得一提的是,ABot體系的Model層也交出了亮眼成績單。
ABot-M0操作基座模型在Libero、Libero-Plus、RoboCasa、RoboTwin 2.0等四大權威基準測試中全面刷新世界紀錄,Libero-Plus基準上任務成功率高達80.5%,較業界標桿Pi0提升近30%。
![]()
ABot-N0導航基座模型更是全球首次用單一模型統一五大核心導航任務,在CityWalker、SocNav、R2R-CE、RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench等7項國際評測中全部達到SOTA,斷層式領先行業。
![]()
而這一切能力的落地,都需要通過Claw這個「中樞神經」來駕馭。
Claw如何重構具身底座
如果說模型是大腦,那么ABot-Claw就是連接大腦與四肢、并賦予其長期記憶的中樞神經。
![]()
它通過三大核心技術支柱,徹底終結了機器人的「失憶癥」。
通過Map as Memory、集中式動態調度、分層容錯機制,它從數據流與控制流底層,徹底終結了「一機一圖」的歷史。
Map as Memory,讓地圖成為世界記憶
跨機器人本體空間記憶系統(Cross-Embodiment Spatial Memory)以全局空間坐標系為統一參考框架,構建支持多模態感知數據(視覺關鍵幀、物體6D位姿、語義坐標、行為軌跡)持久化存儲于聯合索引的分布式記憶架構。
該系統支持:
多粒度空間語義建模:通過分層拓撲結構(區域層、路網層、功能層、對象層)實現從宏觀導航到微觀操作的語義-幾何對齊;
混合檢索機制(Hybrid Retrival):融合幾何約束(如空間半徑查詢)與語義相似度(如CLIP嵌入匹配),支持開放詞匯條件下的跨模態召回;
上下文零遷移繼承:新接入機器人可通過訂閱全局空間語義圖譜,直接復用歷史觀測與任務上下文,實現跨設備、跨任務周期的持續認知一致性。
這是高德最有野心的一個創新,也是整個Claw體系的靈魂。
傳統機器人的「記憶」,大多是傳感器采集的局部數據、執行過的任務日志。這些信息高度碎片化,無法跨設備共享,更無法形成持久化的認知基礎。
高德的做法是:把地圖升維成智能體的持久化記憶載體。
想想看,人類是怎么「記住」世界的?我們對長期生活的地方有空間記憶,知道家里廚房在哪、公司電梯怎么走;我們對打交道的人有關系記憶,了解同事的習慣和喜好。
這些記憶讓我們能在復雜環境中游刃有余,而不是每次出門都像第一次來到這個世界。
ABot-Claw的Map as Memory做的就是這件事——以全局空間坐標為統一錨點,建立持久化空間語義地圖,讓機器人擁有真正的「世界記憶」。
具體怎么實現?
Claw構建了一套四層視覺空間記憶架構:
BlockLayer(區域層):定義室內房間和室外街區,支持跨區域的粗粒度定位與長程任務分解。
Road Layer(路網層):刻畫物理連通性——交叉口、門洞、通道,提供路徑規劃的硬約束。
Function Layer(功能層):標注關鍵語義節點——休息區、廚房、電梯廳,將抽象語言意圖轉化為可導航的功能目標。
Object/POILayer(對象層):定位具體實體——特定商鋪、特定物品位置,作為「最后一米」導航的精確視覺-語義錨點。
有了這套分層拓撲記憶,機器人從「家門口出發」到「穿越城市街區」到「進入購物中心」到「找到特定餐廳的空位」,全程由統一的空間記憶框架支撐,無需在不同系統間切換。
![]()
更重要的是,這個記憶是可共享的。
通過以全局空間坐標為錨點的共享空間語義地圖,新設備只要連接網絡,就能通過讀取全局Context實現知識的「零成本繼承」。
一臺機器人走過的路、認出的物體,另一臺新機器人瞬間就能知道。
今天A機器人發現「三樓會議室門口有飲水機」,明天B機器人到同一棟樓執行任務,直接就知道渴了去哪喝水。
這就是終結「一機一圖」的核心——知識不再綁定在單一設備上,而是沉淀在共享的世界記憶中,可繼承、可累積、可進化。
這套記憶系統還有一個精妙之處:它是動態可維護的。
每一次任務執行的結果——無論成功還是失敗——都會作為新的觀測證據回寫到拓撲圖中。
臨時道路封閉、新開的店鋪、調整后的室內布局,都能通過持續的「維護-反饋」機制動態更新。
高德每天處理的海量導航數據——來自衛星、街景車、眾包探針——也會實時注入這套記憶系統。
這意味著機器人不僅能記住「靜態的世界」,還能感知「變化的世界」。
保障長程任務的連續性
有了共享記憶還不夠。
機器人執行真實任務時,會遇到各種意外:電池快沒了、傳感器故障了、前面的路被堵了。傳統的單體架構下,一個環節出問題,整個任務就崩盤。
ABot-Claw的解法是集中式調度與云邊協同。
首先,Claw首創了「一個運行時、多智能體共生」的具身智能范式。
統一的技能抽象打破了異構機器人之間的邊界,機械臂、人形、四足,不管什么形態,都可以在同一個框架下協同作業。
任務上下文能無縫移交——如果一臺四足機器人電量不足,另一臺可以接手繼續執行,不需要重新理解任務、重新規劃路徑。
比如,這兩臺機器人協作給沙拉撒上胡椒粉。
其次,Claw采用「云端大腦-邊緣響應」的兩級架構。
云端負責高層任務分解與規劃(L3/L4 Planning),邊緣側實現本地高頻實時控制(L1/L2 Control),確保物理安全與響應速度。
這就像人的大腦和脊髓反射的分工——你不需要每次眨眼都動用大腦皮層做決策,本能反應由脊髓搞定。
機器人遇到突發障礙時,不需要等云端響應,邊緣側直接避障,毫秒級響應。
這種架構的好處是:即便網絡斷了,邊緣側仍能保證基本功能運轉;云端重連后,立刻同步狀態,無縫續上。
閉環反思:讓機器人「自我糾錯」的靈魂
但最讓人驚艷的,還是Claw的反思與糾錯。
傳統機器人執行任務是線性的:接收指令→執行動作→匯報結果。如果中間出了問題,要么卡死,要么報錯,等人工干預。
這就像一個只會背劇本的演員,一旦觀眾不按套路鼓掌,他就不知道怎么演了。
面對充滿不確定性的真實世界,高德首創了Closed-loop Reflection&Self-Correction(閉環反思與自我糾錯)機制,這就賦予了系統「嘗試-判斷-調整」的類人循環能力。
每個子任務完成后,系統的Self-Reflector模塊會對執行結果進行評估。
如果成功,繼續下一步;如果失敗,反思器生成結構化的失敗診斷反饋,觸發規劃器重新規劃。
舉個真實場景:用戶說「我渴了」,機器人理解意圖后,規劃去最近的零食貨架找飲料,但到了貨架一看發現沒貨,傳統機器人可能就傻眼了,宣告任務失敗。
但Claw支持下的途途會怎么做?
Self-Reflector確認「零食貨架無可樂庫存」后,會生成反饋:「目標位置無目標物體,建議嘗試自動售貨機。」
規劃器接收反饋,重新規劃路徑,機器人轉向自動售貨機,最終在售貨機前精準鎖定一瓶可樂,任務圓滿完成。
這種類人的「嘗試-判斷-調整」循環,是處理真實世界長尾分布(Edge Cases)的關鍵,也是它比傳統機器人更「聰明」的原因。
現在,機器人就可以輕松完成訪客接待這種長程任務了。
讓機器人融入人類社會
還有一個容易被忽視但極其重要的點:社會規范。
機器人要在人類社會中活動,不能只顧著完成任務。
電梯里人多,它要知道讓一讓;人行道上有老人,它要知道繞道走;進了咖啡店,它不能橫沖直撞嚇到顧客。
ABot-Claw引入強化學習相關技術,通過多智能體相對評估,讓機器人自主學習電梯避讓、行人禮讓等社會規范。
高德還發布了SocialNav社會化導航基座模型,專門訓練機器人在人群密集環境中的社交導航能力——這項成果以6/6/5幾乎滿分的成績入選CVPR 2026 Oral,斷層式領先全行業。
![]()
機器人不僅要「能干活」,還要「會做人」——這是具身智能從實驗室走向真實社會的必經之路。
Harness鋪就AGI標準航線
說完技術細節,讓我們跳出來看看更大的圖景。
ABot-Claw不僅僅是一個讓機器人更好用的系統——它實際上定義了具身智能走向通用人工智能(AGI)的底層架構形態。
通用性躍遷:終結定制化部署依賴
過去,每一類機器人應用場景都需要定制化部署。
家庭服務機器人一套系統,物流配送機器人一套系統,城市巡檢機器人又是一套系統。
開發成本高、迭代周期長、經驗無法復用。
ABot-Claw改變了這一切。
通過統一的技能抽象和共享的空間記憶,Claw讓ABot-M0(操作模型)和ABot-N0(導航模型)的能力得以跨場景、跨形態復用。
同一個「大腦」,可以驅動四足機器人在戶外巡檢,也可以驅動機械臂在倉庫分揀,還可以驅動輪式機器人在商場導購。
這意味著機器人廠商不再需要為每個場景從零開發,而是可以基于Claw提供的「即插即用」智能基座快速適配;意味著一個場景積累的經驗可以遷移到其他場景,形成正向飛輪。
高德官方稱之為「通用大腦+專用軀體」的產業標準形態。
大腦是通用的,可以不斷升級迭代;軀體是專用的,適配不同場景需求。兩者解耦,各自演進,就能讓效率最大化。
從「單體工具」到「通用智能體」,Harness達成AGI標準航線
ABot體系的強大,在于其內部形成了一個閉環的「飛輪效應」。
![]()
ABot體系的三層架構——DATA層(ABot-World世界模型)、MODEL層(ABot-M0/N0基座模型)、AGENT層(ABot-Claw智能體系統),直接形成閉環。
ABot-World生產海量高質量訓練數據,覆蓋室內居家、商業空間、城市街道、工業場景等多樣化真實三維環境。
ABot-M0/N0基于這些數據訓練,獲得強大的操作與導航能力。ABot-M0在Libero-Plus基準上任務成功率達80.5%,較業界標桿Pi0提升近30%;ABot-N0在7大權威評測中全部達到SOTA。
ABot-Claw將模型能力轉化為真實任務執行能力,途途在開放環境中持續運行。
真實運行中積累的數據——成功案例、失敗案例、邊緣情況——回流到World和記憶庫中,指導下一輪數據生成和模型訓練。
這樣循環往復下去,能力就會螺旋上升。
這就是為什么高德有底氣說,途途不只是一個產品發布,而是一個體系的起點。
它今天能買咖啡、送快遞、導盲帶路,明天可能就能做更復雜的事情——因為它每天都在真實世界中學習,每天都在變強。
AMAP-AI Inside:開源生態降低重復造輪子成本
并且,高德的目標不僅僅是做一臺名為「途途」的機器狗,而是成為物理世界智能化的智能基座提供者。
2026年3月31日,高德宣布全量開源ABot-M0,涵蓋數據、算法與模型三大維度。
目前規模最大的通用機器人數據集UniACT——整合超過600萬條真實操作軌跡、9500多小時訓練數據、覆蓋20多種機器人形態——對外開放;動作流形學習(AML)算法、雙流感知架構等核心技術也一并開源。
不僅如此,近期高德團隊還開源了ABot-PhysWorld,作為world Arena的比賽基線。
![]()
顯然,就像AWS之于云計算,Android之于移動互聯網,高德希望ABot體系成為具身智能時代的水電煤。
開源的好處是顯而易見的:降低行業重復造輪子的成本,吸引開發者在同一套「Harness語言」上共建。
當越來越多的機器人運行在同一套體系之上,共享的世界記憶就會越來越豐富,每一臺新機器人都能從群體智慧中受益。
具身智能的范式躍遷
過去兩年,具身智能賽道上演了一場瘋狂的「模型軍備競賽」。
但熱鬧背后,一個尷尬的事實浮出水面:實驗室里跑得飛起的模型,到了真實環境就頻頻拉胯。
問題出在哪?不是模型不夠強,而是從「模型能力」到「任務完成」之間,缺了一層關鍵的系統架構。
就像你有一顆法拉利的發動機,卻裝在一輛自行車車架上——動力再猛也跑不起來。
ABot-Claw的出現,標志著行業思路的根本轉向:從「卷模型」走向「卷應用」。
它解決一個更本質的問題——如何讓機器人真正成為「社會人」?
能記住去過的地方,能理解模糊的指令,能在失敗后自我調整,能與同伴協同配合,能融入人類的社會規范。
這些能力,單靠堆參數是堆不出來的。
高德在這場范式轉換中占據了獨特位置。
長期積累的空間智能數據,讓它擁有全球最豐富的空間語義資產;日均數億次的導航請求,讓它深諳「從A到B」的全部復雜性。
當其他玩家還在從零構建空間理解能力時,高德已經把這些能力內化為機器人的「先天記憶」。
更聰明的是開源策略。
ABot-體系在近期宣布全面開源,高德顯然明白,具身智能需要的是整個個行業共同努力,而高德要做的是最關鍵的體系搭建。
當越來越多的機器人運行在同一套體系之上,高德的世界記憶就會越滾越大,競爭壁壘也就越筑越高。
獨居老人的智能陪護、視障人士的導盲伙伴、風雨無阻的末端配送、安全可靠的工廠協作——這些場景不再是PPT里的愿景,而是正在落地的現實。
當機器人不再是孤立的工具,而是共享記憶、協同進化的智能網絡節點時,「幫我去隔壁買杯半糖拿鐵」的未來,真的不遠了。
而這一步,就從途途邁出的第一步開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.