網易首頁 > 網易號 > 正文申請入駐

剛剛，高德ABot-Claw亦莊半馬封神！具身智能的Harness來了

2026-04-19 12:17:53　來源: 新智元

北京舉報

分享至

新智元報道

編輯：Aeneas 犀牛

【新智元導讀】一只四足機器狗，無需預設路線、無需人工遙控，在開放城市環境中自己認路、自己走、自己干活——這是高德「途途」正在上演的真實場景。背后的秘密，是一套終結「一機一圖」困局的具身智能Harness——ABot-Claw。

具身智能的破曉時刻來了！

就在剛剛，2026北京亦莊機器人半程馬拉松上，阿里巴巴旗下高德正式公開全球首款開放環境全自主具身機器人「高德途途」。

這款四足機器人成功協助視障人士完成復雜避障、人群穿行等實戰挑戰，突破了「實驗室」到「開放環境」之間的技術鴻溝。

我們早已習慣LLM在數字世界的無所不能，然而一旦觸及物理實體，以前的具身智能往往會碰壁。

比如，你對著一只機器狗說：帶我去最近的公園放松一下。

傳統機器人會大概率是一臉茫然——它不知道公園在哪，不知道怎么走，更不知道「放松」意味著什么。

就算你把路線告訴它，它也只能按圖索驥，遇到施工封路就徹底抓瞎。

這種「知識孤島」的工程瓶頸，正是具身智能通往通用AGI的最大絆腳石。

現在，高德正式發布了全球首個面向AGI的全棧具身技術體系ABot，以及智能導盲犬高德途途。

這不僅是一臺「能出門、會思考、能導盲」的四足機器人，更是一次對具身智能底層邏輯的重構。

跟傳統的機器狗不一樣，高德的四足機器人途途會先理解你的意圖——你累了、想透氣，接著查詢自己的「記憶庫」找到最近的公園坐標，然后把任務拆解成一系列子目標，最后一路導航到目的地。

如果中途遇到障礙，它會實時調整路線，甚至在你沒察覺的情況下繞開一群正在遛彎的大爺大媽。

比如，它甚至可以直接出門到咖啡店里給你取一杯咖啡。

特別是作為體系中樞的ABot-Claw，它的出現，意味著具身智能終于迎來了屬于自己的「Harness」（智能駕馭中樞）。

高德，正在用自己的空間智能沉淀，開啟具身智能通向AGI的大門。

傳統具身智能的致命傷

一機一圖、知識孤島、單體脆弱

長期以來，具身智能領域有一個幾乎無解的工程困境，業內稱之為「一機一圖」。

什么意思？

每臺機器人部署到新環境時，必須從零開始：獨立建圖、獨立冷啟動、獨立訓練。

今天這臺機器人在A辦公室學會了怎么找會議室，明天換一臺新機器人到B辦公室，一切就得從頭再來，經驗無法沉淀，知識無法復用。

這就像一家公司每招一個新員工，都得從幼兒園開始教——認字、學加減法、了解公司業務，從零培養到能上手，然后他一離職，下一個人再來一遍。

這就是當前機器人行業的普遍現狀。

更致命的是，單體機器人極度脆弱。它們只能圍繞眼前的世界建模，眼睛看不到的地方就是未知黑洞。

電梯門關了，它不知道樓上是什么；前方轉角有人走過來，它無法預判。

沒有記憶、沒有協同、沒有容錯——這就是為什么大部分機器人只能在封閉場景里做做搬運工作，一旦走出實驗室，立刻變成不會走路的「科技盲人」。

答案來了：從「單體能力展示」到「系統級解法」

高德途途的出現，打破了這一僵局！

作為一個「開了天眼」的四足機器人，它在開放環境下無需預設路線，無需人工遙控，就能自己認路、自己走。哪怕是超視距外的路況變化，它也能提前預判。

之所以能支撐這種通用能力，真正的秘密在于，它換了一套底層操作系統——ABot-Claw。

如果把機器人比作一匹馬，過去的做法是不斷給馬喂更好的飼料、做更多的訓練，希望它跑得更快更遠。

而Harness的思路是：給馬裝上韁繩和馬鞍，讓騎手能真正駕馭它。

ABot-Claw處于ABot技術體系的Agent層，承上啟下：向下接收ABot-M0（操作模型）和ABot-N0（導航模型）的能力輸出，向上統一調度四足、輪式、人形等不同形態的機器人本體。

它不是又一個基座模型，而是讓基座模型能力真正落地的「中樞神經系統」，從此，機器人從「被動執行器」升級為「主動調度者」。

它不再是一個只會聽命令的工具，而是一個能理解意圖、規劃路徑、執行任務、自我糾錯的智能體。

從此，具身智能從「單體試錯」時代，正式邁入「體系智能」階段。

值得一提的是，ABot體系的Model層也交出了亮眼成績單。

ABot-M0操作基座模型在Libero、Libero-Plus、RoboCasa、RoboTwin 2.0等四大權威基準測試中全面刷新世界紀錄，Libero-Plus基準上任務成功率高達80.5%，較業界標桿Pi0提升近30%。

ABot-N0導航基座模型更是全球首次用單一模型統一五大核心導航任務，在CityWalker、SocNav、R2R-CE、RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench等7項國際評測中全部達到SOTA，斷層式領先行業。

而這一切能力的落地，都需要通過Claw這個「中樞神經」來駕馭。

Claw如何重構具身底座

如果說模型是大腦，那么ABot-Claw就是連接大腦與四肢、并賦予其長期記憶的中樞神經。

它通過三大核心技術支柱，徹底終結了機器人的「失憶癥」。

通過Map as Memory、集中式動態調度、分層容錯機制，它從數據流與控制流底層，徹底終結了「一機一圖」的歷史。

Map as Memory，讓地圖成為世界記憶

跨機器人本體空間記憶系統（Cross-Embodiment Spatial Memory）以全局空間坐標系為統一參考框架，構建支持多模態感知數據（視覺關鍵幀、物體6D位姿、語義坐標、行為軌跡）持久化存儲于聯合索引的分布式記憶架構。

該系統支持：

多粒度空間語義建模：通過分層拓撲結構（區域層、路網層、功能層、對象層）實現從宏觀導航到微觀操作的語義-幾何對齊；
混合檢索機制（Hybrid Retrival）：融合幾何約束（如空間半徑查詢）與語義相似度（如CLIP嵌入匹配），支持開放詞匯條件下的跨模態召回；
上下文零遷移繼承：新接入機器人可通過訂閱全局空間語義圖譜，直接復用歷史觀測與任務上下文，實現跨設備、跨任務周期的持續認知一致性。

這是高德最有野心的一個創新，也是整個Claw體系的靈魂。

傳統機器人的「記憶」，大多是傳感器采集的局部數據、執行過的任務日志。這些信息高度碎片化，無法跨設備共享，更無法形成持久化的認知基礎。

高德的做法是：把地圖升維成智能體的持久化記憶載體。

想想看，人類是怎么「記住」世界的？我們對長期生活的地方有空間記憶，知道家里廚房在哪、公司電梯怎么走；我們對打交道的人有關系記憶，了解同事的習慣和喜好。

這些記憶讓我們能在復雜環境中游刃有余，而不是每次出門都像第一次來到這個世界。

ABot-Claw的Map as Memory做的就是這件事——以全局空間坐標為統一錨點，建立持久化空間語義地圖，讓機器人擁有真正的「世界記憶」。

具體怎么實現？

Claw構建了一套四層視覺空間記憶架構：

BlockLayer（區域層）：定義室內房間和室外街區，支持跨區域的粗粒度定位與長程任務分解。
Road Layer（路網層）：刻畫物理連通性——交叉口、門洞、通道，提供路徑規劃的硬約束。
Function Layer（功能層）：標注關鍵語義節點——休息區、廚房、電梯廳，將抽象語言意圖轉化為可導航的功能目標。
Object/POILayer（對象層）：定位具體實體——特定商鋪、特定物品位置，作為「最后一米」導航的精確視覺-語義錨點。

有了這套分層拓撲記憶，機器人從「家門口出發」到「穿越城市街區」到「進入購物中心」到「找到特定餐廳的空位」，全程由統一的空間記憶框架支撐，無需在不同系統間切換。

更重要的是，這個記憶是可共享的。

通過以全局空間坐標為錨點的共享空間語義地圖，新設備只要連接網絡，就能通過讀取全局Context實現知識的「零成本繼承」。

一臺機器人走過的路、認出的物體，另一臺新機器人瞬間就能知道。

今天A機器人發現「三樓會議室門口有飲水機」，明天B機器人到同一棟樓執行任務，直接就知道渴了去哪喝水。

這就是終結「一機一圖」的核心——知識不再綁定在單一設備上，而是沉淀在共享的世界記憶中，可繼承、可累積、可進化。

這套記憶系統還有一個精妙之處：它是動態可維護的。

每一次任務執行的結果——無論成功還是失敗——都會作為新的觀測證據回寫到拓撲圖中。

臨時道路封閉、新開的店鋪、調整后的室內布局，都能通過持續的「維護-反饋」機制動態更新。

高德每天處理的海量導航數據——來自衛星、街景車、眾包探針——也會實時注入這套記憶系統。

這意味著機器人不僅能記住「靜態的世界」，還能感知「變化的世界」。

保障長程任務的連續性

有了共享記憶還不夠。

機器人執行真實任務時，會遇到各種意外：電池快沒了、傳感器故障了、前面的路被堵了。傳統的單體架構下，一個環節出問題，整個任務就崩盤。

ABot-Claw的解法是集中式調度與云邊協同。

首先，Claw首創了「一個運行時、多智能體共生」的具身智能范式。

統一的技能抽象打破了異構機器人之間的邊界，機械臂、人形、四足，不管什么形態，都可以在同一個框架下協同作業。

任務上下文能無縫移交——如果一臺四足機器人電量不足，另一臺可以接手繼續執行，不需要重新理解任務、重新規劃路徑。

比如，這兩臺機器人協作給沙拉撒上胡椒粉。

其次，Claw采用「云端大腦-邊緣響應」的兩級架構。

云端負責高層任務分解與規劃（L3/L4 Planning），邊緣側實現本地高頻實時控制（L1/L2 Control），確保物理安全與響應速度。

這就像人的大腦和脊髓反射的分工——你不需要每次眨眼都動用大腦皮層做決策，本能反應由脊髓搞定。

機器人遇到突發障礙時，不需要等云端響應，邊緣側直接避障，毫秒級響應。

這種架構的好處是：即便網絡斷了，邊緣側仍能保證基本功能運轉；云端重連后，立刻同步狀態，無縫續上。

閉環反思：讓機器人「自我糾錯」的靈魂

但最讓人驚艷的，還是Claw的反思與糾錯。

傳統機器人執行任務是線性的：接收指令→執行動作→匯報結果。如果中間出了問題，要么卡死，要么報錯，等人工干預。

這就像一個只會背劇本的演員，一旦觀眾不按套路鼓掌，他就不知道怎么演了。

面對充滿不確定性的真實世界，高德首創了Closed-loop Reflection&Self-Correction（閉環反思與自我糾錯）機制，這就賦予了系統「嘗試-判斷-調整」的類人循環能力。

每個子任務完成后，系統的Self-Reflector模塊會對執行結果進行評估。

如果成功，繼續下一步；如果失敗，反思器生成結構化的失敗診斷反饋，觸發規劃器重新規劃。

舉個真實場景：用戶說「我渴了」，機器人理解意圖后，規劃去最近的零食貨架找飲料，但到了貨架一看發現沒貨，傳統機器人可能就傻眼了，宣告任務失敗。

但Claw支持下的途途會怎么做？

Self-Reflector確認「零食貨架無可樂庫存」后，會生成反饋：「目標位置無目標物體，建議嘗試自動售貨機。」

規劃器接收反饋，重新規劃路徑，機器人轉向自動售貨機，最終在售貨機前精準鎖定一瓶可樂，任務圓滿完成。

這種類人的「嘗試-判斷-調整」循環，是處理真實世界長尾分布（Edge Cases）的關鍵，也是它比傳統機器人更「聰明」的原因。

現在，機器人就可以輕松完成訪客接待這種長程任務了。

讓機器人融入人類社會

還有一個容易被忽視但極其重要的點：社會規范。

機器人要在人類社會中活動，不能只顧著完成任務。

電梯里人多，它要知道讓一讓；人行道上有老人，它要知道繞道走；進了咖啡店，它不能橫沖直撞嚇到顧客。

ABot-Claw引入強化學習相關技術，通過多智能體相對評估，讓機器人自主學習電梯避讓、行人禮讓等社會規范。

高德還發布了SocialNav社會化導航基座模型，專門訓練機器人在人群密集環境中的社交導航能力——這項成果以6/6/5幾乎滿分的成績入選CVPR 2026 Oral，斷層式領先全行業。

機器人不僅要「能干活」，還要「會做人」——這是具身智能從實驗室走向真實社會的必經之路。

Harness鋪就AGI標準航線

說完技術細節，讓我們跳出來看看更大的圖景。

ABot-Claw不僅僅是一個讓機器人更好用的系統——它實際上定義了具身智能走向通用人工智能（AGI）的底層架構形態。

通用性躍遷：終結定制化部署依賴

過去，每一類機器人應用場景都需要定制化部署。

家庭服務機器人一套系統，物流配送機器人一套系統，城市巡檢機器人又是一套系統。

開發成本高、迭代周期長、經驗無法復用。

ABot-Claw改變了這一切。

通過統一的技能抽象和共享的空間記憶，Claw讓ABot-M0（操作模型）和ABot-N0（導航模型）的能力得以跨場景、跨形態復用。

同一個「大腦」，可以驅動四足機器人在戶外巡檢，也可以驅動機械臂在倉庫分揀，還可以驅動輪式機器人在商場導購。

這意味著機器人廠商不再需要為每個場景從零開發，而是可以基于Claw提供的「即插即用」智能基座快速適配；意味著一個場景積累的經驗可以遷移到其他場景，形成正向飛輪。

高德官方稱之為「通用大腦+專用軀體」的產業標準形態。

大腦是通用的，可以不斷升級迭代；軀體是專用的，適配不同場景需求。兩者解耦，各自演進，就能讓效率最大化。

從「單體工具」到「通用智能體」，Harness達成AGI標準航線

ABot體系的強大，在于其內部形成了一個閉環的「飛輪效應」。

ABot體系的三層架構——DATA層（ABot-World世界模型）、MODEL層（ABot-M0/N0基座模型）、AGENT層（ABot-Claw智能體系統），直接形成閉環。

ABot-World生產海量高質量訓練數據，覆蓋室內居家、商業空間、城市街道、工業場景等多樣化真實三維環境。
ABot-M0/N0基于這些數據訓練，獲得強大的操作與導航能力。ABot-M0在Libero-Plus基準上任務成功率達80.5%，較業界標桿Pi0提升近30%；ABot-N0在7大權威評測中全部達到SOTA。
ABot-Claw將模型能力轉化為真實任務執行能力，途途在開放環境中持續運行。
真實運行中積累的數據——成功案例、失敗案例、邊緣情況——回流到World和記憶庫中，指導下一輪數據生成和模型訓練。

這樣循環往復下去，能力就會螺旋上升。

這就是為什么高德有底氣說，途途不只是一個產品發布，而是一個體系的起點。

它今天能買咖啡、送快遞、導盲帶路，明天可能就能做更復雜的事情——因為它每天都在真實世界中學習，每天都在變強。

AMAP-AI Inside：開源生態降低重復造輪子成本

并且，高德的目標不僅僅是做一臺名為「途途」的機器狗，而是成為物理世界智能化的智能基座提供者。

2026年3月31日，高德宣布全量開源ABot-M0，涵蓋數據、算法與模型三大維度。

目前規模最大的通用機器人數據集UniACT——整合超過600萬條真實操作軌跡、9500多小時訓練數據、覆蓋20多種機器人形態——對外開放；動作流形學習（AML）算法、雙流感知架構等核心技術也一并開源。

不僅如此，近期高德團隊還開源了ABot-PhysWorld，作為world Arena的比賽基線。

顯然，就像AWS之于云計算，Android之于移動互聯網，高德希望ABot體系成為具身智能時代的水電煤。

開源的好處是顯而易見的：降低行業重復造輪子的成本，吸引開發者在同一套「Harness語言」上共建。

當越來越多的機器人運行在同一套體系之上，共享的世界記憶就會越來越豐富，每一臺新機器人都能從群體智慧中受益。

具身智能的范式躍遷

過去兩年，具身智能賽道上演了一場瘋狂的「模型軍備競賽」。

但熱鬧背后，一個尷尬的事實浮出水面：實驗室里跑得飛起的模型，到了真實環境就頻頻拉胯。

問題出在哪？不是模型不夠強，而是從「模型能力」到「任務完成」之間，缺了一層關鍵的系統架構。

就像你有一顆法拉利的發動機，卻裝在一輛自行車車架上——動力再猛也跑不起來。

ABot-Claw的出現，標志著行業思路的根本轉向：從「卷模型」走向「卷應用」。

它解決一個更本質的問題——如何讓機器人真正成為「社會人」？

能記住去過的地方，能理解模糊的指令，能在失敗后自我調整，能與同伴協同配合，能融入人類的社會規范。

這些能力，單靠堆參數是堆不出來的。

高德在這場范式轉換中占據了獨特位置。

長期積累的空間智能數據，讓它擁有全球最豐富的空間語義資產；日均數億次的導航請求，讓它深諳「從A到B」的全部復雜性。

當其他玩家還在從零構建空間理解能力時，高德已經把這些能力內化為機器人的「先天記憶」。

更聰明的是開源策略。

ABot-體系在近期宣布全面開源，高德顯然明白，具身智能需要的是整個個行業共同努力，而高德要做的是最關鍵的體系搭建。

當越來越多的機器人運行在同一套體系之上，高德的世界記憶就會越滾越大，競爭壁壘也就越筑越高。

獨居老人的智能陪護、視障人士的導盲伙伴、風雨無阻的末端配送、安全可靠的工廠協作——這些場景不再是PPT里的愿景，而是正在落地的現實。

當機器人不再是孤立的工具，而是共享記憶、協同進化的智能網絡節點時，「幫我去隔壁買杯半糖拿鐵」的未來，真的不遠了。

而這一步，就從途途邁出的第一步開始。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.