網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

具身智能的GPT時(shí)刻？高德連發(fā)兩個(gè)全面SOTA的ABot具身基座模型

2026-02-12 19:05:19　來(lái)源: 機(jī)器之心Pro

河北舉報(bào)

分享至

機(jī)器之心編輯部

過(guò)去幾年，大模型把自然語(yǔ)言處理徹底重塑了。GPT 出來(lái)之前，NLP 領(lǐng)域的狀態(tài)是：每個(gè)任務(wù)一套模型，每個(gè)場(chǎng)景一批數(shù)據(jù)，每個(gè)公司一條流水線，互不通用，邊界清晰。GPT 之后，這套邏輯被一個(gè)預(yù)訓(xùn)練底座 + 任務(wù)微調(diào)的范式整個(gè)替換掉了。

機(jī)器人行業(yè)今天的處境，像極了 2019 年的 NLP。

不同廠商的不同形態(tài)機(jī)器人，用著各自獨(dú)立的動(dòng)作表示體系，數(shù)據(jù)互不兼容，模型無(wú)法復(fù)用。做一個(gè)新場(chǎng)景，基本上要從頭搭一套…… 當(dāng)模型與數(shù)據(jù)被深度綁定在特定形態(tài)和特定場(chǎng)景中，機(jī)器人所展現(xiàn)出的能力往往更像是一種精心調(diào)校的表演，而不是可以遷移、可以泛化的通用技能。

一個(gè)只能在特定場(chǎng)景跳舞的機(jī)器人，和一個(gè)可以在真實(shí)生活幫你占座的機(jī)器人，你會(huì)選哪個(gè)？

近日，阿里巴巴集團(tuán)旗下高德的 ABot 系列具身基座模型的發(fā)布，終于讓行業(yè)看到了機(jī)器人進(jìn)入開(kāi)放世界的可能。

ABot 系列包括兩款基座模型：ABot-M0、ABot-N0前者負(fù)責(zé)機(jī)器人的「手」（操作），后者負(fù)責(zé)機(jī)器人的「腿」（導(dǎo)航）

這兩款模型各自在其領(lǐng)域補(bǔ)齊了行業(yè)能力缺口，ABot-M0 讓不同形態(tài)的機(jī)器人都能基于統(tǒng)一底座完成精細(xì)操作，ABot-N0 則讓機(jī)器人首次具備在真實(shí)開(kāi)放環(huán)境中執(zhí)行長(zhǎng)程復(fù)雜任務(wù)的能力。它們?cè)诰呱聿僮骱途呱韺?dǎo)航做到全面 SOTA，霸榜了 10 項(xiàng)全球權(quán)威評(píng)測(cè)

但更重要的不是這些數(shù)字，而是具身智能首次在操作和導(dǎo)航兩條核心鏈路，分別擁有了統(tǒng)一底座。開(kāi)發(fā)者不需要再為每個(gè)機(jī)器人、場(chǎng)景重做一套系統(tǒng)，而是基于這兩個(gè)底座去做進(jìn)一步研究。

如果說(shuō) GPT 的出現(xiàn)讓 NLP 從任務(wù)專用模型轉(zhuǎn)向通用基座，那么 ABot 系列的發(fā)布，標(biāo)志著具身智能正在經(jīng)歷同樣的范式躍遷，從為每個(gè)機(jī)器人、每個(gè)場(chǎng)景定制專用系統(tǒng)，轉(zhuǎn)向用統(tǒng)一模型覆蓋多樣化任務(wù)的工程級(jí)底座時(shí)代。

具身智能，為什么遲遲沒(méi)有 GPT 時(shí)刻

語(yǔ)言模型之所以能夠演化出一種通用能力底座，是因?yàn)樗鼈兙哂薪y(tǒng)一表示（token）、統(tǒng)一架構(gòu)（基本基于 Transformer）以及可規(guī)模化的預(yù)訓(xùn)練。從而形成可復(fù)用、可遷移、可持續(xù)進(jìn)化的能力底座。

相比之下，具身智能長(zhǎng)期缺失的，恰恰是這種「統(tǒng)一」。過(guò)去幾年，行業(yè)始終困在幾個(gè)結(jié)構(gòu)性瓶頸之中。

首先是數(shù)據(jù)層面的差異。語(yǔ)言模型的訓(xùn)練數(shù)據(jù)來(lái)自互聯(lián)網(wǎng)文本，規(guī)模龐大、結(jié)構(gòu)卻很統(tǒng)一，通過(guò)統(tǒng)一的 token 表示實(shí)現(xiàn)規(guī)模化訓(xùn)練，因此可以在同一架構(gòu)上持續(xù)堆數(shù)據(jù)、堆算力。而機(jī)器人的訓(xùn)練數(shù)據(jù)則是操作軌跡、導(dǎo)航路徑和三維場(chǎng)景信息，這類數(shù)據(jù)采集成本高、格式各異、天然碎片化，遠(yuǎn)不像文本那樣可以直接匯聚成統(tǒng)一語(yǔ)料，更重要的是他們的本體還不同，機(jī)械臂、機(jī)器狗和人形機(jī)器人的數(shù)據(jù)無(wú)法通用。

本質(zhì)在于動(dòng)作表示和空間建模的不統(tǒng)一。在具身領(lǐng)域，不同機(jī)器人使用不同的控制頻率、坐標(biāo)體系和動(dòng)作表達(dá)方式：有的以關(guān)節(jié)角為核心，有的基于末端執(zhí)行器位姿，有的采用絕對(duì)坐標(biāo)。這些差異看似只是工程實(shí)現(xiàn)方式的不同，實(shí)際上卻決定了數(shù)據(jù)能否共享、模型能否遷移。一套模型在某種硬件形態(tài)上訓(xùn)練完成，并不意味著可以直接遷移到另一平臺(tái)，因?yàn)閯?dòng)作空間本身并不兼容。

動(dòng)作表示難以統(tǒng)一，使得行業(yè)即便積累了大量軌跡數(shù)據(jù)，也難以整合為規(guī)模化訓(xùn)練的基礎(chǔ)；與此同時(shí)，空間理解能力的不足進(jìn)一步加劇了這一問(wèn)題。機(jī)器人面對(duì)的是連續(xù)、高維、動(dòng)態(tài)變化的三維物理空間，它不僅要看見(jiàn)，還要理解空間結(jié)構(gòu)、物體關(guān)系與可行動(dòng)區(qū)域。缺乏穩(wěn)定的三維語(yǔ)義建模能力，使模型在復(fù)雜或長(zhǎng)程任務(wù)中容易失效，魯棒性不足。

此外，對(duì)具身來(lái)說(shuō)非常重要的導(dǎo)航能力仍然高度碎片化。相比固定工位上的機(jī)械操作，移動(dòng)意味著要面對(duì)動(dòng)態(tài)變化的環(huán)境、隨機(jī)出現(xiàn)的干擾，以及跨場(chǎng)景的任務(wù)切換。無(wú)論是跨樓層送物、在商場(chǎng)中跟隨服務(wù)，還是城市級(jí)長(zhǎng)程導(dǎo)航，導(dǎo)航都是具身智能邁向通用行動(dòng)能力的前提。

但現(xiàn)實(shí)是，很多主流方法離散且碎片：一套模型用于位置導(dǎo)航，另一套模型用于語(yǔ)義導(dǎo)航，缺什么再補(bǔ)充什么。每個(gè)任務(wù)都能在局部指標(biāo)上取得一定成績(jī)，卻難以形成統(tǒng)一能力框架，機(jī)器訓(xùn)練和適用也就無(wú)從談起。

也正是在這樣的背景下，我們很難看到具身智能可以像語(yǔ)言模型一樣擁有可復(fù)用的具身底座。

從碎片化定制到底座化復(fù)用

而高德天然具備解決這些問(wèn)題的能力，地圖與位置服務(wù)多年沉淀的大規(guī)模真實(shí) 3D 場(chǎng)景與空間語(yǔ)義資產(chǎn)，恰恰是具身導(dǎo)航中最稀缺的資源；而長(zhǎng)期面向億級(jí)用戶的工程落地經(jīng)驗(yàn)，則意味著它更熟悉如何把系統(tǒng)真正跑在真實(shí)環(huán)境里。

ABot-M0：先動(dòng)作語(yǔ)言統(tǒng)一，再談復(fù)用

具身操作的核心難題，用一句話說(shuō)就是：怎么讓同一套模型，駕馭形態(tài)各異的機(jī)器人，完成各種各樣的操作任務(wù)。

ABot-M0 的解法是用「動(dòng)作語(yǔ)言統(tǒng)一」（把異構(gòu)機(jī)器人的動(dòng)作轉(zhuǎn)換為統(tǒng)一表示）降低數(shù)據(jù)割裂與訓(xùn)練成本。為了實(shí)現(xiàn)這一目標(biāo)，ABot-M0 從「數(shù)據(jù)統(tǒng)一 — 算法革新 — 空間感知」三個(gè)方面進(jìn)行了系統(tǒng)性重構(gòu)。

技術(shù)上，它通過(guò)統(tǒng)一坐標(biāo)系、控制頻率和增量式動(dòng)作建模，把來(lái)自不同平臺(tái)的操作軌跡數(shù)據(jù)打通，并構(gòu)建了一個(gè)時(shí)長(zhǎng)超過(guò)9500 小時(shí)包含 600 多萬(wàn)條軌跡、涉及 20 多種具身形態(tài)的混合訓(xùn)練集。更關(guān)鍵的是，這套數(shù)據(jù)不是靠私有采集堆出來(lái)的，完全基于公開(kāi)數(shù)據(jù)，這也意味著這條路徑在原則上通用的。

此外，為了解決動(dòng)作格式、坐標(biāo)系和采樣率的不一致，高德還定義了標(biāo)準(zhǔn)化的預(yù)處理流水線：

所有動(dòng)作均轉(zhuǎn)換為末端執(zhí)行器坐標(biāo)系下的增量動(dòng)作（delta actions）。
旋轉(zhuǎn)采用旋轉(zhuǎn)向量編碼以避免奇異性。
應(yīng)用「pad-to-dual」策略，在共享框架內(nèi)支持單臂和雙臂任務(wù)。
訓(xùn)練期間在各數(shù)據(jù)集間進(jìn)行均勻采樣，以平衡任務(wù)和具身的分布。

這種統(tǒng)一的數(shù)據(jù)基礎(chǔ)打破了數(shù)據(jù)集間的壁壘，通過(guò)對(duì)齊各來(lái)源的時(shí)空結(jié)構(gòu)，實(shí)現(xiàn)了穩(wěn)健的跨具身泛化。

算法層面，ABot-M0 提出了AML（Action Manifold Learning，動(dòng)作流形學(xué)習(xí)）。這個(gè)方法背后有一個(gè)直覺(jué)上成立的假設(shè)：真實(shí)有效的機(jī)器人動(dòng)作，并不是隨機(jī)分布在所有可能的動(dòng)作空間里，而是集中在一個(gè)受物理規(guī)律和任務(wù)約束共同塑造的低維流形上。在這個(gè)流形上學(xué)習(xí)，比在全空間暴力搜索更高效，生成的動(dòng)作序列也更符合物理規(guī)律、更穩(wěn)定。

為增強(qiáng)空間感知，ABot-M0 還引入3D 感知模塊，增強(qiáng)模型對(duì)前后、遠(yuǎn)近、遮擋等空間語(yǔ)義的理解，在復(fù)雜環(huán)境中實(shí)現(xiàn)更精準(zhǔn)的操作決策。

效果上，在 Libero、Libero-Plus、RoboCasa 基準(zhǔn)測(cè)試中，ABot-M0 在包含復(fù)雜任務(wù)組合與動(dòng)態(tài)場(chǎng)景擾動(dòng)的設(shè)定下，平均任務(wù)成功率均達(dá)到 SOTA。在高難度的 Libero-Plus 基準(zhǔn)上，ABot-M0 達(dá)到了80.5%的任務(wù)成功率，比此前最強(qiáng)方案 pi0提升近 30%。這個(gè)提升幅度在工程上是有意義的，從 50% 到 65% 可能只是參數(shù)調(diào)整，從 50% 到 80% 意味著系統(tǒng)性的能力躍升。

但這次發(fā)布更值得關(guān)注的，不是這個(gè)分?jǐn)?shù)本身，而是它背后隱含的工程邏輯：一旦動(dòng)作表示被統(tǒng)一，數(shù)據(jù)就可以跨平臺(tái)積累，模型就可以持續(xù)進(jìn)化，部署成本就會(huì)系統(tǒng)性下降。這好比一個(gè)正向飛輪，一旦啟動(dòng)，效果會(huì)越來(lái)越好。

具身智能的「GPT」時(shí)刻，ABot-N0 攻克具身導(dǎo)航核心難題

如果說(shuō) ABot-M0 解決的是「手」的問(wèn)題，ABot-N0 要解決的是「腿」的導(dǎo)航問(wèn)題，更準(zhǔn)確的說(shuō)，是機(jī)器人如何在開(kāi)放的真實(shí)世界里自主移動(dòng)、理解環(huán)境、完成長(zhǎng)程任務(wù)。

這個(gè)問(wèn)題比操作更難，因?yàn)樗牟淮_定性更高。操作任務(wù)通常在相對(duì)受控的近場(chǎng)環(huán)境里，機(jī)器人面對(duì)的是相對(duì)固定和理想的物理環(huán)境；導(dǎo)航任務(wù)面對(duì)的是動(dòng)態(tài)開(kāi)放世界，場(chǎng)景會(huì)變，人會(huì)出現(xiàn)，路線會(huì)動(dòng)，指令需要實(shí)時(shí)拆解和調(diào)整。更關(guān)鍵的是，長(zhǎng)程任務(wù)的失敗往往是級(jí)聯(lián)的，一個(gè)子任務(wù)失敗，如果沒(méi)有容錯(cuò)機(jī)制，后續(xù)全部崩潰。

導(dǎo)航，這個(gè)屬于高德的「舒適區(qū)」，想要在具身智能上實(shí)現(xiàn)突破，遠(yuǎn)比想象的困難。

當(dāng)前行業(yè)的主流做法是任務(wù)拆分：針對(duì)不同類型的導(dǎo)航任務(wù)（物體導(dǎo)航、語(yǔ)言指令跟隨、社交導(dǎo)航……）分別訓(xùn)練專用模型，各自優(yōu)化。這個(gè)做法有效，但存在一個(gè)根本性的上限：專用模型無(wú)法從異構(gòu)數(shù)據(jù)中提取統(tǒng)一的物理先驗(yàn)，泛化能力受限，遇到訓(xùn)練分布之外的場(chǎng)景就會(huì)失效。

ABot-N0 的做法是全任務(wù)一統(tǒng)：在單一 VLA（視覺(jué) - 語(yǔ)言 - 動(dòng)作）架構(gòu)內(nèi)，實(shí)現(xiàn)五大核心導(dǎo)航任務(wù)的「大一統(tǒng)」

點(diǎn)位導(dǎo)航（Point-Goal）：精確到達(dá)度量坐標(biāo)，實(shí)現(xiàn)基礎(chǔ)避障與移動(dòng)；
目標(biāo)物導(dǎo)航（Object-Goal）：在未知環(huán)境中通過(guò)語(yǔ)義推理搜索并定位特定物體；
指令跟隨（Instruction-Following）：嚴(yán)密對(duì)齊復(fù)雜的長(zhǎng)程自然語(yǔ)言路徑；
POI 導(dǎo)航（POI-Goal）：識(shí)別興趣點(diǎn)并精準(zhǔn)進(jìn)入物理入口，解決「最后幾米」的室內(nèi)外銜接難題；
行人跟隨（Person-Following）：實(shí)現(xiàn)對(duì)動(dòng)態(tài)目標(biāo)的實(shí)時(shí)跟蹤，賦予機(jī)器人社會(huì)化交互能力。

ABot-N0 的數(shù)據(jù)、性能、任務(wù)概覽

相比只能覆蓋部分任務(wù)類型的導(dǎo)航模型，ABot-N0 在單一模型中統(tǒng)一五類核心導(dǎo)航任務(wù)，讓長(zhǎng)程復(fù)雜任務(wù)的執(zhí)行具備了結(jié)構(gòu)上的可行性。它不再為每種任務(wù)單獨(dú)設(shè)計(jì)一套系統(tǒng)，而是在同一能力框架下完成不同約束條件下的表達(dá)。

這本質(zhì)上是一個(gè)更激進(jìn)的假設(shè)，機(jī)器人在世界里移動(dòng)和理解空間，底層邏輯是統(tǒng)一的，不同任務(wù)只是這個(gè)統(tǒng)一能力在不同約束條件下的表達(dá)，在具體執(zhí)行中，機(jī)器只需在模型的調(diào)動(dòng)下拆解任務(wù)，而非在任務(wù)的驅(qū)動(dòng)下調(diào)動(dòng)模型。

在技術(shù)實(shí)現(xiàn)上，ABot-N0 打破了傳統(tǒng)的任務(wù)隔離方法，采用層次化的「大腦 - 動(dòng)作」設(shè)計(jì)哲學(xué)。

認(rèn)知大腦：基于預(yù)訓(xùn)練 LLM，負(fù)責(zé)深度語(yǔ)義理解、任務(wù)拆解與空間推理，理解「幫我看看門口有沒(méi)有快遞」這種復(fù)雜意圖。
動(dòng)作專家：利用流匹配技術(shù)生成精確軌跡，讓機(jī)器人動(dòng)作不再生硬，能夠像人類一樣在復(fù)雜環(huán)境中穩(wěn)定、柔順地穿行。

數(shù)據(jù)側(cè)是另一個(gè)重量級(jí)投入：高德構(gòu)建了約8000 個(gè)高保真 3D 場(chǎng)景和近 1700 萬(wàn)條專家示例的導(dǎo)航數(shù)據(jù)引擎。這個(gè)規(guī)模不是隨便能堆出來(lái)的，背后是高德地圖多年積累的時(shí)空數(shù)據(jù)資產(chǎn)，3D 場(chǎng)景建模的成本和質(zhì)量，普通機(jī)構(gòu)幾乎不可能復(fù)現(xiàn)。

評(píng)測(cè)結(jié)果是，其在 CityWalker、SocNav、R2R-CE/RxR-CE、HM3D-OVON、BridgeNav、EVT-Bench七大權(quán)威基準(zhǔn)測(cè)試中全面刷新了紀(jì)錄。其中 SocNav 成功率提升 40.5%，HM3D-OVON 物體導(dǎo)航成功率提升 8.8%。SocNav 這個(gè)方向尤其值得關(guān)注，機(jī)器人在有人的動(dòng)態(tài)環(huán)境里安全、自然地移動(dòng)，是服務(wù)機(jī)器人規(guī)模化商用的必要前提，之前一直是這個(gè)領(lǐng)域的硬骨頭。

Point-Goal 任務(wù)：在 CityWalker 及 SocNav 上分別進(jìn)行開(kāi)環(huán)和閉環(huán)評(píng)測(cè)

但最終讓 ABot-N0 從實(shí)驗(yàn)室走向現(xiàn)實(shí)的，是那套Agentic Navigation System 框架，這是一個(gè)把讀懂指令→任務(wù)拆解→執(zhí)行→感知→記憶→決策與糾錯(cuò)串成閉環(huán)的代理式系統(tǒng)。高德用全球首創(chuàng)的代理系統(tǒng)跨越了從論文到產(chǎn)品之間那道最難的墻。

高德憑什么做成這件事？

具身智能這條賽道進(jìn)入者不少，為什么是高德先跑通了？

算法是一方面，但也不全是，因?yàn)樗惴ㄊ强梢宰汾s的，SOTA 只是實(shí)時(shí)的數(shù)據(jù)表征。高德真正的護(hù)城河在于兩點(diǎn)：多年的空間智能探索、大規(guī)模高質(zhì)量數(shù)據(jù)與工程化落地能力。

高德做地圖和位置服務(wù)超過(guò) 20 年。這 20 年積累的，不只是道路網(wǎng)絡(luò)數(shù)據(jù)，而是大規(guī)模真實(shí)世界的 3D 場(chǎng)景理解能力：建筑物的空間結(jié)構(gòu)、室內(nèi)室外的語(yǔ)義信息、人流動(dòng)線的模式…… 這些東西，恰好是具身導(dǎo)航模型最需要、也最難靠短期采集補(bǔ)上的訓(xùn)練數(shù)據(jù)。

把地圖數(shù)據(jù)資產(chǎn)脫敏轉(zhuǎn)化為具身智能的訓(xùn)練基礎(chǔ)，這個(gè)轉(zhuǎn)化本身就是一種核心能力。高保真 3D 場(chǎng)景、專家導(dǎo)航示例，模型建立并非資本驅(qū)動(dòng)，它需要多年的數(shù)據(jù)積累、場(chǎng)景建模工程能力，以及把這些數(shù)據(jù)組織成有效訓(xùn)練集的系統(tǒng)工程。

操作側(cè)同樣如此。ABot-M0 對(duì) 600 萬(wàn)條開(kāi)源軌跡數(shù)據(jù)進(jìn)行統(tǒng)一清洗與標(biāo)準(zhǔn)化，看起來(lái)是數(shù)據(jù)整合問(wèn)題，實(shí)則需要對(duì)操作任務(wù)的結(jié)構(gòu)、動(dòng)作表示的差異、不同機(jī)器人形態(tài)之間的映射關(guān)系有深入理解。異構(gòu)數(shù)據(jù)的統(tǒng)一，本質(zhì)上是對(duì)任務(wù)抽象能力的體現(xiàn)，而不是簡(jiǎn)單的數(shù)據(jù)拼接。

如果說(shuō)數(shù)據(jù)資產(chǎn)構(gòu)成了訓(xùn)練基礎(chǔ)，那么工程化能力則決定了模型能否真正落地。

ABot-N0 已實(shí)現(xiàn)在真實(shí)四足機(jī)器人平臺(tái)的部署，并在邊緣設(shè)備上實(shí)現(xiàn)高效推理與閉環(huán)控制。這意味著模型不僅能在 GPU 集群中跑通，還能在算力受限、功耗受限、延遲敏感的邊緣環(huán)境中穩(wěn)定運(yùn)行。

這一步其實(shí)非常關(guān)鍵。很多具身團(tuán)隊(duì)擅長(zhǎng)研究范式創(chuàng)新，卻未必擅長(zhǎng)把系統(tǒng)真正放進(jìn)真實(shí)世界。高德的基因恰恰偏向工程，億級(jí)用戶規(guī)模的地圖服務(wù)，要求系統(tǒng)長(zhǎng)期穩(wěn)定運(yùn)行。把這種工程經(jīng)驗(yàn)遷移到具身系統(tǒng)中，使得可部署、可持續(xù)運(yùn)行成為設(shè)計(jì)目標(biāo)，而不是附加項(xiàng)，而這也恰好解決了具身智能進(jìn)入開(kāi)放物理世界的核心命題。

因此，高德的差異化并不在于某一次算法領(lǐng)先，而在于數(shù)據(jù)與工程能力體系的集中體現(xiàn)。當(dāng)空間資產(chǎn)、數(shù)據(jù)治理能力與真實(shí)部署經(jīng)驗(yàn)疊加在一起，具身底座才真正具備長(zhǎng)期競(jìng)爭(zhēng)力。

結(jié)語(yǔ)

ABot 系列的發(fā)布，或許將在 1-2 年內(nèi)帶來(lái)直接改變：統(tǒng)一數(shù)據(jù)格式和預(yù)訓(xùn)練權(quán)重，讓中小團(tuán)隊(duì)無(wú)需從零積累百萬(wàn)級(jí)軌跡。過(guò)去需要 6 個(gè)月、數(shù)百萬(wàn)元成本的數(shù)據(jù)采集與訓(xùn)練，現(xiàn)在可能縮短到數(shù)周、數(shù)十萬(wàn)元的微調(diào)成本。

開(kāi)發(fā)范式也將從「重寫整套感知 - 規(guī)劃 - 控制系統(tǒng)」轉(zhuǎn)向「基于底座模型做場(chǎng)景化 fine-tune」。或許一個(gè)五人小團(tuán)隊(duì)，可能在幾周內(nèi)完成過(guò)去需要數(shù)十人、數(shù)月交付的定制項(xiàng)目。

更遠(yuǎn)的未來(lái)，機(jī)器人能力可能變成可組合的 API：就像今天開(kāi)發(fā)者調(diào)用 GPT 生成文案、DALL-E 生成圖片、Sora 生成視頻，未來(lái)可能直接調(diào)用 ABot 完成物理世界任務(wù)：「幫我整理書架」「去倉(cāng)庫(kù)盤點(diǎn)庫(kù)存」「在工廠巡檢設(shè)備異常」。

當(dāng)然，硬件成本、安全驗(yàn)證、數(shù)據(jù)閉環(huán)等問(wèn)題仍然存在，具身智能距離真正普及還有不短的路。但當(dāng)統(tǒng)一表示開(kāi)始降低訓(xùn)練門檻，當(dāng)模型可以在真實(shí)環(huán)境中持續(xù)運(yùn)行，這個(gè)行業(yè)至少邁出了從定制工程走向通用底座的一步。

它未必是終局，但方向已經(jīng)變得更清晰了。

下附此次高德發(fā)布的兩款具身基座模型的項(xiàng)目主頁(yè)及技術(shù)報(bào)告：

ABot-M0 項(xiàng)目主頁(yè)｜https://amap-cvlab.github.io/ABot-Manipulation/
ABot-M0 技術(shù)報(bào)告｜https://github.com/amap-cvlab/ABot-Manipulation/blob/main/assets/ABot-M0_Technical_Report.pdf
ABot-N0 項(xiàng)目主頁(yè)：https://amap-cvlab.github.io/ABot-Navigation/ABot-N0/
ABot-N0 技術(shù)報(bào)告：https://github.com/amap-cvlab/ABot-Navigation/blob/ABot-N0/ABot-N0_Technical_Report.pdf

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.