![]()
![]()
文:智元AGIBOT
排版:前沿在線 編輯部
在計算機視覺領(lǐng)域,“ImageNet時刻”的出現(xiàn)曾經(jīng)改變了一切。它不僅提供了數(shù)據(jù),更定義了一個時代的研究范式。今天,具身智能同樣站在這樣的臨界點上。
2024年末,智元發(fā)布具身智能行業(yè)首個百萬真機數(shù)據(jù)集AGIBOT WORLD時,我們嘗試為這個領(lǐng)域提供一個新的起點。而現(xiàn)在,隨著研究不斷深入,新的需求也變得更加明確:研究者和開發(fā)者需要的,不再只是數(shù)據(jù)量,而是能夠真實承載物理世界復雜性的高質(zhì)量數(shù)據(jù)。
基于這樣的創(chuàng)新研究需求,智元機器人正式開源——AGIBOT WORLD 2026 數(shù)據(jù)集,首個覆蓋具身智能全域研究的開源數(shù)據(jù)集。
該數(shù)據(jù)集基于海量真實場景,圍繞五大具身領(lǐng)域研究主題構(gòu)建,每個主題均設(shè)有專屬采集方法與精細化的標注體系,以精準支持不同細分領(lǐng)域研究者的需求。數(shù)據(jù)集將分五個階段持續(xù)開源,覆蓋更多主題與場景,旨在為具身領(lǐng)域提供覆蓋廣泛、即取即用的高質(zhì)量真實數(shù)據(jù)。同時,我們通過數(shù)字孿生技術(shù),在仿真環(huán)境中1:1重建真實場景并采集數(shù)據(jù),仿真數(shù)據(jù)同步開源。
我們希望通過全新的具身數(shù)據(jù)集明確一個更深遠的方向:讓機器人走出實驗室,在真實世界中呼吸、學習、進化。
項目主頁:agibot-world.com
開源地址:huggingface.co/datasets/agibot-world/AgiBotWorld2026
![]()
具身數(shù)據(jù),不再是“理想環(huán)境”的產(chǎn)物
長期以來,機器人數(shù)據(jù)往往誕生于高度控制的環(huán)境之中。標準的樣板間、整潔的桌面、預(yù)設(shè)的初始位置、可預(yù)期的操作路徑,讓模型能夠快速學習,卻難以適應(yīng)真實世界的復雜性。
而現(xiàn)實卻從來不是這樣的。一個普通的家庭廚房,可能同時存在遮擋、雜亂擺放、光照變化和動態(tài)干擾;一個商業(yè)空間中的任務(wù),也往往需要在不確定條件下完成多步驟操作。正是在這些細節(jié)之中,機器人被真正賦予作業(yè)能力。
AGIBOT WORLD 2026的所有數(shù)據(jù)均采集自100%真實環(huán)境。覆蓋商業(yè)空間、酒店餐飲、家居、安防場景、工業(yè)物流等場景,復雜任務(wù)與隨機干擾并存,每一次操作都發(fā)生在真實世界的上下文之中。這意味著,數(shù)據(jù)不再是“被設(shè)計”的,而是“被經(jīng)歷”的。也正因如此,每一條數(shù)據(jù)都天然具備遷移到真實應(yīng)用中的價值。
![]()
![]()
新一代硬件采集,靈巧本體豐富末端
數(shù)據(jù)的質(zhì)量,不僅取決于場景,也取決于采集它的“身體”。
AGIBOT WORLD 2026基于智元新一代以工業(yè)級標準打造的精靈G2通用機器人完成采集。這一硬件平臺搭載高性能關(guān)節(jié)執(zhí)行器、多類型傳感器、高性能域控制器,支持高精度力控作業(yè),并提供豐富的二次開發(fā)接口。結(jié)合Swift Picker夾爪與智元OmniHand五指靈巧手,同步采集多視角RGB(D)、觸覺、LiDAR點云、IMU及全身關(guān)節(jié)狀態(tài)、力傳感器等多模態(tài)傳感數(shù)據(jù)。
在同一任務(wù)中,機器人不僅“看到”,還“感受到”,并實時記錄自身的運動與反饋。這種多模態(tài)的統(tǒng)一采集,使得數(shù)據(jù)天然具備更強的表達能力,也更貼近真實部署時的系統(tǒng)狀態(tài)。
![]()
![]()
讓數(shù)據(jù)真正“像機器人在做事”
在采集方面,更進一步的問題是:數(shù)據(jù)是否真的反映了機器人“完整地在執(zhí)行任務(wù)”?我們這一點上做了關(guān)鍵突破。
首先,全身控制(Whole Body Control)的引入,讓機器人不再只是局部執(zhí)行動作,而是像人一樣以完整的身體參與任務(wù)。機械臂、腰部與手部在統(tǒng)一控制下協(xié)同運作,動作更加連貫自然,也更接近人類在現(xiàn)實世界中的行為方式。很多過去依賴“拼接動作”的任務(wù),現(xiàn)在可以被一體化完成,這種能力會直接體現(xiàn)在數(shù)據(jù)之中。
與此同時,超視距遙操作構(gòu)建了一種全新的采集方式。數(shù)采員可以跨地域地實時控制機器人,并通過第一視角,與機器人共享同一感知空間,使操作過程更加直觀與連續(xù)。人不再是“外部指揮者”,而是“在機器人身體中行動”,這種一致性,使采集到的數(shù)據(jù)天然具備更強的可遷移性,也成為釋放全身控制能力的最佳范式。
在更微觀的層面,力控采集的引入進一步改變了數(shù)據(jù)的表達方式。數(shù)據(jù)不再只是運動軌跡的記錄,而是包含了真實的接觸與力反饋信息。機器人在“觸碰世界”的過程中所感受到的變化,被完整保留下來,從而使模型能夠?qū)W習柔順操作、復雜接觸乃至精細的物理交互。
當這三種能力共同作用時,數(shù)據(jù)不再只是“動作的集合”,而是一次完整的、真實發(fā)生的物理行為過程。
![]()
工業(yè)級標準,讓數(shù)據(jù)可用可靠
所有數(shù)據(jù)在進入AGIBOT WORLD 2026數(shù)據(jù)集之前,都經(jīng)歷了嚴格的驗證流程。原始數(shù)據(jù)采集完成后,都將通過算法策略訓練與真機測試,確保數(shù)據(jù)采集的有效性。所有數(shù)據(jù)均進入嚴格的 DaaS工業(yè)質(zhì)檢流水線,依據(jù)統(tǒng)一標準進行多輪篩查與清洗,每一個環(huán)節(jié)都圍繞一個目標展開:確保交付結(jié)構(gòu)清晰、標注精準、可直接用于模型訓練的高質(zhì)量數(shù)據(jù)。
這也是智元始終堅持的一個原則——數(shù)據(jù)不僅要“看起來正確”,更要“用起來可靠”。
![]()
![]()
五大階段逐步登場,正式開源第一期“模仿學習”主題
創(chuàng)新自由采集范式
人類通過觀察與模仿掌握復雜技能,而機器人同樣可以借助專家示范,快速建立對任務(wù)的理解與執(zhí)行能力,學習并泛化復雜的物理交互技能。這便是具身研究領(lǐng)域的關(guān)鍵方向之一“模仿學習”。AGIBOT WORLD 2026開源的第一期,正是圍繞這一研究方向展開。
不同于傳統(tǒng)固定腳本的采集方式,我們引入了智元創(chuàng)新的“自由采集范式”。數(shù)據(jù)采集員在真實場景中,根據(jù)實時情況靈活設(shè)計操作流程,使數(shù)據(jù)自然覆蓋不同物體種類、不同操作順序與不同動作路徑的組合,全面覆蓋多維度泛化需求。機器人通過靈活移動底盤、頭部運動、腰部旋轉(zhuǎn)及升降俯仰等擬人運動機制,實現(xiàn)了高效、自然且極具遷移價值的數(shù)據(jù)構(gòu)建。
這樣的采集范式讓數(shù)據(jù)不再只是“標準答案”,而是一種具有泛化能力的經(jīng)驗集合。
數(shù)據(jù)標注體系創(chuàng)新:從“動作”到“理解”
真實數(shù)據(jù)只是起點,更關(guān)鍵的是如何讓機器人真正“理解”。
在AGIBOT WORLD 2026數(shù)據(jù)集中,我們圍繞具身智能的核心問題,構(gòu)建了一套覆蓋多層級的標注體系。一個任務(wù)不再只是簡單的動作序列,而是被拆解為從目標描述到步驟執(zhí)行,再進一步細化到原子技能(如抓取、放置)、2D邊界框等屬性標注的完整結(jié)構(gòu)。機器人不僅可以看到“做了什么”,還可以理解“為什么這么做”。
更重要的是,我們在數(shù)據(jù)中完整保留了錯誤修正過程的軌跡記錄。現(xiàn)實世界中,沒有任何操作是完美的,真正的智能體,必須具備在失敗中調(diào)整路徑的能力。當這些過程被記錄、被標注、被學習,模型才開始兼具任務(wù)精準性與自主糾錯能力的魯棒性。
![]()
具身智能的下一階段,會發(fā)生在真實世界里。它發(fā)生在我們每個人每天生活的廚房、商場、超市里,也發(fā)生在每一個需要被自動化與智能化的場景中。智元推出 AGIBOT WORLD 2026 所做的,是為這一階段提供技術(shù)底座。我們希望這不僅是一個數(shù)據(jù)集,更是一個起點。一個讓機器人從“可以被展示”,走向“可以被使用”的起點。
今天,我們正式向全球研究者、開發(fā)者開源 AGIBOT WORLD 2026 數(shù)據(jù)集。無論是學術(shù)界、還是產(chǎn)業(yè)界,都可以基于這一數(shù)據(jù)基礎(chǔ),探索更真實、更可靠的具身智能能力。如果說過去的機器人更多停留在實驗室,那么接下來,它們將真正進入現(xiàn)實世界。
而這一切的發(fā)生,正從數(shù)據(jù)開始。
![]()
前沿動態(tài)前沿大會
前沿人物
點「在看」,給前前加雞腿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.