——行業(yè)攜手,共建開放可信的數(shù)據(jù)基礎設施
隨著人形機器人技術的突破不斷加速,高質量、多模態(tài)、結構化數(shù)據(jù)已成為推動模型能力提升及產業(yè)走向規(guī)模化應用的核心要素之一,為支撐這一發(fā)展方向,OpenLoong開源社區(qū)積極推進高質量數(shù)據(jù)資源的開放共享,吸引行業(yè)伙伴共同建設統(tǒng)一的數(shù)據(jù)體系。
近日,樂聚智能正式將自主構建的LET數(shù)據(jù)集捐贈至OpenLoong開源社區(qū),為社區(qū)補充了一套覆蓋真實作業(yè)場景的重要數(shù)據(jù)資源。該數(shù)據(jù)集規(guī)模大、結構規(guī)范、場景豐富,具備突出的工程化與研究價值,將為國內人形機器人研發(fā)提供有力支撐,它的加入不僅體現(xiàn)了行業(yè)對統(tǒng)一數(shù)據(jù)規(guī)范與開源治理模式的認可,也標志著OpenLoong數(shù)據(jù)生態(tài)建設進入了新的階段。
▍LET數(shù)據(jù)集:內容構成與數(shù)據(jù)體系概覽
LET數(shù)據(jù)集由樂聚智能與合作團隊聯(lián)合構建,是國內少有的面向真實作業(yè)場景的全尺寸人形機器人真機數(shù)據(jù)集,它基于樂聚夸父系列全尺寸人形機器人進行統(tǒng)一采集,覆蓋真實作業(yè)鏈路,規(guī)模超過60,000分鐘。
![]()
?任務場景豐富
LET數(shù)據(jù)集在場景覆蓋上跨越工業(yè)、商業(yè)零售和日常生活三大領域,包含汽車工廠、快消場景、酒店服務、3C工廠、生活服務和物流共六類真實生產與服務環(huán)境,并在此基礎上構建了31項任務和117種原子技能,形成結構清晰的任務體系,這些任務目標清晰、流程有約束,適用于訓練機器人在多場景、多步驟、多目標條件下進行學習與推理。
?數(shù)采鏈技術創(chuàng)新
與此同時,數(shù)據(jù)集同步記錄頭部與雙腕視覺流,并提供RGB、深度、關節(jié)狀態(tài)和末端執(zhí)行器狀態(tài)等多模態(tài)信息;通過組幀技術將傳感器時間誤差壓到10毫秒以內,再以視覺伺服閉環(huán)機制對齊到統(tǒng)一抽象空間,使數(shù)據(jù)一致性超過90%。
?多模態(tài)數(shù)據(jù)融合
在標注方面,復雜任務被拆解為語義明確的原子動作步驟,配有時間軸、自然語言描述及對象、技能、場景等語義標簽,便于模型理解任務結構與動作邏輯,為行為理解、策略學習和技能組合打下基礎。同時,數(shù)據(jù)集還配套數(shù)據(jù)轉換、模型訓練、仿真測試與真機部署工具鏈,為研究人員提供從數(shù)據(jù)到算法再到驗證的完整流程,提升整體使用效率。
部分任務示例包括:
商超售賣↓
![]()
衣服收納↓
![]()
垃圾回收分類↓
![]()
LET數(shù)據(jù)集為OpenLoong帶來了行業(yè)中極具代表性的一套結構化資源,為社區(qū)的開源生態(tài)補充了關鍵的真實世界數(shù)據(jù)資源,它的加入將推動行業(yè)在任務建模、技能學習與策略驗證等方向展開更深入的研究,同時也為開發(fā)者提供了可用于性能驗證的高質量樣本。
▍建設行業(yè)可信賴的數(shù)據(jù)規(guī)范體系
當前,人形機器人正在加速從實驗室走向真實應用場景,產業(yè)鏈對高質量數(shù)據(jù)集的需求不斷提升,但行業(yè)內存在數(shù)據(jù)來源分散、數(shù)據(jù)格式各異、數(shù)據(jù)結構不統(tǒng)一等共性問題,既降低了數(shù)據(jù)集質量,限制了模型能力的提升,又降低了跨機構協(xié)作效率。因此,構建體系化數(shù)據(jù)標準規(guī)范數(shù)據(jù)全生命周期管理過程是促進高質量數(shù)據(jù)集流通、激活人形機器人數(shù)據(jù)價值的必由之路。
![]()
遵循國家地方共建人形機器人創(chuàng)新中心(以下簡稱“國地中心”)的數(shù)據(jù)采集、數(shù)據(jù)處理等標準可以從源頭確保數(shù)據(jù)質量與可用性,為行業(yè)提供標準化、易復用的數(shù)據(jù)資產。為了確保數(shù)據(jù)在高度一致性、可復用性和長期可維護性等方面滿足要求,國地中心建立了一套覆蓋數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)質量審核和版本管理的標準體系,覆蓋數(shù)據(jù)全生命周期,使得不同來源的數(shù)據(jù)在OpenLoong開源社區(qū)上以格式一致、標注清晰的形式呈現(xiàn)。作為國家級創(chuàng)新中心,國地中心始終致力于推動產業(yè)標準化進程,攜手生態(tài)伙伴共建訓練場和數(shù)據(jù)標準生態(tài),累計主導或參與國際標準、國家標準和行業(yè)標準60余項;同時,建設并維護具身智能數(shù)據(jù)集開源平臺,與行業(yè)共享標準化成果。2025年9月,國地中心申報的“上海虛實融合具身智能訓練場標準化試點”獲批公示,數(shù)據(jù)是具身智能訓練場的核心驅動之一,具身智能數(shù)據(jù)標準的編制與應用驗證是未來開展國家標準化試點的重要任務之一。
![]()
![]()
作為開放原子開源基金會孵化及運營的重點項目,OpenLoong依托國地中心的建設經驗,持續(xù)推進共享型數(shù)據(jù)框架的構建,以開源方式推動數(shù)據(jù)的規(guī)范化組織與復用,為行業(yè)提供穩(wěn)定的數(shù)據(jù)底座。LET數(shù)據(jù)集的捐贈進一步擴充了社區(qū)的真實場景數(shù)據(jù)儲備,為行業(yè)提供更具代表性的訓練樣本,也為模型能力的持續(xù)提升奠定了基礎。未來,格式統(tǒng)一、標注規(guī)范、高質量的數(shù)據(jù)集將成為人形機器人產業(yè)的重要支撐,提升人形機器人行業(yè)的研發(fā)效率與協(xié)作水平。
![]()
▍OpenLoong數(shù)據(jù)生態(tài)持續(xù)擴展,共建共享加速行業(yè)協(xié)同
LET數(shù)據(jù)集現(xiàn)已正式捐獻給OpenLoong開源社區(qū),并可在社區(qū)網站上下載使用。
作為OpenLoong人形機器人全棧開源項目的重要組成部分,該數(shù)據(jù)集將在開放原子開源基金會的孵化下持續(xù)運營與維護,穩(wěn)定更新,為行業(yè)提供系統(tǒng)化的真實場景數(shù)據(jù)資源,同時也體現(xiàn)了企業(yè)與開源社區(qū)在推動數(shù)據(jù)開放與行業(yè)協(xié)同方面達成的深層共識。
![]()
![]()
隨著越來越多的企業(yè)、高校和科研機構加入數(shù)據(jù)貢獻,OpenLoong的數(shù)據(jù)生態(tài)正逐步形成覆蓋基礎能力訓練、任務執(zhí)行、多場景研究和真實環(huán)境驗證的多層次體系,社區(qū)也將持續(xù)強化數(shù)據(jù)基礎設施建設,為行業(yè)提供統(tǒng)一可靠的技術支撐。
OpenLoong開源社區(qū)始終堅持開放共享的原則,歡迎更多行業(yè)伙伴加入數(shù)據(jù)共建。社區(qū)鼓勵具備真實作業(yè)場景、具有代表性任務鏈路或擁有多模態(tài)采集能力的企業(yè)、高校與研究團隊貢獻高質量數(shù)據(jù),共同完善人形機器人領域的開源數(shù)據(jù)體系,同時也將持續(xù)為貢獻者提供規(guī)范透明的托管環(huán)境,通過開源機制確保數(shù)據(jù)被充分利用。隨著數(shù)據(jù)規(guī)模不斷增長,OpenLoong將與行業(yè)共同推動多場景、多任務、多模型的協(xié)同研究,促進形成更加開放、健康的產業(yè)生態(tài)。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.