![]()
![]()
文:智元AGIBOT
編輯:前沿在線 編輯部
真實(shí)世界的數(shù)據(jù),讓機(jī)器人開始真正“看見”和“經(jīng)歷”這個(gè)世界。但當(dāng)數(shù)據(jù)問題被部分解決之后,一個(gè)更深層的問題隨之浮現(xiàn):僅僅依靠現(xiàn)實(shí)世界,是否足夠支撐具身智能的快速進(jìn)化?場景構(gòu)建難以泛化,評(píng)測標(biāo)準(zhǔn)缺乏統(tǒng)一,每一次算法迭代,仍伴隨著繁重的工程投入。
![]()
如果現(xiàn)實(shí)世界不夠快,我們就“生成一個(gè)世界”,這正是 Genie Sim 誕生的初衷,以構(gòu)建一個(gè)與真實(shí)世界等價(jià)、甚至更高效的“訓(xùn)練和驗(yàn)證環(huán)境”。
今天,Genie Sim3.0 一站式仿真開發(fā)平臺(tái)迎來新升級(jí)。通過環(huán)境生成、場景泛化、數(shù)據(jù)采集到模型評(píng)測的全流程仿真,顯著加速模型訓(xùn)練驗(yàn)證,提升開發(fā)者與研究者的研發(fā)效率,推動(dòng)具身智能的創(chuàng)新應(yīng)用。
從構(gòu)建到數(shù)據(jù),從場景到評(píng)測——我們?yōu)榫呱碇悄芴峁┮惶淄暾蓮?fù)用的開源底座。
項(xiàng)目主頁:agibot-world.com/genie-sim
Github地址:github.com/AgibotTech/genie_sim
![]()
Genie Sim World:語言造世界,環(huán)境構(gòu)建觸手可及
在傳統(tǒng)范式中,仿真環(huán)境是被“搭建”的。而在 Genie Sim 3.0 中,環(huán)境第一次成為被“生成”的對(duì)象。自然語言,即世界的接口。只需一句話或一張圖,即可生成可交互、可漫游、可訓(xùn)練的三維世界,實(shí)現(xiàn)“輸入即場景”的即時(shí)生成體驗(yàn)。
圖文生境:無需建模、采集或硬件,僅文本或圖片輸入,用戶即可零門檻生成海量場景。通過多模態(tài)大模型,用戶指令一改、場景即換,無限泛化。
極速生成:空間世界模型單次推理即可完成構(gòu)建,生成速度從“小時(shí)級(jí)”提升至“分鐘級(jí)”,實(shí)時(shí)仿真、動(dòng)態(tài)交互即開即用。
虛實(shí)一致:RGB、深度、激光雷達(dá)等多模態(tài)數(shù)據(jù)原生同步輸出,實(shí)現(xiàn)仿真數(shù)據(jù)與真實(shí)世界的渾然一體。
![]()
![]()
Genie Sim Benchmark:多維度、全方位覆蓋機(jī)器人算法核心能力的仿真評(píng)測基準(zhǔn)
針對(duì)機(jī)器人算法核心的五大能力——語言指令理解、空間關(guān)系認(rèn)知、原子技能操作、環(huán)境擾動(dòng)適應(yīng)、零樣本跨域遷移,Genie Sim Benchmark分別設(shè)計(jì)了五大任務(wù)套件,支持Genie Operator系列、π系列、GR00T系列等主流基座模型,多維度系統(tǒng)性評(píng)估模型在復(fù)雜場景下的綜合表現(xiàn)。
Instruction 指令跟隨:檢驗(yàn)?zāi)P蛯?duì)形狀、大小、顏色、邏輯等自然語言指令的理解能力,檢驗(yàn)語言與行為的對(duì)齊深度。
Spatial 空間理解:通過相對(duì)位置抓取、排序、疊放等任務(wù),評(píng)估智能體在幾何與語義交織中的空間智能。
Manipulation 操作執(zhí)行:衡量多場景下的多樣化原子操作技能效果,并通過分層難度設(shè)計(jì),檢驗(yàn)長程任務(wù)中組合運(yùn)用技能的執(zhí)行水平。
Robust擾動(dòng)適應(yīng):通過光照變化、背景替換、指令泛化、相機(jī)噪聲、末端切換等十余類實(shí)際作業(yè)工況中可能出現(xiàn)的擾動(dòng),系統(tǒng)評(píng)估模型在物理世界中的適應(yīng)邊界與魯棒性。
Sim2Real 訓(xùn)以致用:包含一系列零樣本真機(jī)遷移的評(píng)測任務(wù),通過純仿真數(shù)據(jù)訓(xùn)練的模型同樣可以部署在真機(jī)上達(dá)到較高的任務(wù)成功率,驗(yàn)證模型的跨域遷移能力。
![]()
![]()
![]()
![]()
![]()
Genie Sim Benchmark提供π系列和GR00T系列等開源基座模型在各個(gè)benchmark任務(wù)套件下的一鍵訓(xùn)練和評(píng)測功能,支持多種末端控制方式,快速繪制模型全景能力畫像。
![]()
![]()
![]()
Genie Sim Benchmark模型評(píng)分
使用Genie Sim Benchmark仿真數(shù)據(jù)訓(xùn)練的模型可以實(shí)現(xiàn)零樣本遷移到真實(shí)世界,并且相同模型在仿真環(huán)境與真實(shí)世界的評(píng)測差異<10%,模型驗(yàn)證無需真機(jī)部署,顯著提升算法迭代效率。
![]()
Genie Sim-Sim2Real實(shí)驗(yàn)對(duì)比
![]()
Genie Sim x RLinf:全面支持RLinf框架,開啟具身智能“強(qiáng)化”新時(shí)代
Genie Sim x RLinf 開源方案,提供一套“部署簡單、迭代高效”的強(qiáng)化學(xué)習(xí)工具鏈。完美補(bǔ)齊 VLA 模型短板,用低成本的 RL 后訓(xùn)練,打通從"泛化理解"到"精準(zhǔn)微操"的最后一公里。
雙引擎聯(lián)合+并行仿真:物理與渲染引擎解耦,實(shí)現(xiàn)1,000Hz高精度物理模擬與高保真實(shí)時(shí)視覺觀測;通過大規(guī)模并行計(jì)算,顯著提升吞吐量,加速模型收斂。
開源任務(wù) + 評(píng)測閉環(huán):強(qiáng)化學(xué)習(xí)方案支持對(duì)Genie Sim開源任務(wù)在線微調(diào),通過交互式學(xué)習(xí)解決模型瓶頸;同時(shí)依托Genie Sim評(píng)測框架,在評(píng)估表現(xiàn)的同時(shí)提供可靠獎(jiǎng)勵(lì),驅(qū)動(dòng)模型迭代。
通用標(biāo)準(zhǔn)Gym接口:極簡鏈路,生態(tài)無憂。提供標(biāo)準(zhǔn)API,無縫適配RLinf及社區(qū)其他算法環(huán)境,降低使用門檻,便于二次開發(fā)。
Genie Sim x RLinf 為強(qiáng)化學(xué)習(xí)打通了從高效訓(xùn)練到閉環(huán)評(píng)測的路徑:并行仿真大幅提升采樣效率,標(biāo)準(zhǔn)接口降低開發(fā)門檻,讓模型在仿真中加速迭代。
![]()
Genie Sim x RLinf 并行訓(xùn)練
從海量仿真數(shù)據(jù)的開源共享,到大語言模型驅(qū)動(dòng)的場景泛化,再到多維度評(píng)測體系的系統(tǒng)構(gòu)建——Genie Sim3.0 將“場景—數(shù)據(jù)—評(píng)測”融為一體,大規(guī)模仿真資產(chǎn)同步可在覓蜂商城獲取,讓開發(fā)者不再受困于環(huán)境搭建與數(shù)據(jù)采集的繁瑣投入。
具身智能的進(jìn)化,需要一座連接虛擬與現(xiàn)實(shí)的高效橋梁,它發(fā)生在無數(shù)次快速構(gòu)建的場景里,發(fā)生在源源不斷生成的數(shù)據(jù)中,也發(fā)生在每一次精準(zhǔn)、自動(dòng)化的評(píng)測迭代里。智元 Genie Sim 3.0 所做的,是為機(jī)器人從仿真走向真實(shí)提供高效引擎。我們希望這不僅是一個(gè)仿真平臺(tái),更是一個(gè)加速器,一個(gè)讓機(jī)器人從 “緩慢研發(fā)”,走向 “快速落地” 的加速器。
我們相信,這套開源平臺(tái)的開放與共享,將加速模型能力高效進(jìn)化、邁向真實(shí)世界,成為通用機(jī)器人生態(tài)演進(jìn)的重要一步。
![]()
前沿動(dòng)態(tài)前沿大會(huì)
前沿人物
點(diǎn)「在看」,給前前加雞腿
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.