網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

智元仿真平臺(tái)Genie Sim 3.0迎來新升級(jí)，自然語言生成3D世界 | 前沿在線

2026-04-11 15:43:51　來源: 前沿在線

北京舉報(bào)

分享至

文：智元AGIBOT

編輯：前沿在線編輯部

真實(shí)世界的數(shù)據(jù)，讓機(jī)器人開始真正“看見”和“經(jīng)歷”這個(gè)世界。但當(dāng)數(shù)據(jù)問題被部分解決之后，一個(gè)更深層的問題隨之浮現(xiàn)：僅僅依靠現(xiàn)實(shí)世界，是否足夠支撐具身智能的快速進(jìn)化？場景構(gòu)建難以泛化，評(píng)測標(biāo)準(zhǔn)缺乏統(tǒng)一，每一次算法迭代，仍伴隨著繁重的工程投入。

如果現(xiàn)實(shí)世界不夠快，我們就“生成一個(gè)世界”，這正是 Genie Sim 誕生的初衷，以構(gòu)建一個(gè)與真實(shí)世界等價(jià)、甚至更高效的“訓(xùn)練和驗(yàn)證環(huán)境”。

今天，Genie Sim3.0 一站式仿真開發(fā)平臺(tái)迎來新升級(jí)。通過環(huán)境生成、場景泛化、數(shù)據(jù)采集到模型評(píng)測的全流程仿真，顯著加速模型訓(xùn)練驗(yàn)證，提升開發(fā)者與研究者的研發(fā)效率，推動(dòng)具身智能的創(chuàng)新應(yīng)用。

從構(gòu)建到數(shù)據(jù)，從場景到評(píng)測——我們?yōu)榫呱碇悄芴峁┮惶淄暾蓮?fù)用的開源底座。

項(xiàng)目主頁：agibot-world.com/genie-sim
Github地址：github.com/AgibotTech/genie_sim

Genie Sim World：語言造世界，環(huán)境構(gòu)建觸手可及

在傳統(tǒng)范式中，仿真環(huán)境是被“搭建”的。而在 Genie Sim 3.0 中，環(huán)境第一次成為被“生成”的對(duì)象。自然語言，即世界的接口。只需一句話或一張圖，即可生成可交互、可漫游、可訓(xùn)練的三維世界，實(shí)現(xiàn)“輸入即場景”的即時(shí)生成體驗(yàn)。

圖文生境：無需建模、采集或硬件，僅文本或圖片輸入，用戶即可零門檻生成海量場景。通過多模態(tài)大模型，用戶指令一改、場景即換，無限泛化。
極速生成：空間世界模型單次推理即可完成構(gòu)建，生成速度從“小時(shí)級(jí)”提升至“分鐘級(jí)”，實(shí)時(shí)仿真、動(dòng)態(tài)交互即開即用。
虛實(shí)一致：RGB、深度、激光雷達(dá)等多模態(tài)數(shù)據(jù)原生同步輸出，實(shí)現(xiàn)仿真數(shù)據(jù)與真實(shí)世界的渾然一體。

Genie Sim Benchmark：多維度、全方位覆蓋機(jī)器人算法核心能力的仿真評(píng)測基準(zhǔn)

針對(duì)機(jī)器人算法核心的五大能力——語言指令理解、空間關(guān)系認(rèn)知、原子技能操作、環(huán)境擾動(dòng)適應(yīng)、零樣本跨域遷移，Genie Sim Benchmark分別設(shè)計(jì)了五大任務(wù)套件，支持Genie Operator系列、π系列、GR00T系列等主流基座模型，多維度系統(tǒng)性評(píng)估模型在復(fù)雜場景下的綜合表現(xiàn)。

Instruction 指令跟隨：檢驗(yàn)?zāi)Ｐ蛯?duì)形狀、大小、顏色、邏輯等自然語言指令的理解能力，檢驗(yàn)語言與行為的對(duì)齊深度。
Spatial 空間理解：通過相對(duì)位置抓取、排序、疊放等任務(wù)，評(píng)估智能體在幾何與語義交織中的空間智能。
Manipulation 操作執(zhí)行：衡量多場景下的多樣化原子操作技能效果，并通過分層難度設(shè)計(jì)，檢驗(yàn)長程任務(wù)中組合運(yùn)用技能的執(zhí)行水平。
Robust擾動(dòng)適應(yīng)：通過光照變化、背景替換、指令泛化、相機(jī)噪聲、末端切換等十余類實(shí)際作業(yè)工況中可能出現(xiàn)的擾動(dòng)，系統(tǒng)評(píng)估模型在物理世界中的適應(yīng)邊界與魯棒性。
Sim2Real 訓(xùn)以致用：包含一系列零樣本真機(jī)遷移的評(píng)測任務(wù)，通過純仿真數(shù)據(jù)訓(xùn)練的模型同樣可以部署在真機(jī)上達(dá)到較高的任務(wù)成功率，驗(yàn)證模型的跨域遷移能力。

Genie Sim Benchmark提供π系列和GR00T系列等開源基座模型在各個(gè)benchmark任務(wù)套件下的一鍵訓(xùn)練和評(píng)測功能，支持多種末端控制方式，快速繪制模型全景能力畫像。

Genie Sim Benchmark模型評(píng)分

使用Genie Sim Benchmark仿真數(shù)據(jù)訓(xùn)練的模型可以實(shí)現(xiàn)零樣本遷移到真實(shí)世界，并且相同模型在仿真環(huán)境與真實(shí)世界的評(píng)測差異<10%，模型驗(yàn)證無需真機(jī)部署，顯著提升算法迭代效率。

Genie Sim-Sim2Real實(shí)驗(yàn)對(duì)比

Genie Sim x RLinf：全面支持RLinf框架，開啟具身智能“強(qiáng)化”新時(shí)代

Genie Sim x RLinf 開源方案，提供一套“部署簡單、迭代高效”的強(qiáng)化學(xué)習(xí)工具鏈。完美補(bǔ)齊 VLA 模型短板，用低成本的 RL 后訓(xùn)練，打通從"泛化理解"到"精準(zhǔn)微操"的最后一公里。

雙引擎聯(lián)合+并行仿真：物理與渲染引擎解耦，實(shí)現(xiàn)1,000Hz高精度物理模擬與高保真實(shí)時(shí)視覺觀測；通過大規(guī)模并行計(jì)算，顯著提升吞吐量，加速模型收斂。
開源任務(wù) + 評(píng)測閉環(huán)：強(qiáng)化學(xué)習(xí)方案支持對(duì)Genie Sim開源任務(wù)在線微調(diào)，通過交互式學(xué)習(xí)解決模型瓶頸；同時(shí)依托Genie Sim評(píng)測框架，在評(píng)估表現(xiàn)的同時(shí)提供可靠獎(jiǎng)勵(lì)，驅(qū)動(dòng)模型迭代。
通用標(biāo)準(zhǔn)Gym接口：極簡鏈路，生態(tài)無憂。提供標(biāo)準(zhǔn)API，無縫適配RLinf及社區(qū)其他算法環(huán)境，降低使用門檻，便于二次開發(fā)。

Genie Sim x RLinf 為強(qiáng)化學(xué)習(xí)打通了從高效訓(xùn)練到閉環(huán)評(píng)測的路徑：并行仿真大幅提升采樣效率，標(biāo)準(zhǔn)接口降低開發(fā)門檻，讓模型在仿真中加速迭代。

Genie Sim x RLinf 并行訓(xùn)練

從海量仿真數(shù)據(jù)的開源共享，到大語言模型驅(qū)動(dòng)的場景泛化，再到多維度評(píng)測體系的系統(tǒng)構(gòu)建——Genie Sim3.0 將“場景—數(shù)據(jù)—評(píng)測”融為一體，大規(guī)模仿真資產(chǎn)同步可在覓蜂商城獲取，讓開發(fā)者不再受困于環(huán)境搭建與數(shù)據(jù)采集的繁瑣投入。

具身智能的進(jìn)化，需要一座連接虛擬與現(xiàn)實(shí)的高效橋梁，它發(fā)生在無數(shù)次快速構(gòu)建的場景里，發(fā)生在源源不斷生成的數(shù)據(jù)中，也發(fā)生在每一次精準(zhǔn)、自動(dòng)化的評(píng)測迭代里。智元 Genie Sim 3.0 所做的，是為機(jī)器人從仿真走向真實(shí)提供高效引擎。我們希望這不僅是一個(gè)仿真平臺(tái)，更是一個(gè)加速器，一個(gè)讓機(jī)器人從 “緩慢研發(fā)”，走向 “快速落地” 的加速器。

我們相信，這套開源平臺(tái)的開放與共享，將加速模型能力高效進(jìn)化、邁向真實(shí)世界，成為通用機(jī)器人生態(tài)演進(jìn)的重要一步。

前沿動(dòng)態(tài)前沿大會(huì)
前沿人物

點(diǎn)「在看」，給前前加雞腿

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.