網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

世界模型雙冠王誕生！國(guó)產(chǎn)世界模型力壓谷歌、英偉達(dá)等持續(xù)領(lǐng)跑

2026-04-27 20:55:03　來(lái)源: 機(jī)器之心Pro

北京舉報(bào)

分享至

機(jī)器之心發(fā)布

近日，全球具身世界模型權(quán)威基準(zhǔn)評(píng)測(cè) WorldArena 正式更新最新榜單。Manifold AI 流形空間研發(fā)的世界模型 Worldscape 0.2，憑借其在物理規(guī)律遵循與多源交互理解上的突破取得 WorldArena 榜單全球第一，充分展現(xiàn)了國(guó)產(chǎn)世界模型在復(fù)雜動(dòng)態(tài)場(chǎng)景生成與具身控制中的高精度、強(qiáng)泛化與物理可信度。與其同場(chǎng)競(jìng)技的包括英偉達(dá)、谷歌等國(guó)外巨頭和星動(dòng)紀(jì)元、極佳視界等國(guó)內(nèi)具身智能公司。

WorldArena 是首個(gè)面向具身世界模型的「功能 + 視覺」統(tǒng)一評(píng)測(cè)體系，由清華大學(xué)、北京大學(xué)、香港大學(xué)、普林斯頓大學(xué)、中科院、上海交通大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、新加坡國(guó)立大學(xué)等頂尖機(jī)構(gòu)聯(lián)合推出。目前已經(jīng)成為具身世界模型領(lǐng)域的國(guó)際權(quán)威公開評(píng)測(cè)標(biāo)準(zhǔn)。

WorldArena 榜單除了視覺質(zhì)量，評(píng)測(cè)維度還包含動(dòng)作質(zhì)量、內(nèi)容一致性、物理遵循性、3D 準(zhǔn)確性、可控性，充分評(píng)估各家模型對(duì)物理規(guī)律的理解、動(dòng)作軌跡的精度、多步?jīng)Q策的穩(wěn)定，這些正是具身大腦最應(yīng)關(guān)注的能力。另外，WorldArena 還包含了世界模型作為數(shù)據(jù)引擎（Data Engine）、策略評(píng)估器（Policy Evaluator）和動(dòng)作規(guī)劃器（Action Planner）等三個(gè)下游任務(wù)的全面評(píng)測(cè)，最后將上述客觀評(píng)測(cè)結(jié)合人類主觀評(píng)估，計(jì)算出高度綜合的 EWMScore 指數(shù)。

WorldScape 0.2 的 WorldArena 登頂并非偏科取勝，而是同時(shí)展現(xiàn)出了綜合素質(zhì)與突出長(zhǎng)板。具體表現(xiàn)如下：

綜合感知得分穩(wěn)居榜首：在包含視覺質(zhì)量、運(yùn)動(dòng)質(zhì)量、內(nèi)容一致性、可控性等多維度的極其嚴(yán)苛的綜合感知評(píng)估中，WorldScape 0.2 拿下了綜合第一，而且在各項(xiàng)能力之間取得了完美的平衡，沒(méi)有明顯的 “短板效應(yīng)”，能夠全方位支撐復(fù)雜的長(zhǎng)程具身任務(wù)。
物理規(guī)律遵循斷層第一：以往的生成模型往往 “重視覺、輕物理”，生成的行為僅僅是看起來(lái)合理，卻違背真實(shí)世界的物理約束， WorldScape 0.2 拿下了該項(xiàng)指標(biāo)的最高分且大幅領(lǐng)先。這說(shuō)明模型真正 “內(nèi)化” 了重力、摩擦力、碰撞與受力反饋等力學(xué)邏輯，其生成的場(chǎng)景不僅 “像”，而且在物理上 “對(duì)”，完全具備了作為高可靠物理模擬器指導(dǎo)真實(shí)機(jī)器人作業(yè)的能力。
卓越的三維空間理解力：模型在 3D 準(zhǔn)確性這一高難度指標(biāo)上同樣表現(xiàn)出了極高水準(zhǔn)，表明 WorldScape 0.2 在處理復(fù)雜的機(jī)械臂操控、視角切換和物體遮擋時(shí)，依然能夠維持極高精度的三維空間幾何結(jié)構(gòu)，避免了傳統(tǒng)視頻模型常見的 “空間扭曲” 或 “二維紙片化” 現(xiàn)象，為多源交互提供了堅(jiān)實(shí)的空間拓?fù)浠A(chǔ)。

一個(gè)月前，登頂通用世界模型權(quán)威榜單 WorldScore

一個(gè)月前，國(guó)際最權(quán)威的通用世界模型評(píng)測(cè)榜單 WorldScore 迎來(lái)更新，Manifold AI 自研模型 WorldScape 0.1 就在 WorldScore 強(qiáng)勢(shì)登頂（WorldScore-Static 和 WorldScore-Dynamic 全部?jī)身?xiàng)指標(biāo)均排名第一），在全球同臺(tái)競(jìng)技中拿下第一并保持至今。

在世界模型的全球競(jìng)逐中，WorldScore 被公認(rèn)為檢驗(yàn)通用世界模型基座實(shí)力的 “終極試金石”。該基準(zhǔn)從各類可控性、生成質(zhì)量等多類維度，考驗(yàn)?zāi)Ｐ驮跀?shù)千個(gè)不同場(chǎng)景的生成能力，對(duì)模型進(jìn)行嚴(yán)苛的極限測(cè)試。面對(duì)這一高門檻，Manifold AI 流形空間研發(fā)的 WorldScape 0.1 模型強(qiáng)勢(shì)突圍，總分穩(wěn)居全球榜首。與其同場(chǎng)競(jìng)技的包括李飛飛團(tuán)隊(duì)、MIT、阿里、Runway、智譜、MiniMax、騰訊混元等。

長(zhǎng)久以來(lái)，世界模型的通病是 “重渲染、輕規(guī)律”，生成的視頻看似精美，但在涉及復(fù)雜場(chǎng)景的運(yùn)動(dòng)、多步控制時(shí)，往往破綻百出。而 WorldScape 恰恰在最難攻克的物理和交互指標(biāo)上，拉開了顯著的領(lǐng)先優(yōu)勢(shì)，從而成功登頂。這意味著，WorldScape 已經(jīng)成功跨越了 “像不像” 的視覺表象，真正觸及了 “對(duì)不對(duì)” 的底層物理邏輯。這不僅是一次分?jǐn)?shù)的超越，更是國(guó)產(chǎn)世界模型在真實(shí)世界執(zhí)行力上的一次標(biāo)志性跨越。

更難能可貴的是，WorldScape 模型參數(shù)規(guī)模是排名前列其他模型的 10%，展現(xiàn)了該模型全球最佳的空間智能密度和推理實(shí)時(shí)性。也為落地到物理 AI 的邊緣側(cè)提供了技術(shù)支撐。

不到一個(gè)月再次進(jìn)化，MoE 開啟世界模型 Scaling Law

近年來(lái)，MoE 架構(gòu)在大語(yǔ)言模型中取得了巨大成功，它使模型能夠以稀疏激活的方式高效吸收海量知識(shí)，在同等計(jì)算預(yù)算下大幅提升語(yǔ)言理解與生成能力。MoE 的底層原理是通過(guò)引入多個(gè)專精的子網(wǎng)絡(luò)與動(dòng)態(tài)門控機(jī)制，在每次前向計(jì)算中僅激活與輸入最匹配的少數(shù)專家，從而在不顯著增加計(jì)算成本的前提下將模型參數(shù)規(guī)模提升數(shù)個(gè)量級(jí)。

將 MoE 拓展至世界模型尤為重要：世界模型需要統(tǒng)一建模物理規(guī)律、多模態(tài)感知、交互決策等高度異質(zhì)的場(chǎng)景，而 MoE 可以讓不同專家分別負(fù)責(zé)視覺動(dòng)態(tài)、移動(dòng)交互、操作推理等不同子空間或任務(wù)模式，并通過(guò)門控自適應(yīng)地整合它們，從而在保持整體參數(shù)可擴(kuò)展性的同時(shí)，避免不同知識(shí)領(lǐng)域的相互干擾，為實(shí)現(xiàn)通用、連貫的世界模擬提供了關(guān)鍵的結(jié)構(gòu)化機(jī)制。短短不到一個(gè)月，WorldScape 從 0.1 進(jìn)化到 0.2 并再次登頂，其核心驅(qū)動(dòng)力正式來(lái)自 MoE，具體來(lái)說(shuō)體現(xiàn)在三個(gè)方面：

1.多專家協(xié)同泛化：從統(tǒng)一交互到多專家協(xié)同的泛化基座

WorldScape 0.2 突破單一任務(wù)邊界，構(gòu)建支持多源控制信號(hào)協(xié)同學(xué)習(xí)的統(tǒng)一架構(gòu)。在延續(xù)基礎(chǔ)空間交互能力的同時(shí)，將機(jī)械臂精細(xì)操控等復(fù)雜具身行為納入多專家統(tǒng)一生成范式，實(shí)現(xiàn)不同控制模態(tài)間的相互賦能與聯(lián)合優(yōu)化。該框架具備原生可擴(kuò)展性，為邁向 “世界模型驅(qū)動(dòng)的通用智能” 提供可插拔、可泛化的底層技術(shù)路徑。

2.統(tǒng)一空間表征：從幾何約束到多源知識(shí)融合的元空間建模

WorldScape 0.2 超越單一幾何先驗(yàn)，將幾何拓?fù)洹⒄Z(yǔ)義理解與物理規(guī)律等多維異質(zhì)表征進(jìn)行結(jié)構(gòu)化對(duì)齊，并在統(tǒng)一的隱式元空間中完成跨模態(tài)知識(shí)融合。這種表征耦合機(jī)制使模型在長(zhǎng)程交互中不僅能維持空間拓?fù)浞€(wěn)定，更能實(shí)現(xiàn)語(yǔ)義連貫與物理合理的深度一致，從根本上升級(jí)了世界結(jié)構(gòu)的生成可信度。

3.多階段持續(xù)學(xué)習(xí)：從視覺保真到物理遵循的范式躍遷

WorldScape 0.2 采用漸進(jìn)式分階段訓(xùn)練策略，通過(guò)海量世界知識(shí)注入與異源控制信號(hào)的深度耦合，顯著強(qiáng)化生成內(nèi)容對(duì)真實(shí)物理規(guī)律的遵循能力。模型不再局限于 “畫面流暢”，而是追求 “運(yùn)動(dòng)符合力學(xué)邏輯與場(chǎng)景常識(shí)”，在全球權(quán)威具身基準(zhǔn) WorldArena 中斬獲第一，實(shí)現(xiàn)從 “視覺擬真” 向 “物理可信” 的關(guān)鍵跨越。

Manifold AI 在多個(gè)主流評(píng)測(cè)模型中的獨(dú)占鰲頭表現(xiàn)，以及其模型 scaling 能力的驗(yàn)證，讓我們相信世界模型的 GPT3 時(shí)刻即將到來(lái)。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.