![]()
機(jī)器之心發(fā)布
近日,全球具身世界模型權(quán)威基準(zhǔn)評(píng)測(cè) WorldArena 正式更新最新榜單。Manifold AI 流形空間研發(fā)的世界模型 Worldscape 0.2,憑借其在物理規(guī)律遵循與多源交互理解上的突破取得 WorldArena 榜單全球第一,充分展現(xiàn)了國(guó)產(chǎn)世界模型在復(fù)雜動(dòng)態(tài)場(chǎng)景生成與具身控制中的高精度、強(qiáng)泛化與物理可信度。與其同場(chǎng)競(jìng)技的包括英偉達(dá)、谷歌等國(guó)外巨頭和星動(dòng)紀(jì)元、極佳視界等國(guó)內(nèi)具身智能公司。
WorldArena 是首個(gè)面向具身世界模型的「功能 + 視覺」統(tǒng)一評(píng)測(cè)體系,由清華大學(xué)、北京大學(xué)、香港大學(xué)、普林斯頓大學(xué)、中科院、上海交通大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)、新加坡國(guó)立大學(xué)等頂尖機(jī)構(gòu)聯(lián)合推出。目前已經(jīng)成為具身世界模型領(lǐng)域的國(guó)際權(quán)威公開評(píng)測(cè)標(biāo)準(zhǔn)。
WorldArena 榜單除了視覺質(zhì)量,評(píng)測(cè)維度還包含動(dòng)作質(zhì)量、內(nèi)容一致性、物理遵循性、3D 準(zhǔn)確性、可控性,充分評(píng)估各家模型對(duì)物理規(guī)律的理解、動(dòng)作軌跡的精度、多步?jīng)Q策的穩(wěn)定,這些正是具身大腦最應(yīng)關(guān)注的能力。另外,WorldArena 還包含了世界模型作為數(shù)據(jù)引擎(Data Engine)、策略評(píng)估器(Policy Evaluator)和動(dòng)作規(guī)劃器(Action Planner)等三個(gè)下游任務(wù)的全面評(píng)測(cè),最后將上述客觀評(píng)測(cè)結(jié)合人類主觀評(píng)估,計(jì)算出高度綜合的 EWMScore 指數(shù)。
![]()
WorldScape 0.2 的 WorldArena 登頂并非偏科取勝,而是同時(shí)展現(xiàn)出了綜合素質(zhì)與突出長(zhǎng)板。具體表現(xiàn)如下:
- 綜合感知得分穩(wěn)居榜首:在包含視覺質(zhì)量、運(yùn)動(dòng)質(zhì)量、內(nèi)容一致性、可控性等多維度的極其嚴(yán)苛的綜合感知評(píng)估中,WorldScape 0.2 拿下了綜合第一,而且在各項(xiàng)能力之間取得了完美的平衡,沒(méi)有明顯的 “短板效應(yīng)”,能夠全方位支撐復(fù)雜的長(zhǎng)程具身任務(wù)。
- 物理規(guī)律遵循斷層第一:以往的生成模型往往 “重視覺、輕物理”,生成的行為僅僅是看起來(lái)合理,卻違背真實(shí)世界的物理約束, WorldScape 0.2 拿下了該項(xiàng)指標(biāo)的最高分且大幅領(lǐng)先。這說(shuō)明模型真正 “內(nèi)化” 了重力、摩擦力、碰撞與受力反饋等力學(xué)邏輯,其生成的場(chǎng)景不僅 “像”,而且在物理上 “對(duì)”,完全具備了作為高可靠物理模擬器指導(dǎo)真實(shí)機(jī)器人作業(yè)的能力。
- 卓越的三維空間理解力:模型在 3D 準(zhǔn)確性這一高難度指標(biāo)上同樣表現(xiàn)出了極高水準(zhǔn),表明 WorldScape 0.2 在處理復(fù)雜的機(jī)械臂操控、視角切換和物體遮擋時(shí),依然能夠維持極高精度的三維空間幾何結(jié)構(gòu),避免了傳統(tǒng)視頻模型常見的 “空間扭曲” 或 “二維紙片化” 現(xiàn)象,為多源交互提供了堅(jiān)實(shí)的空間拓?fù)浠A(chǔ)。
![]()
一個(gè)月前,登頂通用世界模型權(quán)威榜單 WorldScore
一個(gè)月前,國(guó)際最權(quán)威的通用世界模型評(píng)測(cè)榜單 WorldScore 迎來(lái)更新,Manifold AI 自研模型 WorldScape 0.1 就在 WorldScore 強(qiáng)勢(shì)登頂(WorldScore-Static 和 WorldScore-Dynamic 全部?jī)身?xiàng)指標(biāo)均排名第一),在全球同臺(tái)競(jìng)技中拿下第一并保持至今。
![]()
在世界模型的全球競(jìng)逐中,WorldScore 被公認(rèn)為檢驗(yàn)通用世界模型基座實(shí)力的 “終極試金石”。該基準(zhǔn)從各類可控性、生成質(zhì)量等多類維度,考驗(yàn)?zāi)P驮跀?shù)千個(gè)不同場(chǎng)景的生成能力,對(duì)模型進(jìn)行嚴(yán)苛的極限測(cè)試。面對(duì)這一高門檻,Manifold AI 流形空間研發(fā)的 WorldScape 0.1 模型強(qiáng)勢(shì)突圍,總分穩(wěn)居全球榜首。與其同場(chǎng)競(jìng)技的包括李飛飛團(tuán)隊(duì)、MIT、阿里、Runway、智譜、MiniMax、騰訊混元等。
長(zhǎng)久以來(lái),世界模型的通病是 “重渲染、輕規(guī)律”,生成的視頻看似精美,但在涉及復(fù)雜場(chǎng)景的運(yùn)動(dòng)、多步控制時(shí),往往破綻百出。而 WorldScape 恰恰在最難攻克的物理和交互指標(biāo)上,拉開了顯著的領(lǐng)先優(yōu)勢(shì),從而成功登頂。這意味著,WorldScape 已經(jīng)成功跨越了 “像不像” 的視覺表象,真正觸及了 “對(duì)不對(duì)” 的底層物理邏輯。這不僅是一次分?jǐn)?shù)的超越,更是國(guó)產(chǎn)世界模型在真實(shí)世界執(zhí)行力上的一次標(biāo)志性跨越。
![]()
更難能可貴的是,WorldScape 模型參數(shù)規(guī)模是排名前列其他模型的 10%,展現(xiàn)了該模型全球最佳的空間智能密度和推理實(shí)時(shí)性。也為落地到物理 AI 的邊緣側(cè)提供了技術(shù)支撐。
不到一個(gè)月再次進(jìn)化,MoE 開啟世界模型 Scaling Law
近年來(lái),MoE 架構(gòu)在大語(yǔ)言模型中取得了巨大成功,它使模型能夠以稀疏激活的方式高效吸收海量知識(shí),在同等計(jì)算預(yù)算下大幅提升語(yǔ)言理解與生成能力。MoE 的底層原理是通過(guò)引入多個(gè)專精的子網(wǎng)絡(luò)與動(dòng)態(tài)門控機(jī)制,在每次前向計(jì)算中僅激活與輸入最匹配的少數(shù)專家,從而在不顯著增加計(jì)算成本的前提下將模型參數(shù)規(guī)模提升數(shù)個(gè)量級(jí)。
將 MoE 拓展至世界模型尤為重要:世界模型需要統(tǒng)一建模物理規(guī)律、多模態(tài)感知、交互決策等高度異質(zhì)的場(chǎng)景,而 MoE 可以讓不同專家分別負(fù)責(zé)視覺動(dòng)態(tài)、移動(dòng)交互、操作推理等不同子空間或任務(wù)模式,并通過(guò)門控自適應(yīng)地整合它們,從而在保持整體參數(shù)可擴(kuò)展性的同時(shí),避免不同知識(shí)領(lǐng)域的相互干擾,為實(shí)現(xiàn)通用、連貫的世界模擬提供了關(guān)鍵的結(jié)構(gòu)化機(jī)制。短短不到一個(gè)月,WorldScape 從 0.1 進(jìn)化到 0.2 并再次登頂,其核心驅(qū)動(dòng)力正式來(lái)自 MoE,具體來(lái)說(shuō)體現(xiàn)在三個(gè)方面:
![]()
1.多專家協(xié)同泛化:從統(tǒng)一交互到多專家協(xié)同的泛化基座
WorldScape 0.2 突破單一任務(wù)邊界,構(gòu)建支持多源控制信號(hào)協(xié)同學(xué)習(xí)的統(tǒng)一架構(gòu)。在延續(xù)基礎(chǔ)空間交互能力的同時(shí),將機(jī)械臂精細(xì)操控等復(fù)雜具身行為納入多專家統(tǒng)一生成范式,實(shí)現(xiàn)不同控制模態(tài)間的相互賦能與聯(lián)合優(yōu)化。該框架具備原生可擴(kuò)展性,為邁向 “世界模型驅(qū)動(dòng)的通用智能” 提供可插拔、可泛化的底層技術(shù)路徑。
2.統(tǒng)一空間表征:從幾何約束到多源知識(shí)融合的元空間建模
WorldScape 0.2 超越單一幾何先驗(yàn),將幾何拓?fù)洹⒄Z(yǔ)義理解與物理規(guī)律等多維異質(zhì)表征進(jìn)行結(jié)構(gòu)化對(duì)齊,并在統(tǒng)一的隱式元空間中完成跨模態(tài)知識(shí)融合。這種表征耦合機(jī)制使模型在長(zhǎng)程交互中不僅能維持空間拓?fù)浞€(wěn)定,更能實(shí)現(xiàn)語(yǔ)義連貫與物理合理的深度一致,從根本上升級(jí)了世界結(jié)構(gòu)的生成可信度。
3.多階段持續(xù)學(xué)習(xí):從視覺保真到物理遵循的范式躍遷
WorldScape 0.2 采用漸進(jìn)式分階段訓(xùn)練策略,通過(guò)海量世界知識(shí)注入與異源控制信號(hào)的深度耦合,顯著強(qiáng)化生成內(nèi)容對(duì)真實(shí)物理規(guī)律的遵循能力。模型不再局限于 “畫面流暢”,而是追求 “運(yùn)動(dòng)符合力學(xué)邏輯與場(chǎng)景常識(shí)”,在全球權(quán)威具身基準(zhǔn) WorldArena 中斬獲第一,實(shí)現(xiàn)從 “視覺擬真” 向 “物理可信” 的關(guān)鍵跨越。
Manifold AI 在多個(gè)主流評(píng)測(cè)模型中的獨(dú)占鰲頭表現(xiàn),以及其模型 scaling 能力的驗(yàn)證,讓我們相信世界模型的 GPT3 時(shí)刻即將到來(lái)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.