Jay 發自 凹非寺
量子位 | 公眾號 QbitAI
最火世界模型,最火具身智能基建,聯手了!
前者,是李飛飛旗下的World Labs;后者,是一家炙手可熱的仿真合成數據公司——光輪智能
具身智能生態中最受關注的兩家公司雙刃合璧,原因無他,正是瞄準困擾行業已久的「規模化評測」問題,發起一波攻勢。
而隨著這波號角的吹響,也標志著具身智能正式邁入評測驅動時代
在這個賽道上,光輪智能基于全棧自研仿真技術體系所構筑的護城河,正在顯現規模效應。
此次與AI教母李飛飛旗下World Labs的合作,本身也是這一價值判斷在戰略層面的具象化體現,也是一次「世界模型×仿真基礎設施」的歷史性交匯:
World Labs解決的是「世界從哪來」,而光輪智能解決的,是「進步怎么被衡量」。
最火世界模型公司
李飛飛何許人也?
斯坦福著名教授、ImageNet奠基者、前Google Cloud首席AI科學家……行業公認的AI教母
而World Labs,正是李飛飛的首個創業項目。
有這樣一位重量級人物坐鎮,World Labs自然是「出生就含著金湯匙」。
更重要的是,它從一開始就選擇了一條與LLM大相徑庭的AGI路線——空間智能(Spatial Intelligence)。
這是一個極具想象力的概念:
通過構建能夠感知、生成、推理并與環境互動的世界模型,讓AI像人類一樣,在與真實世界的持續交互中,逐步形成更具泛化性、上限更高的心智模型。
這種理念,也與Yann LeCun的判斷不謀而合。盡管二者在世界模型的具體實現路徑上存在差異,但都堅信:只有這種方式,才能突破LLM的智能天花板。
2025年底,World Labs正式推出首款產品Marble
僅需一句話、一張圖片或一段視頻,便可生成高保真的3D世界。
更重要的,是其清晰的商業化潛力。
與LeCun路線不同,Marble走的是可視化世界模型方向,生成結果在視覺層面極具完成度。

Marble生成的是持久、可下載的3D環境,能夠顯著減少場景變形與細節不一致問題,并支持導出為高斯斑點、Mesh網格、視頻等多種格式。
同時,Marble還內置了原生的AI世界編輯器Chisel,用戶只需一句提示,便可對世界進行定制化修改。

對于視覺特效從業者或游戲開發者而言,「一句提示→生成3D世界→一鍵導出至Unity」的鏈路,已經是實打實的生產力工具。
也正因如此,Marble一經發布便廣受好評,也讓更多投資人重新審視世界模型這一路線的可行性。
在創始人、理念與產品的多重加持下,World Labs很快躋身為備受追捧的超級獨角獸。
成立僅兩年,World Labs已融資數億美元,股東包括Andreessen Horowitz、英偉達、Databricks、Adobe等,幾乎串起了整個頂級風投與AI生態網絡。
學術評測與真實評測,已無法跟上具身智能
當然,世界模型真正的潛力,仍然在具身智能。
而這個領域,正在遭遇一個日益尖銳的問題。
模型進步的速度,已經快到一種近乎失控的程度——
幾乎每隔一兩周,就會出現令人眼前一亮的demo(演示),快到連現有benchmark都來不及跟上其進化節奏。
![]()
這讓全球頂尖AI Labs集體陷入困境:
模型能力已經超過所有學術基準,但卻無法被準確評估。
具身智能,迫切需要一把新的尺子。
直覺上,最直接的方法是進入真實環境測試。但這種方式無法規模化。
與自動駕駛不同,機器人沒有「影子模式」的天然土壤。
車輛早已融入日常生活,即便不開啟自動駕駛,系統也能在后臺同步做決策推演,并與人類駕駛行為對比。
但機器人若想達到類似效果,必須額外搭建實驗環境,裝配大量物理設備,并承擔高昂的維護與安全成本。
機械臂路徑規劃出錯,可能導致減速器受損;夾爪力度控制不當,甚至可能直接損壞測試物體。
評測LLM,只需書面作答,邊際成本極低;而要以同等規模評測具身智能,唯一可行的路徑只有仿真。
這,也正是李飛飛投身具身智能創業的核心原因之一。
李飛飛多次強調:數據與評測,是具身智能scaling的根本約束。
她所倡導的數據金字塔,將訓練數據劃分為三類:真實遙操作數據、仿真合成數據、人類視頻數據。
![]()
這一框架,正是出自她的學生、UT Austin教授、NVIDIA GEAR項目聯合負責人Yuke Zhu之手。
在這一金字塔中,仿真合成數據被視為最具可擴展性、也最有潛力成為主干的數據形態。
問題隨之而來:如何讓仿真真正實現規模化?
在這一背景下,World Labs推出了Marble,希望將世界模型作為機器人的仿真訓練場。
但Marble走的是可視化世界模型路線,本質上提供的是一個「世界載體」,并未內置觸覺、重力等物理參數。
若要真正用于機器人訓練與評測,還需要物理引擎,以及大量與真實物理對齊的仿真資產——這是一項極其龐大的長尾工程。
這,正是World Labs與光輪智能合作的關鍵原因。
事實上,這并非李飛飛第一次系統性地推動機器人評測。
早在Stanford時期,她便在2021年左右啟動并推動了BEHAVIOR系列研究,目標非常明確:為具身智能建立ImageNet級別的長期評測工程。
BEHAVIOR從一開始,就不是為了刷榜而生,而是一個長期評測工程,旨在用可擴展、可復現的方式,系統刻畫機器人在真實家庭場景中完成長程、多步驟任務的能力。
其背后,已有兩代博士生投入多年研究。
2025年的BEHAVIOR Challenge,正是這一愿景的重要節點。
該挑戰在NeurIPS頂會期間正式頒獎,被視為具身智能領域少有的、兼具學術與產業權威性的評測事件。
今年BEHAVIOR Challenge的頒獎環節中,光輪智能CEO謝晨受邀參與頒獎。在一個以學術權威著稱的評測體系中,這一安排本身,已經傳遞出明確的行業信號——
評測,正在從論文問題,演進為工程與基礎設施問題。
![]()
在這一體系中,參賽者需要在統一機器人本體上,于仿真家庭環境中完成烹飪、清潔等50個長程任務,平均單任務持續6.6分鐘,評測維度涵蓋任務完成率、時間效率、路徑規劃等多個層面。
這一次,李飛飛希望再次借助評測的力量,為具身智能指明方向,而光輪,正是具身智能最關鍵的產業級基礎設施之一。
World Labs×光輪智能
當前,大多數仿真系統仍在追求「數字孿生」——試圖將真實世界一比一復刻進仿真系統。
這種方式效果驚艷,卻極其昂貴:
高密度傳感器掃描、人工重建、長周期制作,幾乎等同于制作一部小型CG。
顯然,這條路線無法規模化。
World Labs與光輪智能,選擇了另一條路徑——Digital Cousin(數字表親)。
這一概念由斯坦福SVL提出,其核心觀點是:仿真最重要的是物理與空間結構,只要結構可信,細節允許近似。
Marble正是這一思想的代表。
通過一張360°全景圖像等輕量級輸入,Marble便可生成可導航的3D高斯散射世界,將環境創建時間從數周壓縮到數分鐘。
但對于具身智能評測而言,這一步只是起點。
真正的瓶頸在于:這些世界,是否能承載真實的物理交互,并用于穩定、可復現的評測?
這正是光輪智能進入的位置。光輪并非簡單為Marble「補物理引擎」,而是從一開始,就將具身智能視為一個世界—行為—評測高度耦合的系統。
在這次合作中,雙方的分工非常清晰:Marble解決的是環境生成的規模問題,而光輪承擔的是仿真中最難、最重、也是最不可替代的部分——與真實物理對齊的資產,以及評測閉環
其底層,是一套三位一體的仿真技術體系:
- 求解:自研GPU物理求解器,支持百萬級自由度并行計算,穩定輸出軌跡、接觸力等可用于學習與驗證的物理信號。
- 測量:構建全自動虛實對標物理測量工廠,通過高精度設備采集材料、摩擦、接觸等真實物理參數。
- 生成:將真實世界的物理特性規模化映射為可執行、可評測的SimReady資產與場景。
在這一體系下,仿真不再是一次性的數據生成工具,而是一個可重復運行、可持續擴展的數據生產系統
世界、行為、評測,在這里形成閉環。
規模化評測,第一次真正成為可能。
最火具身智能基建公司
這么多做仿真合成數據的公司,李飛飛為何偏偏選中了光輪智能?
上面的成績單,就是最直接的回應。
但如果要更深挖一點的話……光輪智能是當前最炙手可熱的具身智能基建公司。
親自為其戴上這一桂冠的,是英偉達。
光輪是英偉達親密的AI生態伙伴,深度參與了英偉達仿真系統的底層共建,是Newton物理引擎的早期驗證者和開發合作者。
去年10月,黃仁勛女兒、英偉達Omniverse與物理AI高級總監Madison Huang首次公開亮相,同樣是與光輪智能對談。
![]()
其發言更是直接佐證了光輪智能的「強悍」之處:
- 英偉達內部有很多項目需要光輪智能的支持。
有需求的不止英偉達。
量子位曾扒過光輪智能公開的客戶名單,發現其市占率相當恐怖,幾乎覆蓋了AI生態中所有仿真合成數據需求的公司,包括但不限于:
- 大模型公司:英偉達,谷歌,Genesis AI,阿里,字節…
- 機器人本體公司:Figure AI,1X Technology,智元機器人,銀河通用…
- 行業公司:Toyota,BOSCH,比亞迪,吉利…
據幾位接近數據行業的資深人士透露,光輪已經服務了全球前三的世界模型公司。國際主要具身團隊的仿真資產和合成數據,80%以上來自光輪。
這些數字足夠亮眼,但還有一個很容易被忽略的事實:光輪智能是除客戶之外,最早能洞察機器人能力短板的生態角色。
身處客戶需求一線,光輪每天都會從不同模型團隊獲得大量反饋。這些零散的信息一旦匯聚起來,便形成了一本干貨滿滿的機器人「病歷」。
這和咨詢行業是一個邏輯,看的案例多了,自然就知道機器人容易在哪些任務上翻車。
重點在于,光輪本身又是「醫生」。它能圍繞這些「疑難雜癥」,反向優化仿真與合成數據,提供更有針對性的「治療方案」。
這就形成了一個閉環,推著具身智能像雪球一樣滾起來。
歸根結底,作為具身智能的行業基建公司,天生適合擔任評測員。
事實也的確如此。
去年年底,光輪推出了RoboFinals評測標準。這是業內首個工業級、可規模化、真實可信的仿真評測平臺,專為尖端機器人基礎模型評測而生。
阿里通義千問團隊積極采用RoboFinals,通過持續的壓力測試和數據反饋,助力RoboFinals成長為行業通用標準。
同時,光輪也和英偉達聯合打造了Isaac Lab Arena,這是英偉達新一代的開源仿真評測框架。
具身智能進入評測驅動時代
具身智能的發展,迎來拐點。
隨著越來越多玩家的涌入,行業迎來全面爆發,每天都有無數令人興奮的進展。
但這也意味著路線高度分叉,認知日新月異。
大家都在埋頭拉車,但沒人知道前方是什么,這條路究竟能走多遠。
具身智能,當下亟需新「路標」。
評測的意義,當然不僅限于各家模型輪流刷榜秀肌肉。好的評測,能夠提前發現當前技術路線的瓶頸,甚至反過來塑造研究方向。
這是具身智能發展中不可或缺的系統級能力,必須與模型同步擴展。
當評測本身成為基礎設施,光輪智能的角色也隨之發生變化。
不同于模型公司或機器人本體廠商,作為仿真與評測基礎設施,光輪處在所有技術路線之上,而不是其中之一
這也是它最適合、也最有資格承擔評測角色的原因。
在此背景下,World Labs和光輪智能,具身智能最炙手可熱的這兩塊基建,將其串聯到了一塊。
此次重磅合作,或許也標志著一顆「北極星」的冉冉升起——具身智能,正式邁入評測驅動時代
[1]https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence
[2]https://developer.nvidia.com/blog/simplify-generalist-robot-policy-evaluation-in-simulation-with-nvidia-isaac-lab-arena/
[3]https://www.ft.com/content/d8fec7b5-f64a-4c5b-8439-6b8fe557be95
[4]https://mp.weixin.qq.com/s/fF4ePkwm_f9j6xE0B1vRlQ
[5]https://drfeifei.substack.com/p/from-words-to-worlds-spatial-intelligence
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.