當機器人不再需要人類手把手教學,而是在虛擬的物理世界中自主進化,一場具身智能的“ImageNet時刻”正在代碼中悄然來臨。
2026年初,跨維智能做出了一個可能改變行業格局的決定:開源EmbodiChain。
這是全球首個能夠完全使用合成數據訓練機器人并在真實世界零樣本部署的具身智能工具鏈,意味著一個數據平權的時代正式來臨。
開源主頁:https://dexforce.com/embodichain/index.html#/
代碼倉庫: https://github.com/DexForce/EmbodiChain
技術文檔: https://dexforce.github.io/EmbodiChain/introduction.html
GS-World Paper: https://www.techrxiv.org/doi/full/10.36227/techrxiv.176153394.41323502
01
具身智能的“ImageNet時刻”?
如果說大語言模型的爆發始于ImageNet等開放數據集的建立,那么EmbodiChain的開源,很可能標志著具身智能領域的“ImageNet時刻”到來。
傳統機器人訓練面臨三重困境:數據稀缺、成本高昂、難以泛化。真實數據采集需要人遙控機器人,耗時耗力且存在安全風險;仿真數據又與真實世界存在“虛實鴻溝”;不同機構的數據格式不一,形成“數據孤島”。
EmbodiChain的突破在于,不需要原始真機,而是構建了一個完整的“造夢-學習-驗證”閉環。
在Real2Sim的第一階段,系統支持兩種數據生成路徑:基于語言描述的DexGen和基于動作軌跡的DexDyna。
前者可根據自然語言自動生成仿真場景;后者可將真實操作視頻轉化為可仿真的動作序列。
隨后進入Sim Data Scaling的第二階段。基于少量“種子”場景,該系統通過生成式仿真技術實現百萬級數據擴增。這個過程不僅僅是簡單的復制粘貼,而是在任務、資產、場景、技能四個維度進行智能擴展。
最后在Sim2Real(仿真到真實)的第三階段。訓練完成的模型可直接部署到真實機器人,實現零樣本遷移。通過大規模域隨機化策略,模型學會了聚焦任務本質特征,兼顧紋理、光照等變化。
最具革命性的或許是這套范式下來,機器人可以完全依靠100%合成數據習得技能,并在真實世界完美執行。這打破了仿真數據必須與真實數據混合使用的行業潛規則。
“目前全行業只有我們是完全用100%生成式的多模態數據訓出來的具身智能模型。”跨維智能創始人賈奎在采訪中表示。
02世界模型之爭
從“視頻生成”到“物理仿真”
2025年,“世界模型”成為具身智能領域最炙手可熱的概念。但當各家都在談論世界模型時,技術路徑已出現明顯分野。
一類是基于視頻生成的世界模型,如Sora的后續發展。這類模型能生成逼真視頻,但缺乏三維結構和物理規律支撐。“生成的視頻里沒有3D,沒有物理,怎么可能學出來?”賈奎質疑道。
另一類是基于3DGS(三維高斯潑濺)的表征,例如前段時間海外某實驗室的GSM (Gaussian Splatting Maps for 3D Reconstruction):這類技術適合娛樂應用,但難以實現精準的物理屬性仿真。
跨維智能走的是第三條路:基于生成式仿真和GS-World物理模型生成的世界模型,該模型不僅生成視覺場景,更構建嚴格符合牛頓力學定律的虛擬物理世界。
賈奎將GS-world稱為“世界模型2.0”,以區別于視頻生成范式。在這個虛擬宇宙中,物體有質量、有摩擦力、會碰撞、會形變,這些物理屬性是基于建模而來可計算、可優化的數學參數。可以說EmbodiChain讓合成數據完全替代真實數據成為可能,從根本上解決了數據來源問題。
這種差異在商業落地中體現得尤為明顯。視頻生成的世界模型可能創造出令人驚嘆的演示視頻,但難以轉化為真實的機器人技能;而基于物理仿真的世界模型,則能直接輸出可在工廠、倉庫、家庭中實際工作的機器人策略。
技術路徑的分化反映的是對“智能”本質的不同理解。是將智能視為對視覺模式的識別與生成,還是視為在物理約束下的推理與行動?具身智能的答案顯然是后者。
03數據平權
打破巨頭壟斷的“武器”
當前,高質量機器人數據被少數巨頭壟斷。這些公司組建龐大的采集團隊,在全球范圍內收集數據,構建起難以逾越的數據壁壘。初創公司和小型研究機構幾乎無法參與競爭。
“如果模型訓練最終仍需1%真實數據,就無法判定真實/虛擬數據誰才是起決定作用,就意味著每個新場景都需搭建真實環境采集數據。”賈奎指出,這無法解決高效低成本商業落地的核心問題。
EmbodiChain的開源,本質上是一場數據平權運動。它將曾經只有巨頭才能負擔的數據生成能力,免費提供給整個行業。任何研究者、任何初創公司,現在都可以基于這套工具鏈,生成自己的訓練數據,訓練自己的機器人模型。
這種平權可能重塑行業生態。大公司不再能憑借數據積累建立護城河;小團隊也有機會在特定領域實現突破;學術界與工業界的差距可能迅速縮小。
“技術變革來的太快。”賈奎在采訪中直言。那些投資于大規模真機數據采集的路線,可能在新范式面前失去優勢。
這并非危言聳聽。歷史上,每次技術范式的轉變都會讓曾經的投入貶值。當更高效、更廉價的技術出現時,依賴舊技術的資產就會迅速縮水。
04Efficiency Law
機器人領域的新“摩爾定律”
大語言模型的成功遵循Scaling Law(規模定律):模型能力和訓練數據規模呈指數關系。但這一規律在機器人領域遭遇挑戰,因為物理交互數據的獲取成本極高,難以實現互聯網規模的數據積累。
跨維智能提出了適用于機器人的新定律:Efficiency Law(效率定律)。
該定律指出,在有限時間內,決定具身模型性能上限的關鍵變量是高質量數據的生成速率。如果數據生成速率過低,模型將永遠無法“吃飽”,再大的參數量也無法帶來性能涌現。
![]()
圖釋:Efficiency Law中模型性能與數據生成率的關系
EmbodiChain正是驗證Efficiency Law的首個高數據生成速率引擎。它通過GPU并行與Real2Sim技術,最大化數據生成效率,將行業從Data-Driven(數據驅動)推向Engine-Driven(引擎驅動)的新范式。
這種轉變的意義不亞于從手工制造到自動化生產的工業革命。傳統機器人研發如同手工作坊,依賴工匠經驗;而EmbodiChain代表的引擎驅動范式,則如同自動化生產線,可規模化、標準化地產出機器人智能。
“EmbodiChain旨在開啟Engine-Driven的新范式。”賈奎對記者提道,“智能體不再是被動學習者,而是置身于一個可生成、可演化的引擎中。”
但在賈奎看來,EmbodiChain也只是起點,而非終點。在跨維智能的藍圖中,它僅僅是GS-World(生成式仿真世界模型)的底座。
GS-World的終極形態是機器人的完整演化場。在這里,不僅是策略在進化,機器人的形態、感知系統、乃至“新陳代謝”(能源系統)都可以在物理引擎中協同演化。
這種愿景令人聯想到科幻作品中的場景:機器人在虛擬世界中經歷數百萬次迭代,自主發現最優設計,然后被“打印”到現實世界。這或許就是硅基生命的進化之路——不是在自然環境中物競天擇,而是在數字宇宙中數學優化。
賈奎預測:“2026年世界模型,尤其是基于三維物理的世界模型會非常火爆。”隨著算力增長和算法進步,虛擬世界將越來越逼真,機器人在其中學到的東西將越來越適用于現實。
這場革命的影響可能遠超機器人領域本身。當我們可以構建高保真的物理仿真世界,當AI可以在其中自主探索和優化,我們獲得的不僅是更好的機器人,更是理解智能本質的新窗口。
或許有一天,人類能夠通過觀察AI在虛擬世界中的進化,反過來理解自身智能的起源。這不僅是技術的進步,更是認知的飛躍。
05商業落地
從百臺出貨到行業賦能
技術突破最終要接受市場的檢驗。跨維智能的人形機器人已實現批量出貨,主要應用于商業服務場景,特別是基于上肢操作的吧臺服務。
“我們2025年8月份已經開始批量出貨,如今超過百臺,營收近億元。”賈奎透露。對于一個相對較晚進入本體制造領域的企業,這一進展值得關注。
但真正具有想象空間的是其賦能行業的潛力。跨維智能不僅銷售機器人本體,更提供從數據生成到模型訓練的工具鏈。“我們本質是賣給客戶一個能夠產生模型的能力。”
這與單純銷售硬件或軟件有著本質不同。EmbodiChain提供的是一種元能力,即生成數據、訓練模型、部署應用的全棧能力。客戶可以用它解決自己的特定問題,而不必依賴跨維智能提供現成解決方案。
這種模式更靈活,也更具擴展性。工業場景需要高成功率,商業場景可能更看重成本,服務場景則需要良好的人機交互體驗,而EmbodiChain可以通過調整優化目標,滿足不同場景需求。
當然,EmbodiChain的開源不僅僅是代碼的公開,更是生態建設的開始。
“我們開源EmbodiChain的初衷,是堅信具身智能的‘ImageNet時刻’不會誕生于封閉的私有模型,而將誕生于一個標準化的、共享的基礎設施之上。”賈奎對我們解釋道。
這種開放精神在當今的商業環境中尤為難得。在各大科技公司競相構建封閉生態的今天,跨維智能選擇了截然不同的道路——通過開源構建生態,通過生態擴大影響。
隨著EmbodiChain的開源,2026年的具身智能戰場將不再是簡單的數據量比拼,也不再是封閉技術的護城河競爭。這是一場全新的游戲,規則正在被重寫,玩家正在重新洗牌。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.