![]()
具身智能創(chuàng)業(yè)如火如荼,技術路線是否收斂、以及數(shù)據(jù)來源的選擇,都是大家一直關心的問題。最近清華北大的團隊密集發(fā)布了很多研究成果,我們或許可以從中分析出一些趨勢。
![]()
23 年初成立的銀河通用背后是前如布科技聯(lián)創(chuàng)尹方鳴和姚騰洲、科學家是北大助理教授王鶴。銀河通用是低成本仿真路線的擁護者,經(jīng)過 2 年努力于近期重磅發(fā)布了 GraspVLA,思路與 RoboCasa、RoboGen 等類似,在海量合成的仿真環(huán)境中合成機器人數(shù)據(jù)。但 GraspVLA 只關注抓取任務,將預訓練的 AnyGrasp 模型部署到仿真中采集大量數(shù)據(jù)來訓練一個 VLA。在仿真中可以加入很多隨機化、以提升 VLA 的泛化性。



2024 年 9 月成立的靈初智能,CEO 是前京東機器人總裁王啟斌、以及機器人算法負責人柴曉杰、李飛飛學生陳源培,背后科學家包括北大助理教授楊耀東和梁一韜。

與銀河通用類似,靈初智能也是在仿真環(huán)境中大規(guī)模預訓練模型,但在模仿學習中加入了強化學習技術、以及真機數(shù)據(jù)對齊微調(diào)訓練,使得即使只用少量仿真和真機數(shù)據(jù)也能做到很泛化的復雜任務,實現(xiàn)不同技能順滑串聯(lián)操作。2024 年 12 月底發(fā)布的 Psi R0 模型完成了雙手協(xié)作長程的泛化打包任務,已展現(xiàn)出了該模型能實現(xiàn)真正商業(yè)化的強大潛力。
靈初智能此前的其他成果,比如 lego 組裝也是長程的靈巧手任務,可以突破過去強力抓取的能力邊界、完成更靈活的抓取和靈巧動作。根據(jù)之前的公開信息,靈初智能將于 3 月份發(fā)布自研本體以及更泛化的具身大模型。

在數(shù)據(jù)選擇方面,23 年 9 月成立的清華系星海圖持完全不同的觀點,他們認為數(shù)據(jù)價值上,真機數(shù)據(jù) > 互聯(lián)網(wǎng)數(shù)據(jù) > 仿真數(shù)據(jù)。星海圖 CEO 是 Momenta 前執(zhí)行董事高繼揚,科學家包括清華助理教授趙行和許華哲。他們計劃今年發(fā)布 100 萬條真機數(shù)據(jù)、明年發(fā)布 1000 萬條真機數(shù)據(jù)。
星海圖計劃采用真機數(shù)據(jù)為主來預訓練具身大模型、而不是靈初和銀河那種大規(guī)模仿真數(shù)據(jù)預訓練。但以大規(guī)模真機數(shù)據(jù)為主存在 diverse 不足的問題,無法涌現(xiàn)泛化。

在仿真數(shù)據(jù)方面,星海圖強調(diào) Real2Sim2Real 后訓練。仿真數(shù)據(jù)只作為后訓練的一個強化劑,將真實數(shù)據(jù)在仿真中加入隨機化來擴充 1000 倍,以實現(xiàn)更高的成功率和更好的落地效果。
![]()
三家清北團隊在算法和數(shù)據(jù)選擇上略有不同。靈初智能在算法上強調(diào)強化學習、銀河在數(shù)據(jù)上強調(diào)仿真、星海圖強調(diào)真實數(shù)據(jù)。不過各家都采用了仿真和真實數(shù)據(jù)結(jié)合的方法,只是在預訓練和后訓練上強調(diào)不同的數(shù)據(jù)比例。
期待這幾家準獨角獸公司在未來帶來更多的驚喜。清華北大是具身智能創(chuàng)新的先鋒,近期還有很多有意思的成果。
比如清華星動紀元 ERA-42、北大與國地共建具身智能中心 RoboMind、北大與智元 OmniManip、清華千尋智能 CoPa 和 Data Scaling Law 等工作都很值得分析。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.