
ROBOT INDUSTRY
2025年初,“科技春晚”美國消費電子展 CES 2025如約開幕。芯片巨頭英偉達創始人黃仁勛發布了多個新產品,其中包括首個生成式世界基礎模型Cosmos。在演講現場,他公開展示了14款全球領先的人形機器人產品。作為其中唯一一臺以輪式底座為移動方式的人形機器人,來自北京銀河通用機器人有限公司的Galbot G1赫然登場,舉起英偉達新一代RTX5090顯卡。那么,黃仁勛為何青睞這家成立不到兩年的公司?
![]()
“通用”是市面上大多數人形機器人研發商為之努力的方向,也是北京銀河通用機器人有限公司(以下簡稱“銀河通用”)的研發愿景。其原因,一是人形機器人有快速部署的特點,能快速融入工作場景而無需增加特殊配置;二是使用門檻低,通過語音和文字指令布置任務,拋棄了傳統的軌跡重放等作業方式。不過,當前技術水平仍不支持“通用”人形機器人大規模落地,仍需從細微場景入手,以小見大,補足通用場景提出的能力清單。
在銀河通用創始人、CTO王鶴博士的帶領下,銀河通用研發團隊以端到端具身多模態大模型補足人形機器人“腦力”空白,在國際范圍內首次實現了成功率在95%以上抓取隨機堆放、從未見過的透明、高光等物體,甚至已進一步掌握類似開柜子、開抽屜、晾衣服等泛化操作技能。銀河通用與北大和北京智源人工智能研究院(BAAI)分別成立了具身智能聯合實驗室和研究中心,與合作伙伴深度探索零售場景技能閉環,并開發未來機器人在工業、物流、康養等方向的技能,共同賦能機器人又穩又好地邁入實際場景應用。
1
模擬數據填平“通用”與現實之間的鴻溝
具身智能指用具象化的身體與真實物理世界交互。高水平訓練數據的缺乏,直接限制了人形機器人的泛化性和通用性,大部分只能在局限的環境下,面對特定對象,以固有的操作方式完成專用任務,嚴重不適配真實物理世界隨機性的特征。因此,在高質量訓練數據和訓練方法面世之前,人形機器人實現規模商業化有很大難度。
銀河通用產品總監朱輝以三個案例來概括國內外數據收集現狀。一是特斯拉數據中心招募工人重復做出放置電池的動作,通過頭戴VR眼鏡為Optimus收集數據,該方法只適用于固定的操作動作,當抓取對象發生改變時,抓取成功率驟降;二是斯坦福大學使用主從臂采集數據,訓練ALOHA做滑蛋蝦仁,但只適用于類似格局的廚房,當房間條件如灶臺高度發生改變,操作成功率驟降;三是字節跳動團隊GR-2使用學術公開數據集中的3800萬個互聯網視頻片段進行生成式訓練,取得不俗的表現,但和真實世界相比,公開數據集中的動作數據的規模和多樣性仍然有限,并不足以使得機器人學到多種技能。可以看出,基于現實環境和直接使用數據集的訓練方式都有欠缺之處。這三個案例都是通過收集現實數據來訓練模型,從而使模型運行出來的的結果符合真實物理世界,并使得模型具有預測動作軌跡的能力。
![]()
圖1 Galbot在銀河通用前臺迎賓
近年來,仿真技術普遍地應用到學術研究中,銀河通用團隊在計算機中模擬出了仿真物理環境,用計算機模擬運行,在仿真環境中一秒鐘可以生成超萬條級別的仿真數據,大大降低數據成本,提高模型訓練效率。2025年年初,銀河通用聯合北京智源人工智能研究院及北京大學和香港大學得研究人員,發布全球首個全面泛化的端到端具身抓取基礎大模型GraspVLA,為解決具身大模型訓練過程中的數據困難和泛化困難提供了可行的解題思路。同時,團隊提出VLA(Vision Language Action,視覺-語言-動作模型)達到基礎模型需滿足的七大泛化金標準:光照泛化、背景泛化、平面位置泛化、空間高度泛化、閉環能力、動態干擾泛化,以及物體類別泛化。此外,GraspVLA還可以使用一人天的數據體量,快速訓練GraspVLA理解新需求、新名詞。
在復刻環境數據時,先把真實世界映射到攝影畫面中,再渲染為機器人大腦能理解的3D環境。深度相機可以測量物體到相機的距離,用于三維重建、目標定位、識別等應用領域,受環境光變化影響,機器人看到的物體顏色和形態可能會發生改變,尤其是透明高光物體,影響機器人的識別和判斷。銀河通用在咖啡廳、便利店、生產車間、KTV、關燈的房間等真實工作環境中測試,機器人抓取成功率居高不下。
銀河通用產品總監朱輝表示,目前公司團隊約有百余人,分工明確,一直保持著較高的創新活性,機器人性能上的迭代以周為單位。機器人在部分真實場景走向深度應用,產生出大量有參考價值的數據,又進一步推動了模型訓練和技術迭代。
2
Galbot的展會實踐
大模型有先驗知識,能夠理解環境,實現環境圖像的智能分割。早在2024北京智源大會上,機器人就可以通過認真觀察貨架的信息,構建出貨架在虛擬世界中的映射,再渲染貨品包裝等細節。“完全不需要對接數據庫人為地輸送數據,展會前一天讓機器人花費少量時間自主學習場地環境,展會當天開機就能用上,移動底座的設計也使機器人的續航能力延長至6~8小時,機器人可以長時間維持演示狀態,吸引了大量觀眾駐足。”朱輝說道。
2024世界機器人大會(WRC)上,銀河通用機器人Galbot被圍觀群眾“出難題”,拿了很多不帶標簽的透明礦泉水瓶擺在桌面上,機器人都能夠一一抓取。不少觀眾在現場見到機器人緩慢的思考和執行速度時,紛紛質疑其實現應用的可能性。朱輝表示,出于安全防護的考慮,大會上所展示的機器人速度被刻意放緩,而實際的抓取速度已經達到展示速度的3~4倍。
朱輝介紹到,公司成立之初因研發精力有限,Galbot只能使用購買來的國產靈巧手,此后,公司自主研發了一款兼顧輕量化設計和復雜功能的靈巧手,將在今年展會公開亮相時展示。“在日復一日大數據加持的交互學習中,具身大模型機器人訓練出決策的‘大腦’和執行的‘小腦’,指揮日漸靈巧的‘手’,機器人能夠獨立完成越來越多的工作。”朱輝談道。
![]()
圖2 Galbot抓起隨機打碎的玻璃杯
在2024云棲大會上,Galbot每天工作8小時,在連續3~4天的真機工作展示中,它共服務了900多位觀眾,取送了超千件商品,取送的商品數幾乎可以補滿8個云棲大會現場擺放商品的貨架。無獨有偶,銀河通用在2024年9月閃耀亮相服貿會,與其合作伙伴搭建藥房場景,機器人在其中不間斷地完成著補貨、點貨、取貨任務。
3
Galbot的落地方向和落地進度
王鶴博士表示,當前人形機器人技術已達到產業化的邊界,當前主要任務是將端到端大模型能力遷移到人形機器人上。未來五年,人形機器人有望在商業和工廠等場景中實現規模達萬臺的應用,十年后有望進入家庭生活場景。
銀河通用已與合作伙伴簽署戰略合作協議,將在線下零售、智慧貨倉、智慧物流等多個領域圍繞機器人賦能服務展開全面、深入的合作,以科技創新服務社會,幫助實體藥房等提質升級,以數字化解決方案實現“把世界送到消費者手中”。
![]()
圖3 Galbot正在疊衣物
近兩年,銀河通用主要訓練Galbot在零售場景的“通用”能力,打造藥房零售場景下的無人值守閉環。朱輝談道,Galbot將首先在北京的某些藥房中實現應用,如今人們在手機上買到的商品,就有可能是由人形機器人分揀、配送的。
據圓周智行不完全統計,2024年,我國人形機器人行業共發生71起融資事件,融資總額將近70億元,單筆融資達億級的有26起。其中,銀河通用一舉聚齊了北京、上海、深圳、香港四地政府背景基金,承接這四地發展人形機器人產業的迫切心情。
![]()
圖4 Galbot在藥房零售場景應用
2025年是銀河通用人形機器人量產元年,朱輝表示,人形機器人產量達到千臺后,將迎來成本的進一步下滑,并加速進入餐飲、物流、康養、醫院、寫字樓等應用場景發光發熱。
閱讀更多內容,歡迎訂購《機器人產業》雜志。
點擊跳轉!圈內人都在看的專家觀點
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.