![]()
![]()
11月5日,第八屆虹橋國際經濟論壇兩場分論壇——“人形機器人創新發展合作”“人工智能產業高質量發展”分論壇,在國家會展中心(上海)的不同會場進行。今年春晚靠扭秧歌出圈的宇樹科技、今年營收有望十倍增長的上海智元機器人,兩家當下國內最熱的機器人創業公司,在進博會主題下,完成了“隔空對話”。
在“人形機器人創新發展合作”分論壇上,宇樹科技創始人、董事長王興興分享了其最新的行業思考。
![]()
宇樹科技創始人、董事長王興興。
王興興笑言,他個人曾樂觀估計,今年全中國智能機器人產業平均每家公司增長超過50%—100%,然而行業依舊面臨不少需要解決的問題。
“目前人形機器人最關鍵的還是機器人大模型(具身智能模型)的進展速度。我覺得速度比大家原本想象的要稍微慢一點。”他解釋,像機器人研發中一些深度強化學習的全身運控,今年相對去年的進步非常明顯,并且在當下的每個月還在飛快進步。 但在機器人大模型領域,技術進步還需要加把勁 。
“我個人比較樂觀,我感覺目前的狀態就像ChatGPT發布前的幾年,大家已經發現了方向,但還沒有達到真正做出來的臨界點。”王興興認為,真正的具身智能“ChatGPT時刻”還沒到。如果未來在80%的陌生生活場景中,給機器人發送語音或文字,機器人能完成80%左右的任務,那才算基本達到“ChatGPT時刻”。
他進一步打比方:如果到明年這個時候,隨便弄一臺人形機器人到一個場景,這個場景它完全沒有看過,且完全沒有預訓練過,給它的東西也沒有看到過。此時你跟它說話交代任務,比如說“給這位記者朋友拿一份東西過去”,它自己可以直接過去把任務完成,并且這個場景能達到80%左右的成功率,這就基本達到“ChatGPT時刻”,已經屬于非常突破性的技術。
“這是非常重要的目標,如果明年、后年誰能把這個目標實現了,毋庸置疑應該是全球最領先的具身智能AI模型。”王興興說。
![]()
宇樹機器人在今年春晚。
王興興還表示,目前行業中的模型和數據方案都還需要改進。簡單的模型結構大家已經做了很多嘗試,發現泛化能力還不太夠,所以模型能力還需要做創新;大家希望數據質量更好一點,規模更大一點,但目前對數據的采集、數據質量的評判還是非常困難的。他坦言,這兩部分相輔相成需要花更多時間,而不單單只是一股腦兒去采集大量數據,或者一股腦兒把模型規模做大,這稍微有點盲目了。“我們在模型結構、數據采集方式和質量上需要更多思考,這也是目前全球大家面臨比較大的問題。”
而王興興的困惑,上海智元機器人也正在全力攻克。
在“人工智能產業高質量發展”分論壇上,智元機器人合伙人、高級副總裁姚卯青介紹了智元在機器人本體、數據、模型、場景上的全棧布局。這四者形成了相互驅動的飛輪迭代邏輯——優質本體產生高質量數據,海量高質量數據支撐算法持續突破,算法結合場景試錯后,又為本體優化、數據采集方向、算法迭代等提供新的指引。
年輕的智元有令人驚訝的速度——2023年2月才成立,由“天才少年”彭志輝(B站上是擁有百萬粉絲的UP主“稚暉君”)擔任聯合創始人,迄今已發布全系列多款機器人產品,建成規模化生產產線和機器人訓練場數據采集中心,在具身智能相關算法領域也已實現多項創新。
![]()
彭志輝與情商在線的靈犀X2。
姚卯青坦言,智元機器人進入“飛輪循環”的首個挑戰就是數據。“機器人從業者”需直面與物理世界的強交互特性,其數據需求與互聯網數據存在本質差異,尤其是大量動作類、長程規劃類數據極為稀缺。“面對具身智能數據的荒漠,智元選擇種下一棵樹,愿其能成為一片森林。”姚卯青說,智元于2024年底開源了AgiBot World百萬真機數據集,每條數據都經過多輪審核,確保場景貼近現實、任務復雜多樣,旨在提供工業級高質量數據支撐。
![]()
智元的具身數據采集廠。(李曄 攝)
但AgiBot World數據集只是起點,智元在數據采集方式上有兩項關鍵創新,包括“對抗式采集數據”,即在常規數據采集過程中主動引入干擾,以此提升數據信息密度;針對機器人在真實環境中自主執行任務時難以提前枚舉的“長尾失效”問題,智元又引入“自主進化式采集方案”,將“難場景”下的高價值數據補充到訓練集。
今年3月,智元發布其具身智能基座模型GO-1模型,并在生活、零售、工業三大場景的評測中表現亮眼。
除GO-1外,智元還在深耕世界模型方向。所謂世界模型,類似于真正的人類大腦,通過學習現實世界中的物理和因果規律,具備“物理直覺”,可在內部模擬環境變化,基于當前環境狀態推演未來狀態,并評估自身行為的后果。智元秉持“生成理解一體化”理念,其世界模型GenieEnvisioner今年8月正式開源,并打出“行業首個面向雙臂真機的世界模型”概念。官方演示里,基于世界模型,機器人連續完成做三明治、倒茶、擦桌、用微波爐、裝箱等長鏈條任務,看上去已頗具“人味兒”。
就在上月,智元機器人舉行線上直播發布會上,發布新一代工業級交互式具身作業機器人智元精靈G2。在AI技術支撐上,精靈G2正是基于智元全棧自研的通用基座大模型GO-1與世界模型GE-1,其復雜任務處理能力顯著提升。如柔性制造中,用具身智能解決專業設備無法應對的高精度、力控、泛化性操作問題;在物流分揀上,具身智能通用機器人與專用設備配合,處理傳統視覺定位+規劃難以完成的雜亂物品分揀等。據悉,智元精靈G2已獲數億元訂單,即將開啟首批商用交付。
原標題:《宇樹智元機器人在進博會“隔空對話”:王興興有困惑,稚暉君有解法》
本文作者:解放日報 李曄 張楊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.