![]()
作者|栗子
編輯|星奈
媒體|AI大模型工場
最近兩天,首屆世界人形機器人運動會吸引了全世界的關注,各種機器人大顯神通,有百米“飛人”,有“撞人逃逸”的,打拳搏擊的,踢足球的等等,機器人貢獻了各種“名場面”。
不過在16日上午的跳高賽場上,出現了一個讓全場沸騰的瞬間。身高171cm、體重65kg的全尺寸雙足人形機器人——星動L7,在助跑蓄力后完成一個酷似“超級瑪麗跳”的動作,騰空、懸停、穩穩落地,最終定格在95.641cm的高度。這一成績不僅讓它斬獲該項目的桂冠,更是直接創造了世界紀錄。

從起跳時的動力爆發,到騰空時的姿態修正,再到落地時的穩定緩沖,L7展現出機器人“算法+硬件”高度耦合的能力。
在上周WRC主論壇上,星動紀元創始人陳建宇用“通用大腦與通用本體相結合”總結了L7背后的技術邏輯,并進一步描繪了機器人從工廠走進家庭的清晰路徑。
![]()
回看他的演講,讓外界意識到,這場跳高奪冠并非僅僅是一場表演,也揭示了更大的趨勢:人形機器人已經走到“ChatGPT”時刻的前夜,相關技術也正在快速收斂,機器人也正在從“表演”走向“實用”。
星動L7是星動紀元近期發布的最新一代全尺寸高性能人形機器人,這款身高171 cm的雙足機器人,憑借國內首個“既能整活、又能干活”的表現引發關注——它既能完成360°旋轉爆發跳、街舞Breaking等高動態“整活”動作,又能在物流、工廠實現分揀、掃碼、打螺絲,還能完成撕紙巾、拉窗簾等柔性“干活”操作,實現“雙突破”。
![]()
其搭載的 400N?m、25rad/s 自研關節模組性能居全國首位,可完成 360° 旋轉跳、街舞等高動態爆發動作,實測跑步速度達 4m/s,打破人形機器人奔跑速度紀錄。同時,其上肢 7 軸仿人機械臂配合腰部 3 個自由度,具備 2.1 米直徑全域操作空間,手部搭載的全直驅仿人五指靈巧手可復現人類手部動作,協同端到端 VLA 大模型 ERA-42,僅需少量數據就能學習多種新技能。在商業化落地上,星動L7還支持 "全尺寸 + 半身形態" 切換方案,適配多樣化場景,用“按需定制”的方案,降低單場景部署成本。
![]()
除了L7,星動紀元還有面向服務業的Q5、行業首創直驅靈巧手XHAND1等產品,組成“通用本體+通用大腦”的完整矩陣。它們的核心大腦正是星動紀元自研的ERA-42端到端VLA具身大模型,通過融合世界模型和強化學習,實現“看視頻學技能”“少量數據快速上手”的能力。
“VLA已經成為行業共識。”陳建宇在采訪中直言。早年間,業界對端到端模型是否可行仍有分歧,但如今無論國內外,越來越多廠商展現出不錯的VLA成果,逐漸形成了收斂的技術路線。星動紀元自創立之初就堅定選擇這一方向,如今,這條“少有人走的路”正成為行業主流。
在WRC論壇結束后,陳建宇接受媒體采訪,回答了VLA及星動紀元未來的發展等行業最關注的幾個問題,以下為現場陳建宇與媒體的對話實錄,有刪減:
Q:今年具身智能領域的技術路線有哪些明顯變化?為何VLA會成為共識?
陳建宇:今年技術路線在大方向上呈現顯著收斂,無論軟件還是硬件。VLA這個概念在去年甚至前年提及甚少,最開始行業對端到端存在諸多爭議,連是否采用learning base方法都有分歧——此前機器人學習多以基于模型計算等方法為主。
后來,機器人通過強化學習實現更穩定行走,大家才逐漸認可learning base方法。而分層式模型與端到端VLA模型的爭議,也隨著國內外團隊(包括星動紀元及友商)展現出不錯的VLA能力,讓行業逐步相信這一路線的可行性。
星動紀元從創立第一天就堅持這一路線,因為從第一性原理判斷,這是最終路徑。我們和同行的實踐證明了其有效性,也讓更大范圍的人開始接受。
Q:世界模型與VLA是什么關系?它是VLA的演進方向嗎?
陳建宇:我把VLA視為更廣泛的概念——只要機器人具備視覺感知、語言交互能力,包含行為輸出,且是端到端模型,能與人語言交互、在物理世界作業,就屬于VLA。從這個意義上,世界模型是VLA的一條演進路徑,是下一個范式的VLA模型。
世界模型并非獨立存在,而是在現有狹義VLA基礎上,進一步改進機器人的精細化操作能力、泛化能力和認知能力。要實現VLA進階,兩大核心技術不可或缺:
一是世界模型與生成式模型的融合,不是簡單引入單獨的世界模型,而是讓模型同時生成對未來的預測、認知及行為。星動紀元去年完成了全球首個融合工作,論文引發廣泛討論,不少同行已開始關注合作,這很快會形成新共識。
二是VLA的強化學習,運動控制模型(如僅用于走路的模型)可成為通用范式。我們去年已開展探索并發表論文,核心是研究如何在現有VLA框架下通過強化學習提升機器人在各類任務中的通用能力。
Q:人形機器人上下肢協同存在技術卡點嗎?如何實現全身控制?
陳建宇:全身協同技術我們已基本跑通,沒有絕對意義上的卡點。但人形機器人上下肢技術本身難度都很高,需分步驟攻克,不過這并非不可逾越——目前已有很多成功案例可證明。
具體來說,上肢和下肢在建模及交互設計上,VLA與運動控制層的交互設計上,都需要精心設計;數據收集需做好規劃;而模型架構是關鍵,優質架構不應局限于僅控制上肢或全身,一旦架構足夠優秀,控制上肢、下肢或全身的區別并不大。
Q:提升泛化能力與運動控制,哪個更急迫?具身智能的核心競爭力是什么?
陳建宇:泛化能力的提升核心在大腦(模型),但難度更高,因為要應對更復雜的交互場景;運動控制作為底層支撐,也需要良好的泛化能力,以保證動作精準柔順,但其僅涉及機器人自身動作控制。
決定具身智能能力差異的關鍵有三點:第一,模型架構是重中之重,直接決定能力上限;第二,數據的多樣性、來源豐富度及質量比數量更重要;第三,本體的性能與復雜度——比如有腿才能上下樓,有靈巧手才能用復雜工具,本體優劣會限制任務上限和復雜度。
Q:當前機器人效率離理想狀態還有差距,如何突破?
陳建宇:我持樂觀態度。在部分真實工業場景中,我們的機器人效率已達人類的70%以上,預計明年提升至90%,正快速接近理想狀態。這得益于端到端模型的實時反饋與控制能力——與此前分階段處理(先識別、再規劃、后動作)不同,端到端能像人類一樣實時響應、即時校正,大幅提升節拍效率。同時,硬件本體的性能,尤其是速度等指標,也提供了支撐。隨著軟硬件打磨,未來效率有望達到甚至超越人類。
Q:人形機器人的殺手級應用會出現在哪里?進入家庭還需多久?
陳建宇:殺手級應用需分長期與短期。長期來看,最終會進入家庭;但前期需在B端場景先行落地——一方面為企業創造價值,另一方面通過實際場景磨煉技術、積累數據,推動技術飛輪轉動,因此工業等B端場景會率先發展。
機器人進入家庭其實已發生,比如掃地機器人。未來幾年,會有更多簡單形態機器人走進家庭;同時,少部分高凈值家庭可能開始使用功能尚不完善的通用人形機器人嘗鮮,這一趨勢近幾年會逐步顯現。以未來五年為界限,我認為將是家用機器人爆發的窗口期。
Q:靈巧手從去年到今年有哪些突破?星動紀元的定位是什么?
陳建宇:去年靈巧手樣機剛出來,現在已實現穩定量產,成本下降很多,穩定性提升,客戶量增加。此外,力量和速度有提升,還推出了更高自由度的新品。更重要的是,硬件結合VLA后,已能端到端直接控制每個手指關節的高頻動作,打磨得非常不錯。
星動紀元的定位是軟硬一體:硬件做通用人形,軟件做端到端通用模型。從2022年實驗室階段就沿此路徑,先造雙腿、做運動控制,再構建完整人形及端到端模型,后來攻克雙手技術——因為雙手比雙腿更重要,所有精細操作都依賴雙手,而雙腿的核心是將雙手運到作業地點。
我們在VLA模型研究上國內時間最長、成果最豐富,從快慢系統到世界模型再到強化學習,均全球率先研發;硬件上深度自研,能做完整雙手雙足機器人,靈巧手可產品化出售,核心零部件從電機到減速器均自主設計。
Q:星動紀元為何堅持開源?未來技術演進的關鍵是什么?
陳建宇:我們會持續推進模型開源。去年初推出全球首個運控強化學習開源算法humanoid gym,目前是github上最受歡迎的人形機器人開源算法,有1000多個star;今年初又開源了VLA的生成式大模型VPP,后續還有更多動作。
具身智能的進步需要整個生態共同努力。AI領域發展快,很大程度得益于開源風氣——開源后行業能在已有基礎上深入研究,后續成果又能啟發先行者。我們開源后,不少同行在我們工作基礎上改進并開源,無論論文還是模型,都給了我們很多啟發。
未來技術演進的關鍵,仍是沿著VLA的廣義路徑持續迭代,融合世界模型與強化學習,提升機器人的精細化操作、泛化與認知能力,同時通過軟硬一體打磨,讓機器人從實驗室走向產業化,最終走進千家萬戶。
結語
或許在不遠的未來,機器人將不再只是工具,而是成為家庭的新成員。為孩子講睡前故事,為老人遞一杯熱茶,為忙碌的職場人分擔家務。

一個由具身機器人賦能千行百業、融入千家萬戶的時代,正帶著希望與溫度,加速向我們走來。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.