12月18-19日,第六屆中國(guó)機(jī)器人行業(yè)年會(huì)在杭州舉行。這場(chǎng)匯聚了超2000名行業(yè)專家企業(yè)家及從業(yè)者的年度盛會(huì),已成為解碼機(jī)器人技術(shù)與商業(yè)未來的高端對(duì)話場(chǎng)。
機(jī)器人大講堂特現(xiàn)推出系列深度報(bào)道,梳理大會(huì)現(xiàn)場(chǎng)行業(yè)頂尖專家與知名企業(yè)的核心洞見,探尋中國(guó)機(jī)器人在具身智能時(shí)代的破局之路。
本期聚焦:【劉揚(yáng)】Hyper-VLA與世界模型:驅(qū)動(dòng)具身智能邁向“理解世界,可靠執(zhí)行”新范式
![]()
劉揚(yáng) 原力無限聯(lián)合創(chuàng)始人
當(dāng)行業(yè)興奮地談?wù)摼呱碇悄軙r(shí),我們究竟在談?wù)摍C(jī)器人能力的哪個(gè)階段?2025年,行業(yè)見證了單筆數(shù)億美元的巨額融資,也見證了技術(shù)路線從VLA到世界模型的快速迭代,但如何讓機(jī)器真正理解物理世界并作出可靠行動(dòng),仍是橫亙?cè)诶硐肱c現(xiàn)實(shí)之間的核心挑戰(zhàn)。
最近,原力無限聯(lián)合創(chuàng)始人劉揚(yáng)在第六屆中國(guó)機(jī)器人行業(yè)年會(huì)上,為狂奔的行業(yè)提供了一份冷靜的能力分級(jí)清單與一套聚焦閉環(huán)的破局方法論。本篇報(bào)道將完整梳理他的分享,看一家融合了頂尖學(xué)術(shù)研究與資深智駕工程經(jīng)驗(yàn)的團(tuán)隊(duì),如何嘗試為具身智能繪制一幅從現(xiàn)實(shí)場(chǎng)景反推的漸進(jìn)式技術(shù)路線圖。
▍認(rèn)知原點(diǎn):為具身智能厘定L0到L5的能力階梯
面對(duì)快速拓展的從機(jī)器人到具身智能的行業(yè)概念,劉揚(yáng)首先回歸本質(zhì),提出了一個(gè)關(guān)鍵框架。他借鑒自動(dòng)駕駛的分級(jí)邏輯,將具身智能也劃分為從L0到L5的漸進(jìn)式能力階梯。
“從L0到L5也是機(jī)器人從具備一些簡(jiǎn)單的能力,通過在本體、大腦,逐步往前演進(jìn),到逐漸接近人”他認(rèn)為,明確當(dāng)前技術(shù)所處的級(jí),不僅定義了從簡(jiǎn)單執(zhí)行到完全自主的終局,更關(guān)鍵的是,它為不同發(fā)展階段的企業(yè)指明了“此刻最應(yīng)攻克什么”的現(xiàn)實(shí)坐標(biāo)。
基于以上框架,原力無限將自身定位為以具身大腦為核心,開發(fā)通用與專用兩類機(jī)器人,并由該系統(tǒng)統(tǒng)一控制,以切入不同場(chǎng)景,推動(dòng)技術(shù)落地。
![]()
▍痛點(diǎn)診斷:傳統(tǒng)VLA為何難以實(shí)現(xiàn)可靠閉環(huán)?
在明確了目標(biāo)階梯后,劉揚(yáng)犀利地指出了當(dāng)前主流路徑VLA(視覺-語(yǔ)言-動(dòng)作模型)的內(nèi)在局限性。他認(rèn)為,盡管VLA火熱,但其本質(zhì)上仍是一種數(shù)據(jù)驅(qū)動(dòng)的、開環(huán)的記憶與關(guān)聯(lián)模型,這導(dǎo)致三大核心缺陷。
一是閉環(huán)能力缺失。執(zhí)行動(dòng)作后缺乏對(duì)結(jié)果的預(yù)測(cè)與反饋調(diào)整,無法形成“感知-推理-執(zhí)行”的完整閉環(huán);二是仿真與現(xiàn)實(shí)存在鴻溝。在仿真環(huán)境中訓(xùn)練的策略,難以直接遷移到復(fù)雜多變的真實(shí)物理世界;三是缺乏因果推理。模型無法進(jìn)行“反事實(shí)推斷”,即理解“如果不這樣做,結(jié)果會(huì)如何”,導(dǎo)致在動(dòng)態(tài)環(huán)境中適應(yīng)性差。
“如果沒有打通閉環(huán),后面所有要做的泛化和閉環(huán)的能力是很難去實(shí)現(xiàn)的。”劉揚(yáng)總結(jié)道。這構(gòu)成了他們所有技術(shù)探索的起點(diǎn):必須構(gòu)建一個(gè)能持續(xù)學(xué)習(xí)、具備因果理解并能穩(wěn)定泛化的閉環(huán)系統(tǒng)。
▍破局三徑:用持續(xù)學(xué)習(xí)與因果推斷重構(gòu)智能內(nèi)核
基于上述診斷,原力無限規(guī)劃了三條相互關(guān)聯(lián)的突破路徑,旨在為具身智能構(gòu)建一個(gè)更強(qiáng)大的“大腦”。
第一是開發(fā)可持續(xù)學(xué)習(xí)的Hyper-VLA。在自有Hyper-VLA基礎(chǔ)上,建立“Real2Sim2Real”的持續(xù)強(qiáng)化學(xué)習(xí)機(jī)制。其核心是讓模型能在真實(shí)與仿真世界間持續(xù)交互、進(jìn)化,并防止在學(xué)習(xí)新任務(wù)時(shí)遺忘舊技能,實(shí)現(xiàn)知識(shí)的有效積累與遷移。
第二是做因果世界模型(Causal World Model)。突破純數(shù)據(jù)驅(qū)動(dòng)范式,嘗試構(gòu)建能理解因果關(guān)系的世界模型。通過語(yǔ)言引導(dǎo)感知與推理,讓機(jī)器人不僅能看、能做,更能理解為什么要這么做,從而提升在未知場(chǎng)景中的泛化與決策能力。
第三是進(jìn)行VLA與世界模型的深度融合。這并非二選一,而是尋求將VLA的精確執(zhí)行能力與世界模型的推理泛化能力強(qiáng)擬合。目標(biāo)是打造一個(gè)“大腦”負(fù)責(zé)因果推理與規(guī)劃,“身體”負(fù)責(zé)精準(zhǔn)控制的協(xié)同架構(gòu),實(shí)現(xiàn)閉環(huán)自主進(jìn)化。
劉揚(yáng)坦誠(chéng),這些方向面臨巨大挑戰(zhàn),如高保真仿真環(huán)境的構(gòu)建、知識(shí)遷移中的遺忘問題等。公司正與學(xué)界及產(chǎn)業(yè)伙伴合作攻堅(jiān),并已走出實(shí)驗(yàn)室,在真實(shí)場(chǎng)景中驗(yàn)證迭代。
▍場(chǎng)景驗(yàn)證:以專用機(jī)器人實(shí)現(xiàn)商業(yè)閉環(huán),反哺通用智能
所有前沿技術(shù)最終需要價(jià)值的錨點(diǎn)。目前,原力無限FORCE系列專用機(jī)器人(為新能源汽車提供自動(dòng)充電服務(wù))已在超20城、200多個(gè)商業(yè)標(biāo)桿場(chǎng)景落地,效率提升3-4倍,服務(wù)于千家萬(wàn)戶,形成了健康的商業(yè)閉環(huán)。與此同時(shí),自研的通用人形機(jī)器人AD系列也在穩(wěn)步推進(jìn)。原力無限全年獲得訂單超4億元人民幣,在2025年10月,公司簽署單筆2.6億元人民幣具身智能商業(yè)訂單,創(chuàng)下全球同類賽道最大單筆紀(jì)錄,此外,多款產(chǎn)品將在明年初陸續(xù)發(fā)布。
這種“專用與通用并舉”的策略,揭示了他們的核心邏輯:聚焦具身大腦研發(fā),助力本體場(chǎng)景落地,定義下一代具身智能——以專用場(chǎng)景的商業(yè)化落地,驗(yàn)證技術(shù)、積累數(shù)據(jù)與資本,同時(shí)以通用機(jī)器人的研發(fā),探索技術(shù)邊界與未來范式。
![]()
▍范式啟示:長(zhǎng)跑中的耐心與聚焦
劉揚(yáng)的分享,為行業(yè)提供了一種稀缺的系統(tǒng)工程視角:不為追逐單一技術(shù)熱點(diǎn),而是為整個(gè)理解與執(zhí)行的黑箱問題,繪制一份需要長(zhǎng)期填寫的技術(shù)清單。
他們的實(shí)踐表明,在具身智能這場(chǎng)注定漫長(zhǎng)的競(jìng)賽中,勝利或許屬于那些能同時(shí)做好兩件事的團(tuán)隊(duì):一是以嚴(yán)謹(jǐn)?shù)墓こ谭椒ㄕ摚瑢⒑甏蟮闹悄茉妇胺纸鉃榭芍饌€(gè)擊破的技術(shù)模塊;二是始終保持對(duì)真實(shí)場(chǎng)景的敬畏,在解決具體問題的閉環(huán)中,讓技術(shù)獲得持續(xù)進(jìn)化的燃料。這不僅是原力無限的路徑,也可能是在通往通用智能道路上,一種更為穩(wěn)健的生存與發(fā)展哲學(xué)。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.