![]()
ROBOT INDUSTRY
當(dāng)行業(yè)熱衷于展示炫酷Demo時(shí),跨維智能已悄然將具身智能技術(shù)帶入上百個(gè)真實(shí)場(chǎng)景,實(shí)現(xiàn)億元級(jí)營(yíng)收。這家公司從“具身大腦”起步,堅(jiān)持仿真到現(xiàn)實(shí)的技術(shù)鐵律,逐步“長(zhǎng)出”身體,并開(kāi)源核心平臺(tái)。其選擇背后,是一條從技術(shù)理想主義通向規(guī)模商業(yè)化的獨(dú)特路徑。
早在2021年,當(dāng)“具身智能”還僅是學(xué)術(shù)圈的前沿概念時(shí),跨維(深圳)智能數(shù)字科技有限公司(以下簡(jiǎn)稱“跨維智能”)便已成立。跨維智能創(chuàng)始人、香港中文大學(xué)(深圳)教授賈奎的初衷并非追逐風(fēng)口,而是解決一個(gè)根本問(wèn)題:如何讓AI理解并處理三維物理世界的信號(hào)。他洞察到,泛智能制造場(chǎng)景對(duì)自動(dòng)化、柔性化的剛性需求,與具身智能的技術(shù)特性天然契合。這一定位,讓跨維智能從誕生之初就避開(kāi)了純技術(shù)演示,直指“創(chuàng)造勞動(dòng)力價(jià)值”的商業(yè)核心。
![]()
圖1 跨維智能創(chuàng)始人、香港中文大學(xué)(深圳)教授 賈奎
跨維智能CMO林嘉偉將這條路徑形容為“沿途下蛋”:“跨維智能沒(méi)有一開(kāi)始就押注人形機(jī)器人整機(jī),而是先從泛智能制造場(chǎng)景最急需的3D視覺(jué)感知與‘具身大腦’切入,用明確的產(chǎn)品為客戶降本增效。當(dāng)技術(shù)基座與市場(chǎng)認(rèn)知成熟后,才順勢(shì)推出自研的Dexbot人形機(jī)器人系列,進(jìn)軍商業(yè)服務(wù)等更加開(kāi)放的場(chǎng)景。”
1
以Sim2Real為基,構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的世界模型
![]()
“具身智能所需的數(shù)據(jù)是多模態(tài)的——涉及視覺(jué)、力覺(jué)、觸覺(jué),以及機(jī)器人本體的動(dòng)作和電機(jī)信號(hào),而且是絕對(duì)三維和物理的,”賈奎指出,“這類數(shù)據(jù)在互聯(lián)網(wǎng)上幾乎不存在。”真機(jī)采集路徑成本高企,無(wú)法啟動(dòng)驅(qū)動(dòng)AI進(jìn)化的“縮放定律”,這成為制約行業(yè)發(fā)展的根本瓶頸。
跨維智能的答案,是自研基于生成式仿真的世界模型(GS-World)。其核心并非簡(jiǎn)單地復(fù)刻現(xiàn)實(shí)世界的表象,而是從底層對(duì)物理規(guī)律進(jìn)行數(shù)學(xué)建模,在虛擬世界中高效生成海量符合牛頓力學(xué)的高保真合成數(shù)據(jù)。“仿真的核心是讓交互符合物理規(guī)律,”林嘉偉解釋道,“我們通過(guò)可微仿真等技術(shù)在底層做了大量工作,確保合成數(shù)據(jù)可用于模型訓(xùn)練并可部署于真機(jī)操作。”
![]()
圖2 跨維智能CMO 林嘉偉
作為技術(shù)底座的DexVerse引擎,在“模擬真實(shí)”與“計(jì)算效率”間取得了工程化平衡,無(wú)需追求對(duì)某個(gè)具體場(chǎng)景每一處細(xì)節(jié)的完美復(fù)刻,而是通過(guò)算法高效制造出足夠多樣化的數(shù)據(jù),以覆蓋任務(wù)的數(shù)據(jù)分布,從而實(shí)現(xiàn)泛化能力。這種能力,使得跨維智能能將傳統(tǒng)自動(dòng)化中長(zhǎng)達(dá)數(shù)月的現(xiàn)場(chǎng)部署調(diào)試周期縮短90%以上,實(shí)現(xiàn)了“虛擬到現(xiàn)實(shí)”的高效遷移。
面對(duì)“仿真與現(xiàn)實(shí)存在差距”的質(zhì)疑,賈奎的回應(yīng)直指問(wèn)題核心:“真機(jī)數(shù)據(jù)之間同樣存在差距。問(wèn)題的關(guān)鍵不在于復(fù)刻某個(gè)具體場(chǎng)景的每一個(gè)細(xì)節(jié),而在于能否生成足夠多樣化的數(shù)據(jù)來(lái)覆蓋任務(wù)的數(shù)據(jù)分布。”跨維智能的實(shí)踐表明,當(dāng)仿真數(shù)據(jù)在物理規(guī)律上足夠嚴(yán)謹(jǐn),且在多樣性上遠(yuǎn)超有限的真機(jī)采集時(shí),模型在現(xiàn)實(shí)世界中的表現(xiàn)反而更具魯棒性和泛化性。
2
“沿途下蛋”與“AI定義”的務(wù)實(shí)哲學(xué)
![]()
跨維智能的產(chǎn)品路線圖,生動(dòng)詮釋了其“沿途下蛋”的務(wù)實(shí)策略。聚焦于泛智能制造場(chǎng)景的“眼睛”和“大腦”,跨維智能推出了自研的純視覺(jué)3D傳感器(DexSense)和“具身智能大腦”軟件(PickWiz/XWiz)。
林嘉偉表示,跨維智能的解決方案,使得傳統(tǒng)工業(yè)機(jī)械臂和協(xié)作機(jī)器人瞬間獲得了柔性作業(yè)能力,迅速在汽車零配件、3C電子、家電等幾十個(gè)細(xì)分行業(yè)的上下料、分揀、裝配等環(huán)節(jié)落地,服務(wù)超千個(gè)項(xiàng)目,帶來(lái)了穩(wěn)定的億元級(jí)營(yíng)收基本盤(pán),也完成了核心技術(shù)在嚴(yán)苛工業(yè)環(huán)境下的驗(yàn)證與迭代。
當(dāng)技術(shù)基座與市場(chǎng)對(duì)更通用自動(dòng)化需求同步成熟時(shí),跨維智能順理成章地“長(zhǎng)出了身體”,于2024年發(fā)布自研人形機(jī)器人Dexbot W1系列。對(duì)于采用“輪式底盤(pán)+人形上身”的構(gòu)型,林嘉偉的解讀充滿成本與工程考量:在工廠、商場(chǎng)等室內(nèi)半結(jié)構(gòu)化環(huán)境中,輪式在移動(dòng)效率、成本、穩(wěn)定性和續(xù)航上都優(yōu)于雙足,這也符合公司聚焦上半身靈巧操作的技術(shù)基因。
![]()
圖3 跨維智能DexForce W1 Pro
在設(shè)計(jì)DexForce W1 Pro時(shí),團(tuán)隊(duì)將機(jī)器人的構(gòu)型參數(shù)作為可優(yōu)化的變量,置入DexVerse仿真環(huán)境。針對(duì)目標(biāo)場(chǎng)景任務(wù)庫(kù),以任務(wù)成功率、能耗、成本等為綜合目標(biāo)函數(shù),通過(guò)強(qiáng)化學(xué)習(xí)和可微優(yōu)化反向推導(dǎo)出更優(yōu)的硬件設(shè)計(jì)參數(shù)。
“這類似于在虛擬世界中進(jìn)行‘機(jī)械進(jìn)化’,”賈奎闡述道,盡管最終設(shè)計(jì)還需結(jié)合供應(yīng)鏈現(xiàn)實(shí),但這一本體設(shè)計(jì)流程從根本上改變了傳統(tǒng)“先設(shè)計(jì)硬件,再編寫(xiě)軟件”的機(jī)器人開(kāi)發(fā)模式,實(shí)現(xiàn)了硬件為AI能力深度定制。
產(chǎn)品矩陣的模塊化設(shè)計(jì)進(jìn)一步體現(xiàn)了商業(yè)化思維。DexForce W1 Pro版移除了移動(dòng)底盤(pán),針對(duì)固定工位場(chǎng)景提供更高性價(jià)比選擇,降低了客戶嘗試門(mén)檻。林嘉偉指出,人形機(jī)器人規(guī)模化的核心成本壁壘,并非硬件BOM成本,而是部署調(diào)試的“軟成本”。因此,跨維智能致力于降低對(duì)現(xiàn)場(chǎng)工程師的依賴,避免陷入傳統(tǒng)自動(dòng)化項(xiàng)目制“人海戰(zhàn)術(shù)”的泥潭。
3
深耕工業(yè)與拓荒服務(wù)的雙輪驅(qū)動(dòng)
![]()
賈奎基于對(duì)產(chǎn)業(yè)自動(dòng)化程度的洞察,將泛智能制造場(chǎng)景鎖定為創(chuàng)業(yè)初期的突破口。“工廠對(duì)提升效率、解決人力難題的需求非常剛性且迫切。只要技術(shù)能達(dá)到或超過(guò)人類的效率,其投資回報(bào)率計(jì)算就非常清晰。”他回憶道。在2021—2022年行業(yè)冷啟動(dòng)期,團(tuán)隊(duì)正是依靠深入工廠一線,用原型系統(tǒng)演示真實(shí)的降本增效價(jià)值,才贏得了早期客戶,甚至不計(jì)成本進(jìn)行概念驗(yàn)證。
![]()
圖4 跨維智能人形機(jī)器人在多個(gè)場(chǎng)景應(yīng)用
工業(yè)領(lǐng)域的成功,為跨維智能樹(shù)立了“解決問(wèn)題”而非“展示技術(shù)”的市場(chǎng)形象。他們的“大腦”軟件適配了主流機(jī)械臂品牌,解決了柔性生產(chǎn)中最棘手的“小批量、多品種”問(wèn)題。在新能源電池模組的復(fù)雜裝配、戶外物流園區(qū)的無(wú)序分揀等場(chǎng)景中,跨維智能的解決方案實(shí)現(xiàn)了行業(yè)首例的落地應(yīng)用。這背后,是DexVerse引擎支撐的快速場(chǎng)景適配能力——通過(guò)對(duì)通用基座模型進(jìn)行自動(dòng)化微調(diào),能在數(shù)天內(nèi)針對(duì)新工件、新環(huán)境完成模型優(yōu)化,滿足工業(yè)客戶對(duì)穩(wěn)定性、節(jié)拍和近乎100%成功率的嚴(yán)苛要求。
在夯實(shí)工業(yè)基本盤(pán)的同時(shí),跨維智能基于同一技術(shù)基座,開(kāi)辟了商業(yè)服務(wù)這一第二增長(zhǎng)曲線。Dexbot W1系列作為軟硬一體平臺(tái),被投入咖啡制作、飲品售賣、文旅導(dǎo)覽等場(chǎng)景。
林嘉偉闡釋了其邏輯:商業(yè)服務(wù)場(chǎng)景對(duì)絕對(duì)效率的要求低于泛智能制造場(chǎng)景,但更注重人機(jī)交互體驗(yàn)與商業(yè)模式閉環(huán),是驗(yàn)證人形機(jī)器人通用性、走近普通消費(fèi)者的理想試驗(yàn)場(chǎng)。目前,跨維的機(jī)器人已在廣州等核心城市實(shí)現(xiàn)常態(tài)化運(yùn)營(yíng),服務(wù)數(shù)萬(wàn)名顧客。
對(duì)于未來(lái)規(guī)模化應(yīng)用的行業(yè)判斷,林嘉偉給出了三個(gè)方向:商業(yè)服務(wù)、文旅導(dǎo)覽,以及需要“巡檢+簡(jiǎn)單操作”的復(fù)合場(chǎng)景。賈奎則從更宏觀的產(chǎn)業(yè)視角補(bǔ)充,汽車、3C等高端制造業(yè)仍將是自動(dòng)化需求最前沿的領(lǐng)域,但人形機(jī)器人在這類高度結(jié)構(gòu)化產(chǎn)線中的獨(dú)特價(jià)值,將體現(xiàn)在需要雙臂協(xié)同、全身協(xié)調(diào)的復(fù)雜裝配環(huán)節(jié),而非替代現(xiàn)有的成熟工位。
4
開(kāi)源、協(xié)同,通往通用智能的未來(lái)
![]()
在構(gòu)建自身商業(yè)版圖的同時(shí),跨維智能正將目光投向更廣闊的行業(yè)生態(tài),其開(kāi)源的EmbodiChain平臺(tái),意味著全球首個(gè)用100%生成式數(shù)據(jù)自動(dòng)訓(xùn)練具身智能模型的“數(shù)據(jù)流水線”誕生。
在EmbodiChain的架構(gòu)中,跨維智能不使用任何真實(shí)數(shù)據(jù)訓(xùn)練模型,其結(jié)果是它在操作成功率上大幅領(lǐng)先部分主流方法,并且即使研究人員像“搗亂者”一樣更換桌布、移動(dòng)物體、改變光照,模型依然穩(wěn)定,甚至在某些任務(wù)中,由于去除了容易過(guò)擬合的背景噪聲,模型的表現(xiàn)反而比用真實(shí)數(shù)據(jù)訓(xùn)練還要好。
![]()
圖5 跨維智能亮相多地行業(yè)展會(huì)
賈奎對(duì)開(kāi)源有著深刻的認(rèn)知:“如果數(shù)據(jù)問(wèn)題不解決,行業(yè)無(wú)法做大。”他預(yù)見(jiàn),當(dāng)生成式仿真成為主流,數(shù)據(jù)將逐步“平權(quán)”,企業(yè)的核心競(jìng)爭(zhēng)力將轉(zhuǎn)向?qū)夹g(shù)范式的深刻理解、產(chǎn)品化工程能力以及在垂直場(chǎng)景中構(gòu)建完整解決方案的速度。
開(kāi)源EmbodiChain,是希望降低行業(yè)門(mén)檻,吸引更多開(kāi)發(fā)者和研究者共同完善具身智能的基礎(chǔ)設(shè)施,就像移動(dòng)互聯(lián)網(wǎng)時(shí)代的安卓系統(tǒng),最終催生出繁榮的應(yīng)用生態(tài)。
賈奎判斷,真正基于三維物理的“世界模型”將成為技術(shù)競(jìng)爭(zhēng)的焦點(diǎn),而更自然、更低成本的真人動(dòng)作數(shù)據(jù)采集方式也將出現(xiàn)。
閱讀更多內(nèi)容,歡迎訂購(gòu)《機(jī)器人產(chǎn)業(yè)》雜志。
點(diǎn)擊跳轉(zhuǎn)!圈內(nèi)人都在看的專家觀點(diǎn)
![]()
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.