![]()
智東西
作者 | 程茜
作者 | 漠影
智東西1月12日?qǐng)?bào)道,今日,千尋智能正式開(kāi)源具身大模型Spirit v1.5,就在前一天,該模型在全球具身智能模型評(píng)測(cè)平臺(tái)RoboChallenge上,綜合評(píng)測(cè)斬獲第一。
RoboChallenge的基準(zhǔn)測(cè)試包含30項(xiàng)任務(wù),包括擺放薯?xiàng)l、尋找固定顏色物體、貼膠帶等30項(xiàng)任務(wù),Spirit-1.5綜合得分為66.09分,成功率達(dá)到50.33%,也是唯一一個(gè)成功率超過(guò)50%的模型。這些任務(wù)涵蓋了機(jī)器人一系列日常技能,考驗(yàn)的正是機(jī)器人在陌生環(huán)境的泛化能力。
![]()
榜單截圖
這一成績(jī)意味著,其超越了已經(jīng)霸榜RoboChallenge數(shù)月之久的Pi0.5模型。Pi0.5由美國(guó)機(jī)器人創(chuàng)企Physical Intelligence于2025年4月發(fā)布,以能讓機(jī)器人在全新環(huán)境中執(zhí)行復(fù)雜家務(wù)任務(wù)而引起熱議。
RoboChallenge榜單由Dexmal原力靈機(jī)、Hugging Face全球知名機(jī)構(gòu)聯(lián)合發(fā)起,是全球首個(gè)專為具身智能機(jī)器人量身打造的大規(guī)模真機(jī)評(píng)測(cè)平臺(tái),主打讓機(jī)器人直接在真實(shí)物理世界里硬碰硬,檢驗(yàn)?zāi)P偷膶?shí)戰(zhàn)泛化能力。
從Pi0.5霸榜時(shí)間之久也可以看出,其在真機(jī)實(shí)測(cè)領(lǐng)域的絕對(duì)實(shí)力。但值得注意的是,此次Spirit v1.5并不是靠某一項(xiàng)獨(dú)門絕技勝過(guò)Pi0.5,而是實(shí)現(xiàn)了綜合能力全面超車,這也意味著國(guó)產(chǎn)具身智能玩家,正式?jīng)_進(jìn)全球第一梯隊(duì)的核心圈。
為了證明榜單成績(jī)來(lái)自自研模型且真實(shí)有效,千尋智能已經(jīng)同步開(kāi)源了Spirit v1.5的基模權(quán)重、推理代碼、使用樣例。
核心代碼開(kāi)源地址:
https://github.com/Spirit-AI-Team/spirit-v1.5
模型開(kāi)源地址:
https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5
技術(shù)博客:
https://www.spirit-ai.com/en/blog/spirit-v1-5
一、30大貼近真實(shí)場(chǎng)景實(shí)操任務(wù),Spirit v1.5多項(xiàng)實(shí)操任務(wù)完勝Pi0.5
實(shí)戰(zhàn)見(jiàn)真章,在RoboChallenge的30項(xiàng)任務(wù)中,可以看到在下面幾項(xiàng)任務(wù),Spirit v1.5和Pi0.5的直觀對(duì)比。
首先是讓機(jī)器人往紙箱上貼膠布。Spirit v1.5使得機(jī)器人一下子就精準(zhǔn)找到了膠布的位置,兩只手配合操作成功將膠布貼到了紙箱上,但Pi0.5經(jīng)過(guò)多次嘗試,也沒(méi)能將膠布撕下。
Spirit v1.5模型實(shí)測(cè)過(guò)程(左)、Pi0.5模型實(shí)測(cè)過(guò)程(右)
在擺放物體的任務(wù)中,可以看到綠色物體被壓在最下方。Pi0.5模型會(huì)先將黃色物體放入箱子,待綠色物體露出后再精準(zhǔn)拾取;而Spirit v1.5則是直接在堆疊的物品中主動(dòng)搜尋綠色物體,沒(méi)有拾取錯(cuò)誤顏色的物品。
Spirit v1.5模型實(shí)測(cè)過(guò)程(左)、Pi0.5模型實(shí)測(cè)過(guò)程(右)
插花任務(wù)中,Pi0.5不能識(shí)別到瓶口,將花插進(jìn)去,而是橫放在了花瓶上,Spirit v1.5能通過(guò)移動(dòng)關(guān)節(jié),保證花保持豎直,并被插入花瓶中。
Spirit v1.5模型實(shí)測(cè)過(guò)程(左)、Pi0.5模型實(shí)測(cè)過(guò)程(右)
移動(dòng)物體時(shí),Spirit v1.5可以精準(zhǔn)抓取到物品然后放到箱子里,但Pi0.5在執(zhí)行任務(wù)時(shí),無(wú)法判斷自己是否已經(jīng)抓取到相應(yīng)物品,而是機(jī)械操作固定步驟,也不能根據(jù)實(shí)際場(chǎng)景判斷抬升高度,確保物體順利放入箱內(nèi)。
Spirit v1.5模型實(shí)測(cè)過(guò)程(左)、Pi0.5模型實(shí)測(cè)過(guò)程(右)
不難看出,貼膠布、物品拾取、插花、移動(dòng)物體這類貼近實(shí)際應(yīng)用場(chǎng)景的機(jī)器人實(shí)操任務(wù),是實(shí)打?qū)崣z驗(yàn)技術(shù)落地能力的關(guān)鍵。
其既可以驗(yàn)證機(jī)器人在真實(shí)環(huán)境中的感知、抓取、協(xié)同操作等核心功能的實(shí)際表現(xiàn),也能直觀暴露技術(shù)短板,為后續(xù)技術(shù)迭代、優(yōu)化產(chǎn)品落地方案提供可落地、可復(fù)刻的真實(shí)測(cè)試依據(jù),更對(duì)機(jī)器人技術(shù)落地及技術(shù)有效性有重要意義。
這也恰恰印證了該榜單的核心參考意義。
RoboChallenge的來(lái)頭不小,其于2025年成立,由Dexmal、Hugging Face海內(nèi)外具身智能領(lǐng)域知名機(jī)構(gòu)聯(lián)合發(fā)起。這一榜單通過(guò)真機(jī)測(cè)試評(píng)估模型在物理世界的泛化性,是具身智能領(lǐng)域少數(shù)以真實(shí)物理任務(wù)為核心的評(píng)測(cè)體系。
其中的30項(xiàng)測(cè)試任務(wù)正是針對(duì)傳統(tǒng)機(jī)器人測(cè)試場(chǎng)景碎片化、標(biāo)準(zhǔn)不統(tǒng)一,測(cè)試結(jié)果難以開(kāi)展橫向比較的行業(yè)痛點(diǎn),RoboChallenge通過(guò)制定統(tǒng)一的任務(wù)標(biāo)準(zhǔn)與評(píng)估指標(biāo),搭建跨模型對(duì)照機(jī)制,構(gòu)建起一套開(kāi)放、公正的具身智能評(píng)測(cè)體系,形成針對(duì)性解決方案。
更為關(guān)鍵的是,這一平臺(tái)可供全球研究者免費(fèi)使用,還會(huì)公開(kāi)任務(wù)數(shù)據(jù)與中間結(jié)果。
RoboChallenge榜單是具身智能飛速發(fā)展、落地加速的同時(shí),行業(yè)對(duì)標(biāo)準(zhǔn)化評(píng)測(cè)的迫切需求催生出的硬核成果,也是給全球玩家實(shí)力較量搭起的公平擂臺(tái),更凸顯出國(guó)產(chǎn)具身大模型登頂?shù)暮鹆俊?/p>
二、Spirit v1.5登頂背后,破解機(jī)器人泛化能力的核心密碼
要拆解Spirit v1.5高光表現(xiàn)背后的原因,首先需要破解制約機(jī)器人泛化能力的核心難題。
此前,各家機(jī)器人創(chuàng)企秀機(jī)器人技能時(shí),很多機(jī)器人已能完成在全新環(huán)境疊衣服、清潔廚房等長(zhǎng)序列復(fù)雜任務(wù),大規(guī)模VLA(視覺(jué)-語(yǔ)言-動(dòng)作)模型正逐步展現(xiàn)出真正的物理智能。
但這一亮眼表現(xiàn)背后,卻暗藏著關(guān)鍵技術(shù)隱患:不少業(yè)界頂尖模型在訓(xùn)練階段,會(huì)對(duì)數(shù)據(jù)進(jìn)行嚴(yán)苛的預(yù)處理,雖能降低機(jī)器人模仿人類操作的難度,卻也大幅限制了其實(shí)際的泛化能力。
因此,Spirit v1.5的核心就是,讓機(jī)器人在預(yù)訓(xùn)練時(shí)轉(zhuǎn)向使用多樣化的、很大程度上不受控的數(shù)據(jù),通過(guò)從這類貼近現(xiàn)實(shí)世界的混亂數(shù)據(jù)中學(xué)習(xí),大幅提升機(jī)器人應(yīng)對(duì)真實(shí)家庭環(huán)境中各類不可預(yù)測(cè)場(chǎng)景的能力。
千尋智能通過(guò)開(kāi)放式、目標(biāo)驅(qū)動(dòng)的數(shù)據(jù)采集,讓操作員以某個(gè)目標(biāo)為前提即興發(fā)揮。例如數(shù)據(jù)采集員的目標(biāo)是“今天我要用機(jī)器人清理廚房臺(tái)面”、“給假人模特化妝”,但操作員如何規(guī)劃子任務(wù)、任務(wù)執(zhí)行順序等都完全隨機(jī)。
通過(guò)這種方式構(gòu)建數(shù)據(jù)集的優(yōu)勢(shì)在于:能實(shí)現(xiàn)數(shù)據(jù)的高度多樣性讓機(jī)器人習(xí)得更多物理常識(shí),還具備更強(qiáng)可擴(kuò)展性。
在多樣性層面,依托數(shù)據(jù)操作員的實(shí)際執(zhí)行過(guò)程,其會(huì)包含海量的物體交互、軌跡和環(huán)境轉(zhuǎn)換,會(huì)在短時(shí)間的操作中,包含拾取、放置、打開(kāi)容器、打掃房間、野外導(dǎo)航等互相交織的數(shù)據(jù)。
這樣一來(lái),機(jī)器人就不是機(jī)械學(xué)習(xí)某個(gè)單項(xiàng)任務(wù)的執(zhí)行,而是通過(guò)學(xué)習(xí)整套技能及執(zhí)行的前后順序,得到更具通用性的知識(shí)與能力。
在可擴(kuò)展性層面,其數(shù)據(jù)集不需要為每個(gè)場(chǎng)景精心設(shè)備并定義詳細(xì)任務(wù)指導(dǎo),便能在不線性增加管理成本的前提下,高效擴(kuò)展數(shù)據(jù)采集規(guī)模。根據(jù)千尋智能內(nèi)部實(shí)測(cè),采用這種方法,人均有效采集時(shí)長(zhǎng)增加了200%,并將對(duì)算法專家的干預(yù)需求削減了60%。
為了用數(shù)據(jù)說(shuō)明這種數(shù)據(jù)集采集范式的有效性,千尋智能建立了兩組模型進(jìn)行對(duì)比,一組是在包含30個(gè)精選演示任務(wù)的數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練,一組在開(kāi)放式多樣化采集的數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練。
這兩組模型在全新的、未顯式出現(xiàn)在任一預(yù)訓(xùn)練集中的任務(wù)上進(jìn)行微調(diào),結(jié)果顯示,多樣化模型達(dá)到相同性能所需的迭代次數(shù)比基線模型少了40%。
![]()
與此同時(shí),其還發(fā)現(xiàn)模型的遷移效率與多樣化數(shù)據(jù)量呈顯著正相關(guān):隨著數(shù)據(jù)集規(guī)模的持續(xù)增長(zhǎng),模型在新任務(wù)中的驗(yàn)證誤差不斷下降,這也印證了模型正高效習(xí)得從現(xiàn)實(shí)世界的豐富內(nèi)在多樣性中自主學(xué)習(xí)的能力。
![]()
這樣的實(shí)驗(yàn)結(jié)果證明了,使用高多樣性、弱控制數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的可行性與有效性,為具身智能模型的研發(fā)提供了全新的實(shí)踐依據(jù)。
三、突破傳統(tǒng)數(shù)據(jù)瓶頸,Spirit v1.5定調(diào)技術(shù)新方向
當(dāng)下具身智能行業(yè)的演進(jìn)節(jié)奏持續(xù)加快,從產(chǎn)業(yè)端到技術(shù)端,國(guó)內(nèi)具身智能正持續(xù)在全球舞臺(tái)展現(xiàn)硬實(shí)力。
在剛剛結(jié)束的全球最具影響力的科技盛會(huì)之一、“年度科技風(fēng)向標(biāo)”國(guó)際消費(fèi)電子展CES 2026上,國(guó)產(chǎn)人形機(jī)器人驚艷亮相、強(qiáng)勢(shì)出圈,再加上此次Spirit v1.5又登頂權(quán)威評(píng)測(cè)榜單,國(guó)內(nèi)玩家在全球具身智能賽道的話語(yǔ)權(quán)與行業(yè)影響力穩(wěn)步提升。
在具身智能走向行業(yè)落地的關(guān)鍵階段,技術(shù)路線與創(chuàng)新架構(gòu)不斷推新,從VLA架構(gòu)到認(rèn)知-動(dòng)作一體化架構(gòu),從單模態(tài)感知到多傳感器融合,賽道技術(shù)探索百花齊放,而權(quán)威榜單的位次更迭,正是行業(yè)技術(shù)創(chuàng)新螺旋式上升的直觀體現(xiàn)。
此次Spirit v1.5的領(lǐng)先,正是其技術(shù)優(yōu)勢(shì)的集中釋放,核心依托于模型在泛化性、穩(wěn)定性、魯棒性等核心系統(tǒng)能力上的全面突破。
其創(chuàng)新采用高多樣性、弱約束的開(kāi)放式數(shù)據(jù)采集范式,讓模型突破了傳統(tǒng)“干凈”數(shù)據(jù)的瓶頸,使得模型能在全新非結(jié)構(gòu)化場(chǎng)景中靈活應(yīng)對(duì)各類不可預(yù)測(cè)性。
需要注意的是,大模型領(lǐng)域的榜單更迭頻發(fā),但具身智能賽道的位次變化,尤其此次Spirit v1.5登頂權(quán)威榜單,絕非單純的技術(shù)參數(shù)比拼,更不是短期算法調(diào)優(yōu)的結(jié)果,而是對(duì)模型全鏈路技術(shù)路線的系統(tǒng)性驗(yàn)證,更是其在泛化能力、工程落地性、場(chǎng)景適配性等核心維度的綜合實(shí)力體現(xiàn)。
此次,千尋智能Spirit v1.5登頂,證明其不僅已經(jīng)成為中國(guó)具身智能模型最強(qiáng)力量,達(dá)到世界級(jí)水準(zhǔn),更標(biāo)志著中國(guó)具身模型正式站上全球舞臺(tái),與世界頂尖模型同臺(tái)角逐、比肩競(jìng)技。
從更宏觀層面來(lái)看,綜合實(shí)力的提升,往往會(huì)與吸引頂尖人才、生態(tài)合作伙伴等這類長(zhǎng)期價(jià)值的實(shí)現(xiàn)相輔相成。
因此,這一成果不僅能為千尋智能吸引全球頂尖的技術(shù)人才,進(jìn)一步提升其在行業(yè)內(nèi)的技術(shù)影響力,更能推動(dòng)其與產(chǎn)業(yè)鏈上下游的生態(tài)合作深化,為技術(shù)的快速迭代、機(jī)器人本體的產(chǎn)品化落地筑牢基礎(chǔ),也為國(guó)內(nèi)具身智能賽道的技術(shù)演進(jìn)提供了可參考的實(shí)踐范式,助力國(guó)內(nèi)具身智能產(chǎn)業(yè)從技術(shù)突破向規(guī)模化落地加速邁進(jìn)。
結(jié)語(yǔ):中國(guó)具身智能的進(jìn)階之路
我國(guó)具身智能產(chǎn)業(yè)正處于從技術(shù)探索邁向規(guī)模化落地關(guān)鍵期,疊加工業(yè)基礎(chǔ)、供應(yīng)鏈集成能力和場(chǎng)景密度的獨(dú)特優(yōu)勢(shì),以Spirit v1.5為代表的技術(shù)突破,正加速具身智能突破技術(shù)邊界,圍繞具身通用大腦的能力探索不斷進(jìn)階,以技術(shù)進(jìn)化加速具身通用大腦的成熟,最終推動(dòng)具身智能全面走進(jìn)千家萬(wàn)戶、融入日常生活。
未來(lái)隨著技術(shù)的不斷成熟與生態(tài)的持續(xù)完善,中國(guó)具身智能產(chǎn)業(yè)不僅能在全球競(jìng)爭(zhēng)中鞏固領(lǐng)先優(yōu)勢(shì),更將開(kāi)辟全新增長(zhǎng)空間。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.