網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

具身智能DeepSeek時(shí)刻！千尋智能模型開(kāi)源即登頂全球榜單

2026-01-12 12:44:12　來(lái)源: 智東西

北京舉報(bào)

分享至

智東西

作者 | 程茜

作者 | 漠影

智東西1月12日?qǐng)?bào)道，今日，千尋智能正式開(kāi)源具身大模型Spirit v1.5，就在前一天，該模型在全球具身智能模型評(píng)測(cè)平臺(tái)RoboChallenge上，綜合評(píng)測(cè)斬獲第一。

RoboChallenge的基準(zhǔn)測(cè)試包含30項(xiàng)任務(wù)，包括擺放薯?xiàng)l、尋找固定顏色物體、貼膠帶等30項(xiàng)任務(wù)，Spirit-1.5綜合得分為66.09分，成功率達(dá)到50.33%，也是唯一一個(gè)成功率超過(guò)50%的模型。這些任務(wù)涵蓋了機(jī)器人一系列日常技能，考驗(yàn)的正是機(jī)器人在陌生環(huán)境的泛化能力。

榜單截圖

這一成績(jī)意味著，其超越了已經(jīng)霸榜RoboChallenge數(shù)月之久的Pi0.5模型。Pi0.5由美國(guó)機(jī)器人創(chuàng)企Physical Intelligence于2025年4月發(fā)布，以能讓機(jī)器人在全新環(huán)境中執(zhí)行復(fù)雜家務(wù)任務(wù)而引起熱議。

RoboChallenge榜單由Dexmal原力靈機(jī)、Hugging Face全球知名機(jī)構(gòu)聯(lián)合發(fā)起，是全球首個(gè)專為具身智能機(jī)器人量身打造的大規(guī)模真機(jī)評(píng)測(cè)平臺(tái)，主打讓機(jī)器人直接在真實(shí)物理世界里硬碰硬，檢驗(yàn)?zāi)Ｐ偷膶?shí)戰(zhàn)泛化能力。

從Pi0.5霸榜時(shí)間之久也可以看出，其在真機(jī)實(shí)測(cè)領(lǐng)域的絕對(duì)實(shí)力。但值得注意的是，此次Spirit v1.5并不是靠某一項(xiàng)獨(dú)門絕技勝過(guò)Pi0.5，而是實(shí)現(xiàn)了綜合能力全面超車，這也意味著國(guó)產(chǎn)具身智能玩家，正式?jīng)_進(jìn)全球第一梯隊(duì)的核心圈。

為了證明榜單成績(jī)來(lái)自自研模型且真實(shí)有效，千尋智能已經(jīng)同步開(kāi)源了Spirit v1.5的基模權(quán)重、推理代碼、使用樣例。

核心代碼開(kāi)源地址：

https://github.com/Spirit-AI-Team/spirit-v1.5

模型開(kāi)源地址：

https://huggingface.co/Spirit-AI-robotics/Spirit-v1.5

技術(shù)博客：

https://www.spirit-ai.com/en/blog/spirit-v1-5

一、30大貼近真實(shí)場(chǎng)景實(shí)操任務(wù)，Spirit v1.5多項(xiàng)實(shí)操任務(wù)完勝Pi0.5

實(shí)戰(zhàn)見(jiàn)真章，在RoboChallenge的30項(xiàng)任務(wù)中，可以看到在下面幾項(xiàng)任務(wù)，Spirit v1.5和Pi0.5的直觀對(duì)比。

首先是讓機(jī)器人往紙箱上貼膠布。Spirit v1.5使得機(jī)器人一下子就精準(zhǔn)找到了膠布的位置，兩只手配合操作成功將膠布貼到了紙箱上，但Pi0.5經(jīng)過(guò)多次嘗試，也沒(méi)能將膠布撕下。

Spirit v1.5模型實(shí)測(cè)過(guò)程（左）、Pi0.5模型實(shí)測(cè)過(guò)程（右）

在擺放物體的任務(wù)中，可以看到綠色物體被壓在最下方。Pi0.5模型會(huì)先將黃色物體放入箱子，待綠色物體露出后再精準(zhǔn)拾取；而Spirit v1.5則是直接在堆疊的物品中主動(dòng)搜尋綠色物體，沒(méi)有拾取錯(cuò)誤顏色的物品。

Spirit v1.5模型實(shí)測(cè)過(guò)程（左）、Pi0.5模型實(shí)測(cè)過(guò)程（右）

插花任務(wù)中，Pi0.5不能識(shí)別到瓶口，將花插進(jìn)去，而是橫放在了花瓶上，Spirit v1.5能通過(guò)移動(dòng)關(guān)節(jié)，保證花保持豎直，并被插入花瓶中。

Spirit v1.5模型實(shí)測(cè)過(guò)程（左）、Pi0.5模型實(shí)測(cè)過(guò)程（右）

移動(dòng)物體時(shí)，Spirit v1.5可以精準(zhǔn)抓取到物品然后放到箱子里，但Pi0.5在執(zhí)行任務(wù)時(shí)，無(wú)法判斷自己是否已經(jīng)抓取到相應(yīng)物品，而是機(jī)械操作固定步驟，也不能根據(jù)實(shí)際場(chǎng)景判斷抬升高度，確保物體順利放入箱內(nèi)。

Spirit v1.5模型實(shí)測(cè)過(guò)程（左）、Pi0.5模型實(shí)測(cè)過(guò)程（右）

不難看出，貼膠布、物品拾取、插花、移動(dòng)物體這類貼近實(shí)際應(yīng)用場(chǎng)景的機(jī)器人實(shí)操任務(wù)，是實(shí)打?qū)崣z驗(yàn)技術(shù)落地能力的關(guān)鍵。

其既可以驗(yàn)證機(jī)器人在真實(shí)環(huán)境中的感知、抓取、協(xié)同操作等核心功能的實(shí)際表現(xiàn)，也能直觀暴露技術(shù)短板，為后續(xù)技術(shù)迭代、優(yōu)化產(chǎn)品落地方案提供可落地、可復(fù)刻的真實(shí)測(cè)試依據(jù)，更對(duì)機(jī)器人技術(shù)落地及技術(shù)有效性有重要意義。

這也恰恰印證了該榜單的核心參考意義。

RoboChallenge的來(lái)頭不小，其于2025年成立，由Dexmal、Hugging Face海內(nèi)外具身智能領(lǐng)域知名機(jī)構(gòu)聯(lián)合發(fā)起。這一榜單通過(guò)真機(jī)測(cè)試評(píng)估模型在物理世界的泛化性，是具身智能領(lǐng)域少數(shù)以真實(shí)物理任務(wù)為核心的評(píng)測(cè)體系。

其中的30項(xiàng)測(cè)試任務(wù)正是針對(duì)傳統(tǒng)機(jī)器人測(cè)試場(chǎng)景碎片化、標(biāo)準(zhǔn)不統(tǒng)一，測(cè)試結(jié)果難以開(kāi)展橫向比較的行業(yè)痛點(diǎn)，RoboChallenge通過(guò)制定統(tǒng)一的任務(wù)標(biāo)準(zhǔn)與評(píng)估指標(biāo)，搭建跨模型對(duì)照機(jī)制，構(gòu)建起一套開(kāi)放、公正的具身智能評(píng)測(cè)體系，形成針對(duì)性解決方案。

更為關(guān)鍵的是，這一平臺(tái)可供全球研究者免費(fèi)使用，還會(huì)公開(kāi)任務(wù)數(shù)據(jù)與中間結(jié)果。

RoboChallenge榜單是具身智能飛速發(fā)展、落地加速的同時(shí)，行業(yè)對(duì)標(biāo)準(zhǔn)化評(píng)測(cè)的迫切需求催生出的硬核成果，也是給全球玩家實(shí)力較量搭起的公平擂臺(tái)，更凸顯出國(guó)產(chǎn)具身大模型登頂?shù)暮鹆俊?/p>

二、Spirit v1.5登頂背后，破解機(jī)器人泛化能力的核心密碼

要拆解Spirit v1.5高光表現(xiàn)背后的原因，首先需要破解制約機(jī)器人泛化能力的核心難題。

此前，各家機(jī)器人創(chuàng)企秀機(jī)器人技能時(shí)，很多機(jī)器人已能完成在全新環(huán)境疊衣服、清潔廚房等長(zhǎng)序列復(fù)雜任務(wù)，大規(guī)模VLA（視覺(jué)-語(yǔ)言-動(dòng)作）模型正逐步展現(xiàn)出真正的物理智能。

但這一亮眼表現(xiàn)背后，卻暗藏著關(guān)鍵技術(shù)隱患：不少業(yè)界頂尖模型在訓(xùn)練階段，會(huì)對(duì)數(shù)據(jù)進(jìn)行嚴(yán)苛的預(yù)處理，雖能降低機(jī)器人模仿人類操作的難度，卻也大幅限制了其實(shí)際的泛化能力。

因此，Spirit v1.5的核心就是，讓機(jī)器人在預(yù)訓(xùn)練時(shí)轉(zhuǎn)向使用多樣化的、很大程度上不受控的數(shù)據(jù)，通過(guò)從這類貼近現(xiàn)實(shí)世界的混亂數(shù)據(jù)中學(xué)習(xí)，大幅提升機(jī)器人應(yīng)對(duì)真實(shí)家庭環(huán)境中各類不可預(yù)測(cè)場(chǎng)景的能力。

千尋智能通過(guò)開(kāi)放式、目標(biāo)驅(qū)動(dòng)的數(shù)據(jù)采集，讓操作員以某個(gè)目標(biāo)為前提即興發(fā)揮。例如數(shù)據(jù)采集員的目標(biāo)是“今天我要用機(jī)器人清理廚房臺(tái)面”、“給假人模特化妝”，但操作員如何規(guī)劃子任務(wù)、任務(wù)執(zhí)行順序等都完全隨機(jī)。

通過(guò)這種方式構(gòu)建數(shù)據(jù)集的優(yōu)勢(shì)在于：能實(shí)現(xiàn)數(shù)據(jù)的高度多樣性讓機(jī)器人習(xí)得更多物理常識(shí)，還具備更強(qiáng)可擴(kuò)展性。

在多樣性層面，依托數(shù)據(jù)操作員的實(shí)際執(zhí)行過(guò)程，其會(huì)包含海量的物體交互、軌跡和環(huán)境轉(zhuǎn)換，會(huì)在短時(shí)間的操作中，包含拾取、放置、打開(kāi)容器、打掃房間、野外導(dǎo)航等互相交織的數(shù)據(jù)。

這樣一來(lái)，機(jī)器人就不是機(jī)械學(xué)習(xí)某個(gè)單項(xiàng)任務(wù)的執(zhí)行，而是通過(guò)學(xué)習(xí)整套技能及執(zhí)行的前后順序，得到更具通用性的知識(shí)與能力。

在可擴(kuò)展性層面，其數(shù)據(jù)集不需要為每個(gè)場(chǎng)景精心設(shè)備并定義詳細(xì)任務(wù)指導(dǎo)，便能在不線性增加管理成本的前提下，高效擴(kuò)展數(shù)據(jù)采集規(guī)模。根據(jù)千尋智能內(nèi)部實(shí)測(cè)，采用這種方法，人均有效采集時(shí)長(zhǎng)增加了200%，并將對(duì)算法專家的干預(yù)需求削減了60%。

為了用數(shù)據(jù)說(shuō)明這種數(shù)據(jù)集采集范式的有效性，千尋智能建立了兩組模型進(jìn)行對(duì)比，一組是在包含30個(gè)精選演示任務(wù)的數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練，一組在開(kāi)放式多樣化采集的數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練。

這兩組模型在全新的、未顯式出現(xiàn)在任一預(yù)訓(xùn)練集中的任務(wù)上進(jìn)行微調(diào)，結(jié)果顯示，多樣化模型達(dá)到相同性能所需的迭代次數(shù)比基線模型少了40%。

與此同時(shí)，其還發(fā)現(xiàn)模型的遷移效率與多樣化數(shù)據(jù)量呈顯著正相關(guān)：隨著數(shù)據(jù)集規(guī)模的持續(xù)增長(zhǎng)，模型在新任務(wù)中的驗(yàn)證誤差不斷下降，這也印證了模型正高效習(xí)得從現(xiàn)實(shí)世界的豐富內(nèi)在多樣性中自主學(xué)習(xí)的能力。

這樣的實(shí)驗(yàn)結(jié)果證明了，使用高多樣性、弱控制數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練的可行性與有效性，為具身智能模型的研發(fā)提供了全新的實(shí)踐依據(jù)。

三、突破傳統(tǒng)數(shù)據(jù)瓶頸，Spirit v1.5定調(diào)技術(shù)新方向

當(dāng)下具身智能行業(yè)的演進(jìn)節(jié)奏持續(xù)加快，從產(chǎn)業(yè)端到技術(shù)端，國(guó)內(nèi)具身智能正持續(xù)在全球舞臺(tái)展現(xiàn)硬實(shí)力。

在剛剛結(jié)束的全球最具影響力的科技盛會(huì)之一、“年度科技風(fēng)向標(biāo)”國(guó)際消費(fèi)電子展CES 2026上，國(guó)產(chǎn)人形機(jī)器人驚艷亮相、強(qiáng)勢(shì)出圈，再加上此次Spirit v1.5又登頂權(quán)威評(píng)測(cè)榜單，國(guó)內(nèi)玩家在全球具身智能賽道的話語(yǔ)權(quán)與行業(yè)影響力穩(wěn)步提升。

在具身智能走向行業(yè)落地的關(guān)鍵階段，技術(shù)路線與創(chuàng)新架構(gòu)不斷推新，從VLA架構(gòu)到認(rèn)知-動(dòng)作一體化架構(gòu)，從單模態(tài)感知到多傳感器融合，賽道技術(shù)探索百花齊放，而權(quán)威榜單的位次更迭，正是行業(yè)技術(shù)創(chuàng)新螺旋式上升的直觀體現(xiàn)。

此次Spirit v1.5的領(lǐng)先，正是其技術(shù)優(yōu)勢(shì)的集中釋放，核心依托于模型在泛化性、穩(wěn)定性、魯棒性等核心系統(tǒng)能力上的全面突破。

其創(chuàng)新采用高多樣性、弱約束的開(kāi)放式數(shù)據(jù)采集范式，讓模型突破了傳統(tǒng)“干凈”數(shù)據(jù)的瓶頸，使得模型能在全新非結(jié)構(gòu)化場(chǎng)景中靈活應(yīng)對(duì)各類不可預(yù)測(cè)性。

需要注意的是，大模型領(lǐng)域的榜單更迭頻發(fā)，但具身智能賽道的位次變化，尤其此次Spirit v1.5登頂權(quán)威榜單，絕非單純的技術(shù)參數(shù)比拼，更不是短期算法調(diào)優(yōu)的結(jié)果，而是對(duì)模型全鏈路技術(shù)路線的系統(tǒng)性驗(yàn)證，更是其在泛化能力、工程落地性、場(chǎng)景適配性等核心維度的綜合實(shí)力體現(xiàn)。

此次，千尋智能Spirit v1.5登頂，證明其不僅已經(jīng)成為中國(guó)具身智能模型最強(qiáng)力量，達(dá)到世界級(jí)水準(zhǔn)，更標(biāo)志著中國(guó)具身模型正式站上全球舞臺(tái)，與世界頂尖模型同臺(tái)角逐、比肩競(jìng)技。

從更宏觀層面來(lái)看，綜合實(shí)力的提升，往往會(huì)與吸引頂尖人才、生態(tài)合作伙伴等這類長(zhǎng)期價(jià)值的實(shí)現(xiàn)相輔相成。

因此，這一成果不僅能為千尋智能吸引全球頂尖的技術(shù)人才，進(jìn)一步提升其在行業(yè)內(nèi)的技術(shù)影響力，更能推動(dòng)其與產(chǎn)業(yè)鏈上下游的生態(tài)合作深化，為技術(shù)的快速迭代、機(jī)器人本體的產(chǎn)品化落地筑牢基礎(chǔ)，也為國(guó)內(nèi)具身智能賽道的技術(shù)演進(jìn)提供了可參考的實(shí)踐范式，助力國(guó)內(nèi)具身智能產(chǎn)業(yè)從技術(shù)突破向規(guī)模化落地加速邁進(jìn)。

結(jié)語(yǔ)：中國(guó)具身智能的進(jìn)階之路

我國(guó)具身智能產(chǎn)業(yè)正處于從技術(shù)探索邁向規(guī)模化落地關(guān)鍵期，疊加工業(yè)基礎(chǔ)、供應(yīng)鏈集成能力和場(chǎng)景密度的獨(dú)特優(yōu)勢(shì)，以Spirit v1.5為代表的技術(shù)突破，正加速具身智能突破技術(shù)邊界，圍繞具身通用大腦的能力探索不斷進(jìn)階，以技術(shù)進(jìn)化加速具身通用大腦的成熟，最終推動(dòng)具身智能全面走進(jìn)千家萬(wàn)戶、融入日常生活。

未來(lái)隨著技術(shù)的不斷成熟與生態(tài)的持續(xù)完善，中國(guó)具身智能產(chǎn)業(yè)不僅能在全球競(jìng)爭(zhēng)中鞏固領(lǐng)先優(yōu)勢(shì)，更將開(kāi)辟全新增長(zhǎng)空間。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.