2026年1月12日,具身智能領域迎來了一個里程碑時刻:國產具身智能基座模型,登頂全球第一!
在被稱為機器人界“全球統考”的RoboChallenge真機評測榜單上,中國創業公司千尋智能自研的Spirit v1.5 VLA模型,以總分66.09、成功率50.33%的成績,超越美國具身智能明星公司Physical Intelligence的pi 0.5模型,拿下全球第一。
![]()
由Dexmal、Hugging Face等機構聯合發起的RoboChallenge測試,強調真實機器人執行能力,評測維度覆蓋復雜指令理解、多步驟操作、跨場景穩定性等,被視為當前具身智能領域最接近真實落地場景的基準測試之一。
登頂的同一時刻,千尋智能開源了Spirit v1.5的基模權重、推理代碼以及使用樣例,交由公眾復現、檢驗。
過去兩年,具身智能繁花似錦的技術狂歡背后,行業內部卻彌漫著一股“虛火”——演示時,拿貨品、疊衣服、扭秧歌等等精心編排的Demo動作流暢得仿佛電影特效;而一旦離開了預設環境,Demo中精準靈巧的機器人,往往就會錯漏百出,令人大跌眼鏡。
當下,我們擁有全球最頂尖的機械臂、最靈活的底盤,卻始終受困于一個無法回避的尷尬:“四肢發達,頭腦簡單”。
資本與產業界都在苦候一個真正的“通用大腦”,能讓機器人走出溫室,在不可控的物理世界里,真刀真槍地解決問題。
而登頂RoboChallenge全球第一的Spirit v1.5,或許真正意味著:具身智能的競爭,正在從比拼硬件的“上半場”,邁入了比拼大腦的“下半場”。
![]()
擁抱混亂:從“Demo時代”邁進“實戰時代”
機器人必須先學會像人類一樣在混亂中生存,才能真正走出實驗室。
Spirit v1.5登頂的核心奧義,藏在千尋智能對數據“離經叛道”的理解里。
很長一段時間里,具身智能的訓練側流行著一種“潔癖”。為了讓機器人學會一個動作(比如擦桌子),工程師們往往像強迫癥患者一樣:必須是白色的桌子,必須是藍色的抹布,光線必須是500流明,抹布必須放在右上角。
這種在高度受控環境下采集的“干凈數據”,確實能讓模型快速收斂,在實驗室里跑出漂亮的分數。但這樣訓練出來的不是智能,而是“肌肉記憶”,也就是技術上所說的過擬合(Overfitting)。
一旦把它扔進真實的廚房——那里有油漬、有反光、有隨意擺放的碗筷——它就會立刻“智障”。
為了徹底解決這一“頑疾”,在Spirit v1.5的研發中,千尋智能選擇了擁抱混亂,選擇了一條更加艱難,但上限也更高的技術路徑。
根據千尋披露的技術細節,Spirit v1.5 采用了創新的VLA(Vision-Language-Action)統一架構。這是一種端到端的“直覺反應”——不同于傳統機器人“眼睛看(感知)-大腦想(規劃)-手去動(控制)”的拼湊式模塊,VLA 架構讓機器人像人一樣,感知即行動。
為了訓練這種直覺,千尋智能構建了一套獨特的數據飛輪,其核心邏輯是“先離散,后連續”,并在物理世界驗證了大模型Scaling Law的有效性:
第一階段,像個“網癮少年”一樣看視頻。Spirit v1.5預訓練的數據源,并非全是實驗室采集,而是包含了海量的互聯網視頻——YouTube上的烹飪教程、愛奇藝里的生活片段。這些數據雖然雜亂、沒有標注,有的甚至畫質模糊,但它們包含了物理世界最豐富的多樣性。機器人從中學會了什么是“杯子”,什么是“倒水”,以及倒水時水流的物理形態。
第二階段,微調。在預訓練建立了物理常識后,千尋引入了真實遙操作數據。但這也不是為了教機器人死板的“標準動作”,而是為了讓它理解任務的本質。
這種訓練范式帶來了質變。
從評測結果來看,Spirit v1.5 VLA在多項任務中保持較高成功率,尤其在多任務連續執行、復雜指令拆解以及跨構型遷移等維度中表現穩定。
![]()
從“硬件敘事”轉向“模型敘事”
對于投資者和企業主而言,再先進的技術、再動人的敘事,最終也要落到實際的商業案例與理性的財務數據上。
千尋智能的答案,在寧德時代的產線上。
2025 年底,千尋智能的人形機器人“小墨”批量部署于寧德時代中州基地的電池 PACK產線,這也是全球首條人形機器人電池PACK產線。
在這里,機器人面對的不是實驗室的積木,而是高壓、高精度的工業環境。電池插接工序要求極高,線束是柔性的,位置是變化的,稍有偏差就可能導致短路甚至安全事故。這是傳統工業機械臂難以處理的“非標”場景,也是此前只能靠熟練工人完成的環節。
千尋智能披露的數據,足以讓任何一個制造業的老板心動:
“連續運行中插接成功率穩定在99%以上”和“單日工作量實現了3倍提升”。
在此之前,人形機器人更多被視為一種昂貴的“玩具”或“展示品”,是企業展廳里的吉祥物。
但千尋智能用實際案例證明了,在Spirit大模型的加持下,機器人已經能夠處理極其復雜的工業任務,并且在效率和良率上超越人類熟練工。
而這種可復用、可規模化的技術資產,不僅大大提高了千尋智能極高的競爭壁壘,也在重構其估值邏輯:
從“硬件敘事”轉向“模型敘事”: 投資人不再將其視為一家對標發那科(Fanuc)的硬件制造商,而是一家對標OpenAI 的AI平臺公司。Spirit v1.5展現出的“一腦多形”(One Brain, Many Forms)能力——即同一個大腦可以驅動雙臂、單臂甚至不同構型的設備——意味著其商業天花板不再受限于硬件產能,而取決于模型的泛化邊界。
“數據-模型”飛輪: 開源帶來了生態的廣度,而寧德時代的落地則帶來了數據的深度。工業場景中那些無法通過互聯網視頻獲取的“Corner Case”(極端情況),正在源源不斷地喂養著Spirit模型,讓數據-模型飛輪轉動。
![]()
開源:搶占具身智能“大腦”生態位
如果說RoboChallenge的奪冠是技術的“秀肌肉”,那么隨后的開源,則更體現了這家初創公司的“戰略雄心”。
放眼全球,具身智能的第一梯隊玩家風格迥異:
·美國的Figure AI和Tesla Optimus,走的是軟硬一體的封閉路線,追求極致的垂直整合體驗。
·美國的Physical Intelligence(Pi),雖然技術強悍,但在生態構建上尚未形成統治力。
千尋智能看到了一個巨大的真空地帶:在行業爆發的前夜,誰能率先搶占具身智能“通用大腦”的生態位?
在當前的具身智能領域,最大的痛點是“重復造輪子”。每家機器人公司,無論大小,都在試圖從零開始訓練自己的基礎模型。這導致了極大的資源浪費,且水平參差不齊。
千尋智能通過開源Spirit v1.5,直接拉高了行業的“標準線”。
通過開源,Spirit v1.5有望成為學界和產業界研究的基礎(Baseline)。當高校的研究者、創業公司的開發者都開始基于Spirit v1.5進行二次開發、進行微調時,千尋智能就擁有了定義行業標準的權力。
一旦Spirit v1.5成為行業的默認選項,千尋智能便會從事實上躍升為一家“賦能全球機器人公司”的平臺型公司。
而當模型能力足夠領先,形成真正的代際差時,千尋依然握有閉源的主動權,一如從GPT3后轉向閉源的OpenAI。
![]()
尾聲
回望科技發展史,每一個周期的爆發,往往都始于一個“定義標準”的時刻。
Iphone開創了智能手機時代,OpenAI定義了大模型范式。而現在,千尋智能正試圖用Spirit v1.5,為具身智能行業確立一個通用的“大腦”。
對于行業而言,Spirit v1.5 登頂RoboChallenge并開源,可能正意味具身智能下半場的開啟——
硬件會變強,也會越來越同質化;但誰能讓大腦在混亂世界里穩定工作,誰就更接近決定下一階段的規則。
行業的真正壁壘,正在從硬件,轉向數據、模型、生態、標準。
千尋智能的這次“亮劍”,也是中國具身智能模型從追趕到領跑的一個關鍵轉折點。它用一種極其硬核的方式告訴我們:
機器人不需要長得像人,但必須干得像人。
而Spirit v1.5,或許就是那個“干的像人”的起點。
*以上內容不構成投資建議,不代表刊登平臺之觀點,市場有風險,投資需謹慎,請獨立判斷和決策。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.