![]()
機器人前瞻(公眾號:robot_pro)
作者 李水青
編輯 漠影
機器人前瞻1月9日報道,近日,在真機基準測試平臺RoboChallenge上,自變量機器人開源端到端具身智能基礎模型WALL-OSS以54.69分的成績,成功率35.33%,位列總分榜單第二,超越國際知名具身智能模型pi0。
在疊洗碗巾、按按鈕、澆盆栽等多個具體任務中,WALL-OSS拿下單項第一,展現出在真實物理環境中的穩定執行能力。
在這樣的“公開考場”中,WALL-OSS的表現成為一次來自中國開源具身智能模型的公開能力驗證。
一、WALL-OSS 拿下多項第一
從RoboChallenge公布的榜單來看,參與評測的模型覆蓋了多種技術路線與研發背景:既包括來自國際研究機構與創業公司的閉源模型,也有少量開源模型參與同臺競技。
![]()
▲RoboChallenge榜單情況
其中,自變量推出的WALL-OSS模型得分高于美國具身智能創企Physical Intelligence推出的模型pi0,逼近后者的最新開源模型Pi0.5,三者居于榜單前三位,都是開源模型。
在具體任務層面,WALL-OSS在多項精細操作任務中取得第一。
這些任務并不追求復雜場景堆疊,而是高度貼近真實世界中機器人的核心應用場景——物體識別、狀態判斷、動作連續執行與誤差修正。這也是RoboChallenge設計任務的核心邏輯:用最“樸素”的任務,檢驗模型是否真的理解并適應物理世界。
![]()
▲RoboChallenge在按按鈕任務中成功率達60%
整體趨勢非常清晰——具身智能正在從“演示級別”走向可對比、可量化的工程階段。
在這一背景下,WALL-OSS 的代表性進一步凸顯。其在參數規模上作出取舍,通過4.2B參數體量,將具身智能模型的訓練與部署門檻壓到消費級顯卡,大幅降低了落地成本。
二、為何開源模型的成績更“貨真價實”?
與大語言模型常見的榜單不同,具身智能測評本質上是一類完全不同的“考試”。
在RoboChallenge等平臺上,評測任務提前公開,從形式上看更接近“開卷考試”。但最終的評分依據,并非模型生成的文本或中間結果,而是機器人是否在真實世界中完成了指定動作。
這意味著,模型需要應對的是:物理誤差與環境噪聲、傳感器不確定性、連續動作中的累積偏差,以及大量未被顯式建模的現實變量等。
真正決定成績的,是模型在面對現實世界時的泛化能力與執行穩定性。
正是在這一規則下,開源模型的獨特價值被進一步放大。
對比閉源模型,完全開源、公開代碼與權重的模型而言,其成績具備完全可復現性。外界可以清晰判斷:模型是否依賴未公開模塊,是否通過特殊工程手段規避難點,是否存在只針對評測任務的定向優化。
這使得評測結果更接近對模型基座能力的檢驗,而非團隊工程技巧的展示。
從這個角度看,WALL-OSS在RoboChallenge上取得的成績,并不僅是一個名次,更是一種技術透明度下的能力證明。這種“在陽光下競爭”的結果,也為行業提供了更可信的比較參照。

▲自變量機器人具身智能模型支持機器人疊衣服
三、做行業“基礎設施”,開源凝聚生態之力
從開源技術路徑來看,WALL-OSS并非通過壓縮能力換取小體量,而是在架構層面做出了針對性設計。其核心技術路徑包括:
1、通過 “共享注意力 + 專家分流” 的創新架構,解決視覺-語言模型向視覺-語言-動作模型遷移過程中常見的 “災難性遺忘” 與 “模態解耦” 問題;
2、采用 “先離散、后連續、再聯合” 的訓練范式,在統一框架內融合了思維鏈推理能力與精細動作生成能力,避免了傳統方案中理解與執行割裂的問題。
這種路徑并不強調單一模塊的極致性能,而是圍繞“端到端”這一目標,確保模型在感知、推理與動作之間形成穩定閉環。
在當前具身智能生態中,不少方案仍停留在模塊拼接階段,或依賴閉源組件完成關鍵能力。相比之下,在同等參數規模下,WALL-OSS是少數真正實現理解—規劃—執行一體化的開源統一模型之一。
這使其在生態層面具備明確定位——不僅是一個“可用模型”,更是一個可被二次開發、復現與擴展的基礎能力底座。
從自變量機器人的策略來看,選擇開源并非一次短期傳播行為,而是對具身智能發展路徑的判斷。
具身智能的復雜度,決定了任何單一團隊都難以在短時間內覆蓋所有場景與問題。與其封閉迭代,不如通過開源方式,盡早建立可驗證、可擴展的技術底座,讓更多研究者與開發者在同一基礎上探索。
在這一邏輯下,WALL-OSS更夯實了“基礎設施”式的存在。其目標并非在短期內覆蓋所有應用,而是試圖為行業提供一個可靠、低門檻、可持續演進的起點。
結語:中國具身智能開源力量正在崛起
WALL-OSS在RoboChallenge上的表現傳遞出一個信號:中國團隊不僅在參與這場競賽,而且正在以開源、透明、可復現的方式,進入全球具身智能能力對比的主舞臺。
隨著真機評測、統一基準與開放生態逐步成熟,具身智能正在告別“概念展示期”,進入更殘酷、也更真實的工程階段。而在這一階段,誰能提供穩定、可信的基礎能力,誰就更有可能成為下一輪創新的起點。
從這個意義上看,WALL-OSS的出現,或許只是中國具身智能開源力量正在崛起的一個開始。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.