![]()
用開源生態評價開源模型,以開源模型驅動行業生態繁榮,基于繁榮生態構建更進一步的產業發展飛輪。
作者|皮爺
出品|產業家
過去一周,具身智能賽道,來了一則新消息。
在第三方測評平臺RoboChallenge的榜單上,自變量開源端到端具身智能基礎模型WALL-OSS以54.69分的成績超越pi0,總分排名第二;此外,在疊洗碗巾、掛口杯、按按鈕、澆盆栽、移物入盒及開瓶器進抽屜等多個單動作任務中排名第一。
![]()
這個榜單驗證了國產模型在復雜物理交互場景下的國際競爭力,也給具身智能產業人士帶來另外一個層面的期待:即在產業級開源模型的推動下,具身智能產業能否迎來新的“百花齊放”?
在過去的幾年時間里,具身智能的創新進步更多呈點狀分布,并沒有出現和通用場景相似的從“基礎模型—AIGC產品/Agent智能體”百花齊放的涌現時刻。
這次登榜的自變量開源WALL-OSS模型,讓大家看到一個新答案。
一、排名第二:
具身智能再迎開源國產新底座
具身智能模型測評和大語言模型測評不同。
前者測評更多為“閉卷答題”,以靜態數據輸出與文本、圖像指標為主;而具身模型的測評更加側重“感知-決策-執行”的物理閉環,在測評時需要提前公開任務,核心驗證對象為視頻動作序列和任務成功率,類似于“開卷考試+實操考核”。
因此,相較于閉源模型“黑盒黑箱式”的打榜方式,用公開代碼的開源具身智能模型參與測評,才是最貨真價實,也是最能反應真實模型水平的評測方式。
這等同于把學霸的實時解題思路進行全面公開,通過把模型代碼、訓練數據乃至架構設計公開,讓測評過程可全程復現。對比用閉源模型參與測評,也規避了通過微調其他模型來"刷榜"的行為,以更客觀、真實地反映模型能力,同時,“太陽底下”的答題也更支持所有人進行任何角度地復現。
再來看這次自變量開源端到端具身智能基礎模型WALL-OSS的實測成績——根據模型測試結果,榜單總分前三依次是pi0.5、WALL-OSS、pi0。其中,WALL-OSS是唯一一個國內開源具身基礎模型,且在疊洗碗巾、掛口杯、按按鈕、澆盆栽、移物入盒及開瓶器進抽屜等多個考察模型綜合能力的單動作任務中,WALL-OSS排名第一。
![]()
實際上,這些成績也在“意料之中”。
比如對于老生常談的“災難性遺忘”和“模型解耦”問題,從單項任務的表現來看,WALL-OSS之前就已經通過模型架構創新,解決了VLM向VLA遷移的損耗問題;再比如在一系列涉及長序列執行的任務中,其“先離散、后連續、再聯合”的三階段訓練范式,讓模型可以具備更強的認知和精準物理動作生成能力。
此外,其思維鏈能力,通過對不同陌生任務、陌生場景、多模態因素的任務適配,外界能更直觀地感受到WALL-OSS底層“統一跨層級思維鏈”獨特設計對于產品落地的強加持。
二、為什么具身智能基礎模型要走開源路線?
那么,為什么自變量要選擇開源路線,或者從行業的角度來看,具身智能基礎模型的開源有什么特殊意義?
實際上,早在去年9月,自變量就已經對外進行了基礎模型WALL-OSS的開源,在硅谷101播客中,自變量機器人聯合創始人&CTO王昊也曾一度闡明了自變量為何堅持開源的初衷。
“我一直都覺得開源是非常重要的事情,開源意味著我們可以站在巨人的肩膀上繼續前進。一般的高校、或者一些小型的企業,他們可能沒有能力去做基礎模型,但是如果能夠使用這些基礎開源模型,他們就可以去做應用,把它用到各個方向,豐富整個生態,這也是一個非常重要的事情。”
值得一提的是,自變量基于WALL-OSS的開源是更為徹底的開源。
這次的開源模塊中,其對業界開放了詳細的模塊設計文檔、參數說明、環境搭建腳本,核心代碼注釋覆蓋率超80%;在環境模塊,WALL-OSS明確標注所有依賴庫的精確版本,提供Docker鏡像一鍵部署;在工程化模塊,感知、決策、動作模塊全部對外開放,內置錯誤處理和日志系統,支持調試時可快速定位問題。
此外,WALL-OSS也更開放了通用適配接口,支持全部主流機器人本體(夾爪、靈巧手),只需修改少量參數即可適配不同場景。
從開發者視角來看,這種足夠徹底的開源能夠極大降低開發者和從業者的工程成本和研發周期,而從行業視角來看,這種優質開源模型的徹底開源也更可以全面降低整個具身智能行業的創新成本,避免不同廠商和開發者“重復造輪子”的現象發生,推動整個行業生態更加繁榮。
而這種繁榮一方面可以更一步推動具身智能 “群體智慧”的涌現,讓具身智能基座模型貼近物理世界的速度更快;同時另一方面,也更可以加速“體”和“腦”基于生產力層面的結合,適配更多線下真實場景,推動具身智能行業“旺盛需求—有效供給”的產業迭代發展。
用開源生態評價開源模型,以開源模型驅動行業生態繁榮,基于繁榮生態構建更進一步的產業發展飛輪。唯有如此,具身智能才能從碎片化走向群體智慧,從實驗室走向真實物理的千行百業。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.