在具身智能這一軟硬件深度耦合的前沿領域,構建一個高質量的開源基礎模型底座,是加速整個行業生態繁榮的堅實“地基”,也是實現機器人在物理世界大規模、穩定交互的關鍵。
當前,機器人模型的驗證鏈路冗長,行業里專用小模型、通用大模型質量參差不齊;基礎模型、專用模型、微調模型魚龍混雜;且缺乏統一的評價標準;開源是撥開迷霧、推動行業標準化和成熟化的必由之路。
自變量的自研端到端具身智能基礎模型WALL-OSS自開源以來,迅速獲得了全球開發者的廣泛關注與應用。在我們的開源社區中,多元背景的開發者們活躍互動,針對復現問題展開深入交流,自變量技術團隊亦堅持在一線提供及時的技術支持。
同時,為進一步展示模型的真實性能并降低復現門檻,我們此前也將WALL-OSS接入了RoboChallenge平臺——這一全球首個大規模、多任務的,在真實物理環境中的真機評測平臺,以開放透明的態度接受檢驗,賦能更多開發者。
超越pi0,多項單任務得分排名第一
近日,RoboChallenge在完成相應接口調試工作后,呈現了最新的模型測試結果,榜單總分和成功率前三都依次是pi0.5、WALL-OSS、pi0,三者均已開源,WALL-OSS是其中唯一一個國內開源具身基礎模型。
![]()
具體來看,WALL-OSS在真實世界中的疊洗碗巾、按按鈕、澆盆栽等多個長序列復雜任務中得分第一。
并且WALL-OSS目前提交的復現結果示例,微調代碼和模型權重也將在近期全部開源,讓模型展現出的泛化能力、推理能力等有據可查。除了檢驗測試結果的真實性,開發者們也可以在平臺上根據源代碼和各個任務的微調代碼,結合自己的數據完成復現微調。
長期以來,具身智能的難點和痛點在于尚未形成一個統一的評測標準,供大家盡可能低成本、且比較公平地評測模型,觀察其在真實環境的泛化能力、魯棒性等。
一個在真實世界公開透明的決斗場對不同的開發者而言至關重要,一方面,模型的能力需要真實全面地呈現在“太陽底下”,才能供開發者們自由選擇,真正起到評測鑒偽的作用;另一方面,高質量的基礎模型才能有效避免“重復造輪子”,將有限資源集中于核心突破。
堅持開源,做“提供肩膀的巨人”
自變量從成立以來,就致力于樹立開源的標桿,讓每次開源都對行業產生價值,并展現我們的思路和探索,彌補技術空白。通過開源來成為核心基礎設施的技術引領者,凝聚更多優秀開發者的智慧,在一些關鍵問題上一起攻堅突破,推動行業前行發展。
以WALL-OSS為開端,我們并不是簡單地提供一個模型,而是一整套完整可復現的方案,包括預訓練模型權重、訓練代碼、數據集接口,以及詳細部署文檔等。隨著越來越多的開發者復現,我們也將一位開發者自發撰寫的復現文檔分享在了社群中,供大家參考利用。
此前,自變量機器人聯合創始人&CTO王昊也在硅谷101播客中明確表達了自變量的初衷——
“我一直都覺得開源是非常重要的事情,開源意味著我們可以站在巨人的肩膀上繼續前進。我們可以基于已有成果做更多的改進,社區開發者的反饋也會幫助到開源的公司,開源公司可以從中吸取到經驗,然后把這個技術路線思考得更加深入。
一般的高校、或者一些小型的企業,他們可能沒有能力去做基礎模型,但是如果能夠使用這些基礎開源模型,他們就可以去做應用,把它用到各個方向,豐富整個生態,這也是一個非常重要的事情。
AI的研究我覺得跟大模型之前有很大不一樣。過去,我們可以看到AI和大模型的研究是非常離散的,在真正形成一個社區之前,可能做研究的只有兩、三個人,大家瘋狂地研究一個算法,更多是以論文發表作為第一要務,目的是占據技術的主動權。
但有了社區和整個開源體系之后,大家更在乎的是,怎么在一個工程化的體系下,把這個工程基礎打好,讓這個社區更加繁榮?個人是通過什么方式給社區做貢獻?大家的榮譽反而來自于這樣的事情。這樣也就會促使開源模型的技術不停地發展。所以我覺得開源是一個非常好的事情,既可以從中學習到新的東西,也可以看到你的東西可能對別人有幫助。”(來源:硅谷101)
開源首先意味著透明與驗證。當模型代碼、訓練數據乃至架構設計公之于眾時,任何夸大或不實都將被全球開發者社區置于放大鏡下檢驗。每一次復現、每一次部署都是一場嚴格的壓力測試,任何夸大、虛假的演示都無處遁形,也將推動建立以真實性能而非商業包裝為標準的評價體系,促使行業競爭從營銷噱頭回歸技術本身。
具身發展需要開源凝聚創新力量。未來,具身智能的落地,需要“大腦”(具身基礎模型)與“身體”(機器人硬件)緊密協同,其中涉及大模型、機器人學、強化學習等多個前沿領域。開源社區讓全球研究者可協作攻關,加速跨領域知識融合。開放協作的“集體智慧”,遠比封閉開發更能有效應對真實世界的復雜性、隨機性。
擁抱開源,以透明對抗虛假,以協作替代閉門造車。這不僅是對技術的開放、尊重和敬畏,更是對行業未來的開拓、負責和擔當。唯有如此,具身智能才能從實驗室走向現實世界,真正惠及千行百業。
歡迎更多開發者參與到WALL-OSS模型的復現中,有更多關于模型及復現的問題歡迎加入我們的開源社群,一起交流探討,獲取最新解答!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.