![]()
近日,全球首個大規(guī)模多任務(wù)的真機(jī)基準(zhǔn)測試平臺RoboChallenge榜單更新,前三名依次為pi0.5、WALL-OSS和pi0。
科普時間到,pi0.5、pi0是出自美國公司 Physical Intelliqence的操作大模型,WALL-OSS是出自中國自變量機(jī)器人的全自研開源操作大模型,不僅能完成操作,而且能同時生成復(fù)雜推理過程。
這一結(jié)果釋放出強(qiáng)烈的信號。很長一段時間內(nèi),中國具身智能產(chǎn)業(yè)陷入“大腦缺位”的爭議:我們有較強(qiáng)的本體結(jié)構(gòu)設(shè)計和運(yùn)控算法,但很難讓機(jī)器人真正“用腦思考”,自主與物理世界交互,進(jìn)而帶來創(chuàng)造生產(chǎn)力的可能。但現(xiàn)在,中國具身智能模型已經(jīng)與海外頂級模型同臺共舞。
更有意思的是,自變量和pi高度默契地選擇將模型開源。看似偶然的戰(zhàn)略趨同,實(shí)則是具身智能產(chǎn)業(yè)發(fā)展到關(guān)鍵階段的必然選擇。
![]()
在RoboChallenge的最新測試中,自變量WALL-OSS展現(xiàn)了極強(qiáng)的競技狀態(tài),總分位居第二,超越了明星模型pi0。在疊洗碗巾、按按鈕、澆盆栽等多個任務(wù)中,WALL-OSS的得分摘得桂冠,排名第一。
![]()
先來劃個重點(diǎn)。
RoboChallenge的測試或許更像是一場“開卷考試”,因?yàn)閿?shù)十個桌面任務(wù)與場景都是預(yù)知的。這就相當(dāng)于提前布置考題。
而WALL-OSS作為開源模型,某種程度上相當(dāng)于明牌上場,其每一步操作都真實(shí)可見為模型驅(qū)動,更多的意義在于給出解題思路,“進(jìn)一步展示模型的真實(shí)性能”。
與用閉源模型參與測評的“黑箱”,不知任務(wù)究竟如何完成不同,WALL-OSS作為開源模型,其一舉一動相當(dāng)于“明牌”炸場,換句話說其核心能力均可通過公開的代碼和參數(shù)得到完整解釋和復(fù)現(xiàn),其在榜單上的成績完全是模型真實(shí)能力的直接體現(xiàn),是無法摻水,難以被“操作”的硬核實(shí)力證明。
從技術(shù)細(xì)節(jié)來看,WALL-OSS取得優(yōu)異成績的核心在于對“端到端”架構(gòu)的深度重構(gòu):
![]()
它依托創(chuàng)新的混合專家(MoE)架構(gòu)及“共享注意力+專家分流”設(shè)計,有效解決了視覺語言模型向具身模型遷移時的“災(zāi)難性遺忘”與“模態(tài)解耦”難題;
通過“先離散、后連續(xù)、再聯(lián)合”的三階段訓(xùn)練范式,消除了“認(rèn)知與動作脫節(jié)”的痛點(diǎn),使模型能精準(zhǔn)掌控如澆盆栽時的動作力度;
此外,其內(nèi)化的跨層級思維鏈推理能力,實(shí)現(xiàn)了高層決策與底層執(zhí)行的無縫切換,使其在面對各類突發(fā)狀況時,仍能精準(zhǔn)控制關(guān)節(jié)完成復(fù)雜任務(wù)。
有個小插曲,WALL-OSS去年9月開源,與Physical Intelligence開源pi0.5相錯一天,這也側(cè)面說明了自變量的技術(shù)步調(diào)一直與國際頭部具身大腦公司同頻。而今天自變量與Physical Intelligence的模型又在榜單前排聚首,更說明自變量已經(jīng)站穩(wěn)了全球第一梯隊(duì)。
![]()
開源之所以重要,在于生態(tài)建設(shè),其價值最終體現(xiàn)在生態(tài)的繁榮之上。
自變量認(rèn)為,在具身智能這一軟硬件深度耦合的前沿領(lǐng)域,構(gòu)建一個高質(zhì)量的開源基礎(chǔ)模型底座,是加速整個行業(yè)生態(tài)繁榮的堅實(shí)“地基”,也是實(shí)現(xiàn)機(jī)器人在物理世界大規(guī)模、穩(wěn)定交互的關(guān)鍵。
當(dāng)前,機(jī)器人模型的驗(yàn)證鏈路冗長,行業(yè)里專用小模型、通用大模型質(zhì)量參差不齊,基礎(chǔ)模型、專用模型、微調(diào)模型混雜,且缺乏統(tǒng)一的評價標(biāo)準(zhǔn)。開源是撥開迷霧、推動行業(yè)標(biāo)準(zhǔn)化和成熟化的必由之路。
在《硅谷101播客》中,自變量聯(lián)合創(chuàng)始人兼CTO王昊曾說:“我一直都覺得開源是非常重要的事情,開源意味著我們可以站在巨人的肩膀上繼續(xù)前進(jìn)。我們可以基于已有成果做更多的改進(jìn),社區(qū)開發(fā)者的反饋也會幫助到開源的公司,開源公司可以從中吸取到經(jīng)驗(yàn),然后把這個技術(shù)路線思考得更加深入。”
![]()
自變量開源的WALL-OSS正是秉承這種“提供肩膀”的開源理念,所以他們選擇更為徹底的開放:不僅開放了預(yù)訓(xùn)練模型權(quán)重、完整訓(xùn)練代碼和數(shù)據(jù)集接口,甚至還提供了詳盡的部署文檔。
除了構(gòu)建行業(yè)繁榮生態(tài)之外,“站在巨人肩膀上”還在于避免行業(yè)陷入重復(fù)性研發(fā)的低效困境——無需每個企業(yè)、每個研究者都從零開始“一手手自建高樓”,而是可以基于開源的基礎(chǔ)模型快速迭代創(chuàng)新,將更多精力投入到差異化技術(shù)研發(fā)與場景化應(yīng)用落地中,大幅提升整個行業(yè)的創(chuàng)新效率。
黃仁勛也曾直白說過,“開源如此重要的原因,在于沒有開源初創(chuàng)企業(yè)不能蓬勃發(fā)展,大學(xué)研究人員不能做研究,科學(xué)家不能使用人工智能。基本上,你的經(jīng)濟(jì)沒有能力從根本上提升自己”。這不僅適用于AI,對于具身智能和任何技術(shù)來說都是如此。
![]()
事實(shí)上,技術(shù)革命的背后就是一場技術(shù)大規(guī)模應(yīng)用并改變生產(chǎn)方式的過程。如果沒有應(yīng)用也就把技術(shù)困厄于象牙塔,無法激起漣漪。
如自變量所說“擁抱開源,以透明對抗虛假,以協(xié)作代替閉門造車”,具身行業(yè)這條厚雪長坡上,需要的是明燈而非迷霧,眾人拾柴而非孤芳自賞。而開源,正是那盞能夠照亮前路、匯聚眾力的燈。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.