<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      π0.7來了!涌現(xiàn)出組合泛化、跨本體遷移能力,VLA又行了?

      0
      分享至

      機(jī)器之心編輯部

      在 Generalist AI 發(fā)布 Gen-1 兩周之后,具身賽道的另一位重量級玩家 ——Physical Intelligence 也亮劍了,發(fā)布了新模型 π 0.7,VLA 又往前走了一步。



      這個模型的重大突破在于 —— 它不只是重復(fù)訓(xùn)練中遇到的任務(wù),而是展現(xiàn)出了組合泛化的初步跡象。什么叫組合泛化?舉個例子,你會切菜、會打開燃?xì)狻矗?dāng)你想吃番茄炒蛋時,雖然你從來沒有做過,但只要看一眼菜譜,你也能把這些技能組合起來,把菜做出來。現(xiàn)在的大語言模型之所以那么強(qiáng)大,本質(zhì)上也是因為具備這種能力。

      但在機(jī)器人領(lǐng)域,這種能力還沒有大規(guī)模涌現(xiàn)。比如現(xiàn)在廣泛使用的 VLA(視覺 - 語言 - 動作)模型,雖然能聽懂各種指令和概念,但它們還不會把學(xué)過的技能靈活組合起來用。你給它一個新工具或者沒見過的廚房用具,它就不知道怎么用了。而且,就算是它學(xué)過的技能,通常也得專門再「調(diào)教」一下,效果才會好。這跟早期那些語言模型很像,處理不同的問題也得單獨做微調(diào)。

      π (0.7) 看起來不一樣。Physical Intelligence 提到了一個空氣炸鍋的例子。他們從未讓 π0.7 學(xué)習(xí)過「用空氣炸鍋烤紅薯」這個具體任務(wù)。但是,當(dāng)通過分步的語言指令(就像指導(dǎo)一個第一次使用空氣炸鍋的人那樣)來「輔導(dǎo)」它時,這個模型能夠理解并執(zhí)行。它需要將「關(guān)閉炸籃」、「放置食物」等從不同數(shù)據(jù)片段中學(xué)到的概念組合起來,應(yīng)用到一個全新的、完整的任務(wù)流程中。

      更有趣的是,經(jīng)過幾次這樣的語言輔導(dǎo)后,研究人員可以微調(diào)一個高層策略,讓模型完全自主地生成這些語言子目標(biāo),從而獨立完成整個空氣炸鍋任務(wù)。這說明 π0.7 能夠?qū)⒂^察到的、零散的行為片段組合起來,形成全新的、連貫的行為序列,這就像大型語言模型組合文本片段一樣。



      研究人員自己也很好奇,π0.7 到底是從哪里學(xué)會「空氣炸鍋」這個概念的。畢竟,訓(xùn)練數(shù)據(jù)里并沒有直接演示「用空氣炸鍋烤紅薯」的完整過程。由于訓(xùn)練集的規(guī)模很大且非常多樣,很難精確追蹤到是哪幾段數(shù)據(jù)賦予了模型這個知識。研究人員的推測是,它很可能來自機(jī)器人操作數(shù)據(jù)和大規(guī)模視覺語言預(yù)訓(xùn)練的共同作用

      他們花了不少力氣去搜尋,最終找到了兩段相關(guān)的家庭數(shù)據(jù):一段是機(jī)器人關(guān)閉空氣炸鍋,標(biāo)注為「把炸籃推進(jìn)空氣炸鍋」;另一段是「把空氣炸鍋的炸籃放在臺面最左邊」。此外,他們還找到了開源 DROID 數(shù)據(jù)集中一臺 Franka 機(jī)械臂的相關(guān)操作片段。有趣的是,這些片段看起來與 π0.7 在實際實驗中用移動機(jī)器人執(zhí)行空氣炸鍋任務(wù)時的行為差異很大。這說明 π0.7 并不是簡單模仿某一段數(shù)據(jù),而是像大型語言模型組合網(wǎng)絡(luò)上不同文本片段那樣,把這些看似不同的、零散的行為片段重新組合起來,泛化成一個全新的、連貫的「向空氣炸鍋裝入紅薯」的任務(wù)。他們認(rèn)為。這是組合泛化能力的生動體現(xiàn)。

      除了組合泛化,π0.7 在跨本體遷移方面的表現(xiàn)也非常亮眼

      在一個疊衣服的例子中,π0.7 被要求控制一個它從未訓(xùn)練過的、形態(tài)差異很大的雙臂機(jī)器人(UR5e 系統(tǒng))來疊衣服。UR5e 系統(tǒng)由兩臺 UR5e 工業(yè)機(jī)械臂搭配 Robotiq 平行夾爪組成。這臺機(jī)器人很難遙操作:機(jī)械臂很重,慣性很大,夾爪也相對不夠精確。研究人員之前完全沒有收集過這臺機(jī)器人做疊衣服任務(wù)的任何數(shù)據(jù)。

      他們讓 π0.7 去控制這臺機(jī)器人折疊衣物。出乎意料的是,它能夠穩(wěn)定地完成這一操作。值得注意的是,該機(jī)器人在折疊 T 恤時的物理動作,與他們最初采集訓(xùn)練數(shù)據(jù)所用的那臺更小型機(jī)器人的動作存在顯著差異。最終,π0.7 在該任務(wù)上的成功率,與經(jīng)驗豐富的遙操作員在同樣使用雙臂 UR5e 系統(tǒng)進(jìn)行「零樣本」操作時的成功率持平。這些操作員平均擁有 375 小時的遙操作經(jīng)驗,他們正是最初在原始機(jī)器人上采集訓(xùn)練數(shù)據(jù)的同一批專家。



      視頻鏈接:https://mp.weixin.qq.com/s/tYWiq0mR3Ohg-V1FxCfunA?click_id=128

      除了廣泛的任務(wù)泛化能力,研究團(tuán)隊還希望機(jī)器人干活又準(zhǔn)又快。之前他們開發(fā)了一個叫 Recap 的算法,用強(qiáng)化學(xué)習(xí)專門優(yōu)化特定任務(wù)的策略,讓機(jī)器人動作更穩(wěn)、速度更快。

      以前的做法是為每個任務(wù)單獨訓(xùn)練一個 Recap 專家模型。但現(xiàn)在他們換了個思路:把 Recap 訓(xùn)練過程中產(chǎn)生的經(jīng)驗連同策略元數(shù)據(jù)一起喂給 π0.7。

      通過這種知識蒸餾,π0.7 這一個通用模型就學(xué)會了 Recap 優(yōu)化的所有技巧。結(jié)果是,無論是疊衣服、做咖啡還是折盒子,π0.7 的成功率和速度都達(dá)到了之前專門訓(xùn)練的 Recap 專家模型水平,有時甚至更好





      也就是說,現(xiàn)在他們不再需要為每個任務(wù)單獨維護(hù)一個專家模型,一個通用模型就能搞定所有活兒,這也是語言模型領(lǐng)域發(fā)生過的重要轉(zhuǎn)折。





      視頻鏈接:https://mp.weixin.qq.com/s/tYWiq0mR3Ohg-V1FxCfunA?click_id=128



      π0.7 是一個通用模型,因為它能夠控制各種不同的機(jī)器人執(zhí)行各種不同的任務(wù)。前面提到的那些都是針對特定能力(比如泛化性、跨本體遷移)做的專門測試,除此之外他們還試了更多日常場景 —— 像削蔬菜、用清潔劑擦玻璃門這些活兒它都能干。



      視頻鏈接:https://mp.weixin.qq.com/s/tYWiq0mR3Ohg-V1FxCfunA?click_id=128

      π0.7 為何如此強(qiáng)大?

      π0.7 為什么能泛化得這么開?核心在于數(shù)據(jù)要雜,但提示要細(xì)。

      基礎(chǔ)模型想泛化好,本來就得多喂各種來源的數(shù)據(jù)—— 他們匯集了幾十種不同機(jī)器人的操作記錄、人類演示視頻,還有各種自主策略跑出來的實驗數(shù)據(jù)。

      不過,光是把這些數(shù)據(jù)混在一起可不行。關(guān)鍵是要在「提示詞」上下功夫:不僅要告訴模型做什么,還要告訴它怎么做(steer)。

      具體來說,研究人員給模型設(shè)計了一套多樣化的提示結(jié)構(gòu),包含多模態(tài)信息。比如,除了文字描述任務(wù),還可以給一張「視覺子目標(biāo)」圖片,告訴模型物體最終要擺成什么樣;也可以給一個期望的任務(wù)時長,告訴模型做快一點還是慢一點。這些額外信息能消除行為上的歧義,讓模型從不同策略、不同水平的數(shù)據(jù)中都能學(xué)到東西。



      這套提示框架讓 π0.7 可以把以前難以合并的數(shù)據(jù)源統(tǒng)一利用起來,包括:

      • 描述任務(wù)和每一步的語言指令;
      • 描述操作方式(比如快慢、質(zhì)量高低)的元數(shù)據(jù);
      • 控制模式標(biāo)簽(用關(guān)節(jié)控制還是末端控制);
      • 視覺子目標(biāo)圖片 —— 可以在測試時由世界模型實時生成,幫助模型理解「下一步長什么樣」。

      有了這些豐富的標(biāo)注信息,π0.7 就能放心地使用更多類型的數(shù)據(jù)。舉個例子,那些質(zhì)量不高的自主數(shù)據(jù),本來可能會「教壞」模型,讓模型學(xué)出低質(zhì)量的動作。但只要給這類數(shù)據(jù)打上合適的標(biāo)簽,比如「質(zhì)量偏低」或「速度偏慢」,模型就能正確理解,不會照單全收。



      在論文中,Physical Intelligence 還公布了 π0.7 的更多細(xì)節(jié)。

      π0.7 基于 π0.6 的 VLA 架構(gòu)與 MEM 記憶系統(tǒng)構(gòu)建,并新增多模態(tài)上下文條件調(diào)制。模型包含以 Gemma3 4B 視覺語言模型初始化的 VLM 主干(含 0.4B 視覺編碼器),以及 0.8B 參數(shù)的流匹配動作專家,總參數(shù)約 5B。

      下圖展示了模型架構(gòu)的整體概況:



      大家如果關(guān)心更多細(xì)節(jié),可以去論文里找找看:



      • 論文標(biāo)題:π0.7: a Steerable Generalist Robotic Foundation Model with Emergent Capabilities
      • 論文鏈接:https://www.pi.website/download/pi07.pdf

      未來方向:數(shù)據(jù)和上下文才是關(guān)鍵?

      π0.7 是一個統(tǒng)一的通用模型,它具備一種「組合式泛化」的能力 —— 不僅能聽懂各種指令、看懂視覺子目標(biāo),而且開箱即用,表現(xiàn)相當(dāng)出色。即便是以前需要專門訓(xùn)練、精細(xì)調(diào)優(yōu)的「專家模型」才能完成的任務(wù),它也能直接上手。

      研究人員認(rèn)為,像 π0.7 這樣能力強(qiáng)、可操控的模型,未來有可能解決更復(fù)雜、從未見過的任務(wù)。怎么做到呢?讓模型自己「想一想」,先思考可能用什么方法去完成任務(wù),利用它遵循多種提示的能力,把這些想法落地成具體的動作,然后再根據(jù)執(zhí)行結(jié)果反思、調(diào)整方案。

      所以,高效的提示遵循和泛化能力,不僅讓人更方便地告訴機(jī)器人「我想讓你做什么」,還能讓現(xiàn)代基礎(chǔ)模型把它們的語義推理和問題解決能力「翻譯」成物理世界中的行動。換句話說,讓機(jī)器人真正理解并動手干活。

      除了這些展望,Physical Intelligence 團(tuán)隊還分享了他們關(guān)于世界模型以及未來 scale 方向的看法。團(tuán)隊成員 Lucy Shi 提到,他們原本賭世界模型會是機(jī)器人泛化能力的關(guān)鍵,結(jié)果數(shù)據(jù)規(guī)模一拉大,VLA 基線就把 world model 吃掉了,而且架構(gòu)簡單得多。







      她把這個「苦中帶甜」的教訓(xùn)寫成論文和 π0.7,結(jié)論是:大規(guī)模多樣數(shù)據(jù) + 正確上下文,就能自然涌現(xiàn)出驚人的組合泛化能力,很多過去覺得「很難」的問題其實沒那么難。





      不過,他們也沒有完全否定 world model。在 π0.7 中,他們?nèi)匀皇褂昧溯p量級 world model 來生成視覺子目標(biāo)。



      同時,Lucy Shi 也發(fā)現(xiàn),現(xiàn)在模型能力是提上來了,但評估又成了新的瓶頸。數(shù)據(jù)那么多,你很難確定模型到底見沒見過某個任務(wù)相關(guān)的數(shù)據(jù),因此泛化也很難定義。這也是未來值得發(fā)力的一個方向



      參考鏈接:https://www.pi.website/blog/pi07

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      如果一個家庭長期沒酒局、沒社交,也少走親戚,只能說明一個問題

      如果一個家庭長期沒酒局、沒社交,也少走親戚,只能說明一個問題

      大熊歡樂坊
      2026-04-19 12:07:22
      僅獲6.3分 姆巴佩單刀踢飛+傷退 復(fù)出后皇馬僅1勝 賽季0冠成定局

      僅獲6.3分 姆巴佩單刀踢飛+傷退 復(fù)出后皇馬僅1勝 賽季0冠成定局

      我愛英超
      2026-04-25 06:18:49
      事件反轉(zhuǎn)!福建女司機(jī)腳踹保安反被扇耳光,耳膜穿孔!保安大叔攤上大事了……

      事件反轉(zhuǎn)!福建女司機(jī)腳踹保安反被扇耳光,耳膜穿孔!保安大叔攤上大事了……

      新民周刊
      2026-04-24 19:24:17
      749局退休人員自述:秦嶺惡龍事件,從發(fā)現(xiàn)到斬殺僅用了三天

      749局退休人員自述:秦嶺惡龍事件,從發(fā)現(xiàn)到斬殺僅用了三天

      千秋文化
      2026-04-10 20:03:43
      黃仁勛說對了!華為宣布全面支持DeepSeek V4,性能是H20的兩倍多

      黃仁勛說對了!華為宣布全面支持DeepSeek V4,性能是H20的兩倍多

      互聯(lián)魚
      2026-04-24 16:05:31
      美軍還沒打贏,“第二個伊朗”冒頭?解放軍“滅國艦隊”開進(jìn)南海

      美軍還沒打贏,“第二個伊朗”冒頭?解放軍“滅國艦隊”開進(jìn)南海

      春序娛樂
      2026-04-25 05:33:41
      喊了36年“董事長”,陳麗華頭七剛過遲重瑞的結(jié)局讓所有人都傻眼

      喊了36年“董事長”,陳麗華頭七剛過遲重瑞的結(jié)局讓所有人都傻眼

      小娛樂悠悠
      2026-04-16 13:32:37
      結(jié)婚第二天公婆裝病騙我的陪嫁房,老公怒吼:房子是我岳父母買的

      結(jié)婚第二天公婆裝病騙我的陪嫁房,老公怒吼:房子是我岳父母買的

      云端小院
      2026-04-25 07:01:27
      里程碑!弗格生涯得分達(dá)到8249分,超越哈里斯升至歷史第17位

      里程碑!弗格生涯得分達(dá)到8249分,超越哈里斯升至歷史第17位

      懂球帝
      2026-04-25 00:06:57
      田亮做夢也沒想到,費心養(yǎng)大的14歲兒子,如今竟“壓自己一頭”

      田亮做夢也沒想到,費心養(yǎng)大的14歲兒子,如今竟“壓自己一頭”

      以茶帶書
      2026-04-23 16:11:50
      年輕人上班帶飯的“飯盒”,能有多邪修?我也是被驚艷到了

      年輕人上班帶飯的“飯盒”,能有多邪修?我也是被驚艷到了

      美家指南
      2026-04-23 15:53:51
      徹底遇冷?暴跌149%虧損6211萬,庫存翻倍,高端電驢為何沒人買了

      徹底遇冷?暴跌149%虧損6211萬,庫存翻倍,高端電驢為何沒人買了

      青梅侃史啊
      2026-04-24 14:53:38
      醫(yī)生自己舉報自己!山東醫(yī)藥大學(xué)深夜通報

      醫(yī)生自己舉報自己!山東醫(yī)藥大學(xué)深夜通報

      醫(yī)脈圈
      2026-04-24 12:20:48
      為啥末代皇帝往往是昏君 看網(wǎng)友分析 思想境界都上了一個大臺階

      為啥末代皇帝往往是昏君 看網(wǎng)友分析 思想境界都上了一個大臺階

      侃神評故事
      2026-04-23 15:40:03
      無數(shù)身價過億的大佬,都在想方設(shè)法把國內(nèi)的錢偷偷轉(zhuǎn)移到海外

      無數(shù)身價過億的大佬,都在想方設(shè)法把國內(nèi)的錢偷偷轉(zhuǎn)移到海外

      流蘇晚晴
      2026-04-14 19:58:25
      模板,原來不讀mó bǎn,我讀錯了三十年!

      模板,原來不讀mó bǎn,我讀錯了三十年!

      未央看點
      2026-04-25 00:18:14
      無緣3連冠!阿爾卡拉斯宣布因傷退出今年法網(wǎng) 辛納沖全滿貫獲利好

      無緣3連冠!阿爾卡拉斯宣布因傷退出今年法網(wǎng) 辛納沖全滿貫獲利好

      我愛英超
      2026-04-25 00:10:36
      從越南難民到掌舵海軍:終結(jié)美軍政治正確的時代

      從越南難民到掌舵海軍:終結(jié)美軍政治正確的時代

      斌聞天下
      2026-04-25 07:00:03
      42戰(zhàn)全敗!四川主帥:只要有人堅守四川男籃就不會倒下,對不起大家

      42戰(zhàn)全敗!四川主帥:只要有人堅守四川男籃就不會倒下,對不起大家

      懂球帝
      2026-04-24 22:52:11
      國資委46號令實施!1996-2026全面清查,退休也追責(zé)到底

      國資委46號令實施!1996-2026全面清查,退休也追責(zé)到底

      林子說事
      2026-04-25 00:14:10
      2026-04-25 08:31:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12852文章數(shù) 142635關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek V4牽手華為,價格依然"屠夫級"

      頭條要聞

      兩屆奧運冠軍、中國羽協(xié)主席張軍"失聯(lián)" 知情人士發(fā)聲

      頭條要聞

      兩屆奧運冠軍、中國羽協(xié)主席張軍"失聯(lián)" 知情人士發(fā)聲

      體育要聞

      上海男籃23連勝+主場全勝 姚明之后最強(qiáng)一季

      娛樂要聞

      停工16個月!趙露思證實接拍新劇

      財經(jīng)要聞

      LG財閥內(nèi)斗:百億美元商業(yè)帝國爭奪戰(zhàn)

      汽車要聞

      零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

      態(tài)度原創(chuàng)

      健康
      教育
      藝術(shù)
      房產(chǎn)
      軍事航空

      干細(xì)胞如何讓燒燙傷皮膚"再生"?

      教育要聞

      教室火鍋”被人民日報點贊,卻被家長瘋狂舉報

      藝術(shù)要聞

      價值1.7億的牡丹!

      房產(chǎn)要聞

      新一輪教育大爆發(fā)來了!海口,開始瘋狂建學(xué)校!

      軍事要聞

      美防長:戰(zhàn)事不會“沒完沒了”

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 91色在线视频| 9l精品国产一区二区| 青草99在线免费观看| 无套內谢波多野结衣| 成人免费一区二区三区视频| 国产成人AV一区二区三区在线观看| 巨茎爆乳无码性色福利| 亚洲偷偷自拍码高清视频| 亚洲成AV人片在线观看麦芽| 中文字幕日韩有码国产| 国产av国片精品一区二区| 丝袜熟女720p| 亚洲欧美在线观看| 99久久无色码中文字幕人妻| 国产愉拍91九色国产愉拍| 韩国18禁啪啪无遮挡免费| 永久免费在线观看蜜桃视频| 亚洲一区精品视频在线| 国产自在自线午夜精品| 草草影院发布页| 法国白嫩大屁股xxxx| 国产98色在线 | 日韩| 99999久久久久久亚洲| 最近中文字幕免费手机版| 影音先锋大黄瓜视频| 成人免费区一区二区三区| 亚洲乱色一区二区三区丝袜| 伊人久久大香线蕉综合影院75| 在线免费成人亚洲av| 91嫩草尤物在线观看| 国产成人av免费观看| 欧美成人亚洲综合精品欧美激情| 亚洲Av男男| 亚洲欧美伊人久久综合一区二区 | 天堂在线中文| 色色中文字幕| 中文国产成人精品久久不卡| 国产成人精品亚洲午夜麻豆| 丝袜熟女露出| JIZZ亚洲| 精品一区二区三区东京热|