<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      Physical Intelligence發現人機遷移能力與預訓練多樣性正相關

      0
      分享至

      就在不久前,機器人初創公司 Generalist AI 發布了他們的 GEN-0 模型,聲稱首次在機器人領域建立了類似語言模型的 scaling law,即隨著預訓練數據和計算量的增加,下游任務性能呈現可預測的冪律提升。

      他們的訓練數據規模達到驚人的 27 萬小時真實世界操作視頻,遠超目前公開的任何機器人數據集。這一發現在業內引發了廣泛關注,因為它意味著機器人智能可能終于踏上了與大語言模型類似的可預測增長軌道。

      今天,另一家知名的機器人初創 Physical Intelligence 又發表了一項研究,從另一個角度佐證了規模效應的存在,而且揭示了一個此前容易被忽略的現象:不僅機器人策略本身會從規模中獲益,從異質數據源汲取知識的能力同樣是規模的產物。


      圖丨相關論文(來源:Physical Intelligence)

      具體而言,當 VLA(Vision-Language-Action,視覺-語言-動作)模型在足夠多樣化的場景、任務和機器人形態上完成預訓練之后,一種此前難以實現的能力會以“涌現”的方式出現:模型突然具備了從人類視頻中學習技能并遷移到機器人執行的能力。而在預訓練規模不足時,無論你怎么精心設計對齊機制,這種跨具身形態的遷移效果都難以令人滿意。


      (來源:Physical Intelligence)

      讓機器人觀看人類操作視頻來學習技能,是業內目前探索的重要路徑之一。它的吸引力顯而易見:人類視頻俯拾皆是,而機器人示范數據的采集成本高昂且進展緩慢。然而現實是,直接把人類視頻喂給機器人模型訓練,效果往往令人失望。

      視覺上,人類的手與機器人的夾爪形態迥異;運動學上,人體關節自由度與機器人末端執行器的動作空間天差地別。這道“跨具身形態”的鴻溝橫亙在人機之間,此前的解決方案大多依賴于各種精心設計的對齊技術,關鍵點追蹤、潛在動作編碼、獎勵建模、仿射變換等等。Physical Intelligence 這項研究的核心貢獻在于表明,在足夠的預訓練規模下,這些顯式對齊步驟可能根本不需要。

      這項研究由 Physical Intelligence 聯合 Georgia Tech 的研究人員完成。第一作者 Simar Kareer 是 Georgia Tech 計算機視覺方向的博士生,此前他就以 EgoMimic 項目在業內嶄露頭角。那套系統用 Meta 的 Project Aria 眼鏡錄制人類第一人稱視頻,讓機器人通過模仿學習掌握疊衣服等家務技能,性能提升幅度達 400%。

      EgoMimic 的成功依賴于一系列精心設計的跨域對齊技術,這也是此前該領域的通行做法。而這次的新研究則試圖回答一個更激進的問題:如果完全不做顯式對齊,純粹依靠預訓練規模,能否讓模型自己學會跨越具身形態的鴻溝?

      為此,研究團隊設計了一套簡單到近乎粗暴的聯合訓練方案。他們把人類視頻當作 VLA 訓練混合數據中的“又一種機器人形態”來處理,采用與機器人數據完全相同的訓練目標:低層級的末端執行器軌跡預測和高層級的子任務語言預測。

      人類手部的 3D 姿態通過手勢追蹤技術提取,映射為類似機器人末端執行器的相對運動;子任務標注則與機器人數據的標注格式保持一致。在微調階段,人類數據與對應任務的機器人數據按 50:50 的比例混合。沒有任何域適應模塊,沒有對抗訓練,沒有手工設計的特征對齊。

      研究團隊刻意不去額外“照顧”模型,把那些常見的域適應與顯式對齊組件都拿掉,只保留最樸素的共同訓練配方,用這種近乎苛刻的設置來檢驗:模型能否僅憑預訓練打下的基礎,把這些異質數據真正消化并轉化為可執行的策略。

      實驗結果呈現出一條清晰的分界線。當 VLA 模型沒有經過預訓練或只在有限數據上預訓練時,加入人類視頻非但沒有幫助,有時甚至會產生負遷移效應。但隨著預訓練數據的多樣性逐步提升,從 25% 到 50%、75%,直至完整的多機器人跨形態預訓練,人類視頻帶來的增益開始顯著上升。在他們的四項泛化基準測試中,最強版本的模型幾乎將整體性能翻了一番。


      (來源:Physical Intelligence)

      這四項基準覆蓋了不同維度的泛化挑戰。場景泛化測試中,機器人需要在從未見過的公寓里整理調料架或梳妝臺,而這些新場景只出現在人類視頻中。物體泛化測試中,機器人要收拾桌上的新廚具,同樣是人類數據引入的品類。最具說服力的是任務泛化測試:機器人數據只演示過把雞蛋放進蛋托的動作,而人類視頻額外展示了按顏色分揀雞蛋的操作。

      結果是,未經人類數據訓練的模型只會隨機放置,分揀正確率約 57%;而聯合訓練后的模型達到了 78% 的準確率,平均每次多正確放置 4 個雞蛋。機器人從人類視頻中學會了“分揀”這個它從未在機器人示范中見過的語義概念。

      而且,這種能力并非線性增長,而是在跨過某個預訓練門檻后才突然顯現出來。

      以雞蛋分揀任務為例,單純增加預訓練多樣性并不能讓只用機器人數據訓練的模型學會分揀,因為分揀這個概念根本不存在于機器人數據中。但增加預訓練多樣性卻能讓模型更有效地從人類視頻中獲取這一知識。

      類似地,在梳妝臺整理任務上,50% 預訓練規模以下的模型從人類視頻中獲益甚微甚至出現負遷移,但在 75% 到 100% 的預訓練規模區間,增益開始穩定累積。這種非線性的涌現模式與大語言模型中觀察到的現象如出一轍:某些能力不是漸進出現的,而是在跨越特定規模門檻后突然“解鎖”。

      研究團隊進一步分析了這種涌現現象背后的機理。通過對模型最后一層視覺令牌的 t-SNE 降維可視化,他們發現了一個有趣的規律:在弱預訓練條件下,人類數據和機器人數據的表征呈現出明顯的分離態勢,模型似乎在用兩套不同的“語言”理解這兩類數據。但隨著預訓練多樣性增加,兩類數據的表征開始逐漸重疊,最終趨于高度混合。

      換言之,充分多樣化的預訓練使得模型形成了“具身無關”的中間表示,人類手臂的揮動和機械臂的伸展在這個表示空間里可以被映射到語義相近的區域。這就解釋了為什么顯式對齊變得不再必要,模型自己完成了這項工作。

      另外,這項研究也揭示,人類數據并不是萬能的。在某些任務上,人類視頻的效果接近于直接使用目標機器人數據,研究團隊在整理梳妝臺和分揀雞蛋任務上觀察到了這一點。但在收拾餐桌的測試中,真實機器人數據仍然明顯優于人類數據。

      研究者將人類數據與來自另一款 UR5 機器人的跨形態遷移數據做了對比,發現兩者表現出相似的遷移特性:都比基線有所提升,但都不及目標機器人自身的數據。所以,在 VLA 的數據混合策略中,人類視頻更應該被視為一種有價值的補充數據源,而非完全替代方案。

      另一個細節是腕部相機的作用。研究團隊讓人類數據采集者佩戴類似機器人腕部相機的微型攝像頭,以縮小傳感器配置上的域差距。在某些任務上,這些額外視角確實帶來了性能提升,但在另一些任務上影響甚微。這提示我們,人類數據采集的傳感器配置可能需要根據目標任務的特點進行權衡。

      目前困擾整個行業的核心瓶頸之一是高質量機器人示范數據的采集成本。遙操作需要專業人員花費大量時間,而且容易引入操作失誤。如果人類視頻能夠有效補充機器人數據,那么數據采集的邊際成本將大幅降低。普通人佩戴智能眼鏡從事日常活動產生的視頻流,理論上都可以成為機器人學習的素材。

      Figure AI 最近宣布的 Project Go-Big 計劃走的就是這條路線,他們與房地產巨頭 Brookfield 合作,打算從其遍布全球的十萬余套住宅單元中大規模采集人類生活視頻,并聲稱已經實現了從純人類視頻到機器人導航的零樣本遷移。

      不過,Physical Intelligence 的研究也給這種愿景設置了一個前提條件:想要有效利用人類視頻,你首先得有一個足夠強大的預訓練基礎。沒有經過充分多樣化預訓練的模型,拿到再多人類視頻也是枉然。也就是說,你必須先投入大量資源構建多樣化的機器人預訓練數據集,才能“解鎖”從人類視頻中學習的能力。


      (來源:Physical Intelligence)

      還有一點值得關注:這項研究使用的人類數據量相當有限,每個任務僅 3 到 5 小時,遠不及網絡上可獲取的海量人類活動視頻。研究者也坦承,他們目前的數據采集方式仍然是片段式的,尚未涉足“在野”環境下的被動采集。未來如何有效利用這些非結構化、非片段式的人類視頻數據,仍是一個開放問題。但至少,這項研究確立了一個重要的基線:在適當的預訓練條件下,即便是相對少量的人類視頻也能產生可觀的遷移效果。

      回顧整個發現的內在邏輯,其實并不難理解。充分多樣化的預訓練迫使模型學會抽象,因為它必須找到不同機器人形態、不同場景、不同任務之間的共性才能有效泛化。

      這種被迫形成的抽象能力,恰好也是跨越人機鴻溝所需要的。當模型的內部表示不再緊密綁定于某一種特定的視覺外觀或運動學參數,而是捕捉到更高層級的語義和意圖,人類手臂和機械手臂之間的差異就變得不再是無法逾越的障礙。

      大語言模型領域的研究者很早就注意到,某些能力只有在模型規模跨越特定門檻后才會涌現。現在看來,機器人基礎模型也存在類似的規模門檻效應,只不過這里的“規模”不僅指參數量,更關鍵的是預訓練數據在場景、任務和具身形態三個維度上的多樣性。對于那些正在規劃機器人數據采集策略的團隊來說,這是一個值得認真對待的發現:數據量固然重要,但數據的多樣性可能更加關鍵。

      參考資料:

      1.https://www.pi.website/download/human_to_robot.pdf

      2.https://www.pi.website/research/human_to_robot

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      男性長期禁欲,性能力會更加強?醫生提醒:可能要付出這幾個代價

      男性長期禁欲,性能力會更加強?醫生提醒:可能要付出這幾個代價

      醫者榮耀
      2025-12-17 12:05:09
      毛主席曾留七大預言:當時沒人信,如今6個已應驗,第7個即將實現

      毛主席曾留七大預言:當時沒人信,如今6個已應驗,第7個即將實現

      秀心文雅
      2025-09-13 10:25:44
      尷尬!佛山一家長稱孩子都畢業了,初三伙食費要補9百多,涉700人

      尷尬!佛山一家長稱孩子都畢業了,初三伙食費要補9百多,涉700人

      火山詩話
      2025-12-15 18:48:49
      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      1951年,戴笠獨子被處決,蔣介石兩年后下令:他的子孫全接回臺灣

      古書記史
      2025-12-11 17:37:45
      北京大學發布驚人科研成果:女性生3-4個小孩死亡風險最低

      北京大學發布驚人科研成果:女性生3-4個小孩死亡風險最低

      必記本
      2025-11-30 16:58:14
      折疊iPhone明年見!蘋果未來兩年發布路線曝光,主打手機五款變七款

      折疊iPhone明年見!蘋果未來兩年發布路線曝光,主打手機五款變七款

      華爾街見聞官方
      2025-12-17 06:15:19
      現在是12月17號上午,剛剛傳來7個驚天大消息,要來大動作了嗎?

      現在是12月17號上午,剛剛傳來7個驚天大消息,要來大動作了嗎?

      股市皆大事
      2025-12-17 08:01:14
      文班亞馬,哭了!MVP!東部第一后衛誕生

      文班亞馬,哭了!MVP!東部第一后衛誕生

      籃球實戰寶典
      2025-12-17 17:24:23
      破案了!場均32分郭昊文今年突然爆發原因找到,得感謝浙江隊1人

      破案了!場均32分郭昊文今年突然爆發原因找到,得感謝浙江隊1人

      后仰大風車
      2025-12-17 09:10:10
      男生長得太帥是一種怎樣的體驗?網友:帥哥的人生有點易如反掌…

      男生長得太帥是一種怎樣的體驗?網友:帥哥的人生有點易如反掌…

      夜深愛雜談
      2025-12-10 19:44:09
      回顧:河南女子去喝喜酒,發現9年前被槍決的弟弟,竟坐在桌對面

      回顧:河南女子去喝喜酒,發現9年前被槍決的弟弟,竟坐在桌對面

      飛云如水
      2024-12-19 01:45:00
      汪明荃和羅家英在不丹補拍婚紗照!相愛36年終圓16年婚紗夢

      汪明荃和羅家英在不丹補拍婚紗照!相愛36年終圓16年婚紗夢

      叨叨話影
      2025-11-20 10:04:28
      小舅子兒子滿月酒辦45桌,我凍結老婆10個賬戶,老婆只能催我掏錢

      小舅子兒子滿月酒辦45桌,我凍結老婆10個賬戶,老婆只能催我掏錢

      今天說故事
      2025-11-19 18:12:51
      劉亦菲的腳引熱議!20年隱痛竟藏這些秘密

      劉亦菲的腳引熱議!20年隱痛竟藏這些秘密

      落雪聽梅a
      2025-12-17 09:44:28
      因長的太漂亮,七次拒絕導演“要求”遭打壓,如今43歲憑實力走紅

      因長的太漂亮,七次拒絕導演“要求”遭打壓,如今43歲憑實力走紅

      山野盧員外
      2025-12-17 16:54:56
      杭州小米交付中心車禍!事件經過曝光,有網友稱是自己堂弟沒了…

      杭州小米交付中心車禍!事件經過曝光,有網友稱是自己堂弟沒了…

      火山詩話
      2025-12-16 05:54:57
      俄媒:佩斯科夫“輕蔑”回應歐洲派兵烏克蘭方案

      俄媒:佩斯科夫“輕蔑”回應歐洲派兵烏克蘭方案

      參考消息
      2025-12-17 16:02:23
      一個人在體制內呆久了會變成什么樣子?網友:我要笑死在評論區

      一個人在體制內呆久了會變成什么樣子?網友:我要笑死在評論區

      夜深愛雜談
      2025-12-05 21:01:58
      收到工資1002415.13元,愛你華為。

      收到工資1002415.13元,愛你華為。

      純潔的微笑
      2025-12-12 21:29:39
      大選被宣布無效?賴清德空歡喜一場!洪都拉斯總統點名警告特朗普

      大選被宣布無效?賴清德空歡喜一場!洪都拉斯總統點名警告特朗普

      絕對軍評
      2025-12-17 15:44:57
      2025-12-17 18:16:49
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      16007文章數 514404關注度
      往期回顧 全部

      科技要聞

      特斯拉值1.6萬億靠畫餅 Waymo值千億靠跑單

      頭條要聞

      男子花十幾萬"賭石"付款前說是頂級貨 切開全是邊角料

      頭條要聞

      男子花十幾萬"賭石"付款前說是頂級貨 切開全是邊角料

      體育要聞

      短短一年,從爭冠到0勝墊底...

      娛樂要聞

      鞠婧祎收入曝光,絲芭稱已支付1.3億

      財經要聞

      重磅信號!收入分配制度或迎重大突破

      汽車要聞

      一車多動力+雙姿態 長城歐拉5上市 限時9.18萬元起

      態度原創

      房產
      家居
      數碼
      公開課
      軍事航空

      房產要聞

      封關前夜!海南綠發20億拿下三亞重磅宅地!

      家居要聞

      溫馨獨棟 駝色與淺色碰撞

      數碼要聞

      AMD推出Radeon RX 9060 XT LP顯卡,9060 XT 16GB降頻版

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      最新現場:山東艦完成年度最后一次海上訓練

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 亚洲V色| 中文字幕乱码在线播放| 欧美肥妇bwbwbwbxx| 天天操夜夜操| 欧美精品久久久| 亚州Av无码| 欧美人与性动交ccoo| 亚洲精品无码你懂的网站| 亚洲激情av| 四子王旗| 中文字幕无码不卡一区二区三区| 亚洲成av人片在一线观看| 天堂a无码a无线孕交| 于田县| 亚洲精品美女久久久久久久| 美女张开腿黄网站免费| 精品日韩亚洲av无码| 久久神马| 国产精品久久久久aaaa| 欧美精品黑人粗大| 精品尤物TV福利院在线网站| 91在线综合| 色老板精品视频在线观看| 久久精品无码专区免费| 亚洲国产成人AⅤ片在线观看| 在线观看的av网站| 人人妻人人插视频| 麻豆a级片| 婷婷丁香社区| 精品人妻一二| 特级毛片爽www免费版| 99久久婷婷国产综合精品青草漫画 | 国产精品成人观看视频国产奇米| 国产97色在线 | 日韩| 亚洲全网成人资源在线观看| 日韩肏屄| 国产成a人亚洲精v品无码性色| 欧美丰满熟妇bbb久久久| 久久精品国产77777蜜臀| 亚洲综合在线成人| 精品av综合导航|