<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      10萬小時數(shù)據(jù)不搞對齊只靠規(guī)模,靈初智能Psi-R2登頂MolmoSpaces!

      0
      分享至



      機器之心發(fā)布

      具身智能,正在進入一個新的敘事階段。

      一個越來越清晰的現(xiàn)實正在浮現(xiàn):只靠真機遙操作數(shù)據(jù),未必能把機器人真正送進大規(guī)模場景。

      原因不難理解。數(shù)據(jù)貴,采得慢,節(jié)拍還往往不夠真實。實驗室里能跑通的 demo,到了工廠、倉儲和零售現(xiàn)場,常常會被速度、成本和穩(wěn)定性重新審視。真正決定下一階段競爭的,已經(jīng)不只是 “誰能做出一個演示”,而是誰能先把真實世界里的人類操作經(jīng)驗,規(guī)模化地轉(zhuǎn)成機器人可學(xué)習(xí)、可迭代、可部署的能力。

      4 月 10 日晚,靈初智能發(fā)布了大模型、數(shù)據(jù)集與合作計劃:包括策略模型 Psi-R2世界模型 Psi-W0,以及總規(guī)模近 10 萬小時的人類操作數(shù)據(jù)。它想回答的問題也很直接 —— 當(dāng)真機數(shù)據(jù)不再是唯一解,機器人還能靠什么繼續(xù) scaling?

      表面看,這是一場新品發(fā)布;但更深一層看,它更像一次方法論發(fā)布:當(dāng)具身智能沒有互聯(lián)網(wǎng)式的數(shù)據(jù)紅利時,下一步到底該靠什么繼續(xù)往前走。



      當(dāng)真機數(shù)據(jù)不再夠用

      具身智能為什么轉(zhuǎn)向 “人類數(shù)據(jù)”

      先看這次到底發(fā)布了什么。

      • 技術(shù)博客鏈接:https://www.psibot.ai/from-human-skill-to-robotic-mastery/

      模型側(cè),是Psi-R2Psi-W0。數(shù)據(jù)側(cè),是總規(guī)模近 10 萬小時的人類操作數(shù)據(jù),以及首批開源的 1000 小時數(shù)據(jù)。這 1000 小時數(shù)據(jù),被作為當(dāng)前行業(yè)最大開源的人類手部操作全模態(tài)數(shù)據(jù)集之一來推出。

      更具體地看,這套體系中包含5417 小時真機數(shù)據(jù),來自靈初自研的 MobiDex 數(shù)采平臺;人類數(shù)據(jù)則達到95472 小時,覆蓋多場景、多任務(wù)、多物體。這也是少數(shù)明確把近 10 萬小時量級人類數(shù)據(jù)系統(tǒng)性用于機器人預(yù)訓(xùn)練的模型方案。

      為什么是 “人類數(shù)據(jù)”?

      因為具身智能和大語言模型、自動駕駛不一樣。它沒有互聯(lián)網(wǎng)式的海量現(xiàn)成數(shù)據(jù),也很難在商業(yè)運行中自然沉淀出足夠規(guī)模的高質(zhì)量訓(xùn)練樣本。數(shù)據(jù)從哪里來,已經(jīng)成了這個行業(yè)最核心的問題之一。

      而人類每天都在真實環(huán)境里,用雙手完成高頻、連續(xù)、精細的操作。這些數(shù)據(jù)天然貼近機器人未來要面對的工作世界。它們發(fā)生在真實任務(wù)中,帶著真實節(jié)拍,也帶著真實的操作細節(jié)。從落地角度看,這類數(shù)據(jù)的價值遠不只是 “多了一種數(shù)據(jù)源” 那么簡單。

      但 Human Data 并不是采得多就夠了。

      它最大的難點,首先是embodiment gap,也就是人手和機械手在運動學(xué)、動力學(xué)上的天然差異。其次是精度問題。很多人類操作數(shù)據(jù)來自第一視角視頻,軌跡恢復(fù)往往只有厘米級精度;一旦進入手機裝配這類亞毫米級任務(wù),這種誤差就會被迅速放大。

      為了解決這個問題,靈初自研了外骨骼觸覺手套和高精度感知硬件,把人手 3D 軌跡采集推到更高精度。另一部分裸手數(shù)據(jù),精度沒那么高,但規(guī)模更大,主要負責(zé)提供泛化能力。

      換句話說,靈初并不是簡單把 “人類數(shù)據(jù)” 當(dāng)作替代真機數(shù)據(jù)的便宜選項,而是在試圖建立一套分層的數(shù)據(jù)結(jié)構(gòu):高精度數(shù)據(jù)負責(zé)上限,大規(guī)模數(shù)據(jù)負責(zé)泛化,兩者一起為機器人訓(xùn)練提供新的底座。

      一套系統(tǒng)

      比單個模型更關(guān)鍵

      更有意思的是,靈初最后并沒有走一條特別 “花哨” 的對齊路線。

      他們嘗試過圖像修補、關(guān)鍵點輔助 loss、特征空間對齊等做法,想把人類數(shù)據(jù)盡可能修成更像機器人數(shù)據(jù)的樣子。但最后發(fā)現(xiàn),數(shù)據(jù)量小的時候這些方法有幫助;數(shù)據(jù)量一旦上來,它們反而會變成瓶頸。

      原因并不復(fù)雜。那些方法本質(zhì)上都在努力模糊人和機器人的差異,但在長程、精細、接觸密集的任務(wù)里,這種差異恰恰不能被輕易抹平。越是復(fù)雜和精細的任務(wù),越需要承認兩種 embodiment 的真實不同。強行 “抹平” 之后,模型反而更容易在關(guān)鍵動作上犯錯。

      所以,靈初最后選了一條更樸素的路:只做必要的輸入輸出維度對齊,把人類關(guān)節(jié)通過運動學(xué)映射到機器人關(guān)節(jié),圖像盡量不做處理,直接把原始數(shù)據(jù)喂給模型。它給這條路線的總結(jié)也很直白:raw data in, raw data out

      在這套方法里,Psi-R2負責(zé) “先學(xué)會怎么做”。

      它的輸入是圖像和語言,輸出同時包括未來視頻和機器人動作。也就是說,它不是只學(xué)下一步動作,而是在同時學(xué)習(xí) “接下來世界會怎樣變化”。這套設(shè)計建立在預(yù)訓(xùn)練視頻生成模型之上,目標是把大規(guī)模人類數(shù)據(jù)里的任務(wù)知識,盡可能裝進策略模型。

      在大規(guī)模預(yù)訓(xùn)練之后,Psi-R2 僅需少于 100 條真機軌跡微調(diào),就能完成手機裝配、工業(yè)包裝、疊紙盒等長程、精細任務(wù)。



      但只學(xué)成功動作,還不夠。

      因為成功示范只能告訴模型 “應(yīng)該怎么做”,卻不能告訴它 “換一種做法,會在哪一步失敗”。而這恰恰是強化學(xué)習(xí)最需要的信息。

      這也是Psi-W0的位置。

      它接收圖像、語言和機器人動作軌跡,去預(yù)測未來視頻。相比 Psi-R2,Psi-W0 多了一項關(guān)鍵職責(zé):建模失敗、建模反事實、建模試錯空間。為此,Psi-W0 的訓(xùn)練中額外加入了約 30% 的失敗數(shù)據(jù)。

      換句話說,Psi-W0 不只是一個 “會預(yù)測” 的模型,它更像一個可以用來評估和打磨策略的訓(xùn)練場。Psi-R2 先從人類數(shù)據(jù)里學(xué)到任務(wù)知識,再把軌跡送進 Psi-W0 做 rollout;隨后在機器人動力學(xué)約束下,通過強化學(xué)習(xí)做小步修正,把 “人類會做” 的軌跡改造成 “機器人也能做” 的軌跡。好的軌跡回流訓(xùn)練集,壞的軌跡幫助世界模型繼續(xù)變準,飛輪就這樣轉(zhuǎn)起來。

      這也是這次發(fā)布最值得注意的地方:真正起作用的,不是某一個單點模型,而是Psi-R2、Psi-W0 與強化學(xué)習(xí)的系統(tǒng)協(xié)同。

      圍繞 Human Data,靈初也給出了一組很值得行業(yè)參考的判斷:對數(shù)據(jù)分布來說,任務(wù)多樣性 > 物體多樣性 >> 場景多樣性;對模態(tài)價值來說,精準 3D 位姿 > 觸覺 > 2D 圖像特征

      翻譯成更直白的話就是:背景是不是足夠復(fù)雜,未必最重要;真正決定模型上限的,是它見過多少任務(wù)、碰過多少物體,以及它是否真正理解了接觸和操作細節(jié)。

      也因此,靈初把觸覺看成一種跨具身的 “通用語言”。人手和機械手的結(jié)構(gòu)可以不同,但 “碰到了沒有”“接觸是怎樣發(fā)生的” 這類物理信號,本質(zhì)上是相通的。



      從論文到現(xiàn)場

      落地還要跨過部署關(guān)

      如果說前面解決的是 “技術(shù)上行不行”,那商業(yè)化真正關(guān)心的,始終是 “這條路值不值得走”。

      答案很明確:值得,而且必須走。

      原因很簡單。實驗室里,動作慢一點、路徑繞一點,很多 demo 依然可以做出來;但到了工廠、倉儲和零售現(xiàn)場,節(jié)拍、成本和穩(wěn)定性會重新定義一切。真實作業(yè)里,一個動作多一步、一拍慢一點,最后都會落到良率和成本上。

      從這個角度看,最有價值的數(shù)據(jù),往往不是實驗室里的遙操作演示,而是一線工人的真實作業(yè)數(shù)據(jù)。

      一方面,人類數(shù)據(jù)采集可以更便宜,其成本被壓到了傳統(tǒng)真機遙操作方案的十分之一以下。另一方面,它的節(jié)拍更真實,更貼近業(yè)務(wù)現(xiàn)場的 SOP 和速度要求。

      工程側(cè)的進展,則讓這件事離落地又近了一步。

      通過 DiT Caching、Torch Compile、量化等優(yōu)化,單次推理時間已從 2.2 秒壓到 100 毫秒以內(nèi)。對于連續(xù)、靈巧、順滑的操作來說,這已經(jīng)不是 “優(yōu)化得不錯”,而是能不能真正進場部署的一道門檻。

      外部基準,也給了這套方法一個注腳。

      截至發(fā)稿,公開榜單頁面顯示,在 MolmoSpaces Combined 榜單、且不使用 MolmoBot Data 的分組中,Psi-R2 以 46.4 的 Oracle Success Rate 排名第一,并覆蓋 4 個任務(wù)。



      MolmoSpace 由美國艾倫人工智能研究所(AllenAI)發(fā)起,是全球具身智能領(lǐng)域權(quán)威基準評測平臺,NVIDIA、PI 等全球頂尖團隊均參與本次評測。靈初 Psi-R2 在評測中超越 PI、DreamZero 等國際知名模型,表現(xiàn)顯著優(yōu)于其他基線模型,成功率大幅領(lǐng)先同類 VLA 產(chǎn)品,充分體現(xiàn)出企業(yè)自主研發(fā)路線的先進性與競爭力

      這個細節(jié)的價值,不只是 “上榜”。更重要的是,它說明這套方法,正在進入一個公開、可比較的評價環(huán)境里接受檢驗。

      把這些信息放在一起看,這次發(fā)布的重點并不只是 “又發(fā)了一個模型”,也不只是 “又開源了一批數(shù)據(jù)”。

      它更像是在對外釋放一個判斷:

      第一,具身智能的瓶頸是數(shù)據(jù),而人類數(shù)據(jù)不是旁路,而是主線。

      第二,真正能把人類經(jīng)驗轉(zhuǎn)成機器人能力的,不是單個模型,而是Psi-R2、Psi-W0 和強化學(xué)習(xí)共同構(gòu)成的系統(tǒng)

      第三,所有技術(shù)問題的終點都不是論文,而是落地:節(jié)拍、成本、推理速度、數(shù)據(jù)飛輪能不能真正轉(zhuǎn)起來,才是最后的檢驗標準。

      如果這套路線最終走通,這次開源的意義,就不只是 “放出一個模型,開放一批數(shù)據(jù)”。



      它更像是在告訴行業(yè):具身智能真正的分水嶺,也許已經(jīng)不再是誰先做出更驚艷的 demo,而是誰能先把Human Data、世界模型和強化學(xué)習(xí)連成一條持續(xù)運轉(zhuǎn)的增長曲線。

      從這個意義上說,這次想發(fā)布的,也許不只是一個新產(chǎn)品。

      而是一個新階段。

      文中視頻鏈接:https://mp.weixin.qq.com/s/8qnnf6J9sgh9thTbfg1ndg

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      網(wǎng)友調(diào)侃陳都靈是搓衣板身材,胸前沒有二兩肉,瘦的離譜

      網(wǎng)友調(diào)侃陳都靈是搓衣板身材,胸前沒有二兩肉,瘦的離譜

      TVB的四小花
      2026-04-25 18:47:36
      男生省吃儉用送滿改鍵盤 女神轉(zhuǎn)手掛閑魚反罵"舔狗"

      男生省吃儉用送滿改鍵盤 女神轉(zhuǎn)手掛閑魚反罵"舔狗"

      游民星空
      2026-04-26 11:10:12
      對美元的重大誤判,正在深度誤導(dǎo)我們

      對美元的重大誤判,正在深度誤導(dǎo)我們

      世界靈敏度趙靈敏
      2026-04-26 18:36:10
      孩子脫臼復(fù)位只收100元,家長舉報亂收費!衛(wèi)健委:應(yīng)收110元,你還少給了!家長拒繳費后離開!

      孩子脫臼復(fù)位只收100元,家長舉報亂收費!衛(wèi)健委:應(yīng)收110元,你還少給了!家長拒繳費后離開!

      醫(yī)脈圈
      2026-04-25 20:04:06
      2859.2克黃金制品被警方扣押三十年:公安已約當(dāng)事人面談

      2859.2克黃金制品被警方扣押三十年:公安已約當(dāng)事人面談

      新京報
      2026-04-26 21:05:03
      回榜首!阿森納奪冠概率升至72.4% 曼城遭看衰:會輸2場+3分丟冠

      回榜首!阿森納奪冠概率升至72.4% 曼城遭看衰:會輸2場+3分丟冠

      我愛英超
      2026-04-26 07:40:23
      12分鐘,13投全中,NBA最不講理的得分表演,沒有之一

      12分鐘,13投全中,NBA最不講理的得分表演,沒有之一

      林子說事
      2026-04-26 15:22:42
      中國11人僅剩2人!趙心童回應(yīng)淘汰丁俊暉:他狀態(tài)不好 給了我機會

      中國11人僅剩2人!趙心童回應(yīng)淘汰丁俊暉:他狀態(tài)不好 給了我機會

      風(fēng)過鄉(xiāng)
      2026-04-26 21:22:02
      英媒:前米蘭球員博列洛因私處藥膏遭禁賽,曾稱一天親熱37次

      英媒:前米蘭球員博列洛因私處藥膏遭禁賽,曾稱一天親熱37次

      懂球帝
      2026-04-26 18:37:16
      被賣緬甸女大學(xué)生后續(xù):園區(qū)同意放人,黑幕曝光,父親覺得不對勁

      被賣緬甸女大學(xué)生后續(xù):園區(qū)同意放人,黑幕曝光,父親覺得不對勁

      云舟史策
      2026-04-26 17:10:28
      集體發(fā)病?北京車展成了嚼過的檳榔渣:沒感覺自己病了才完蛋

      集體發(fā)病?北京車展成了嚼過的檳榔渣:沒感覺自己病了才完蛋

      道哥說車
      2026-04-26 18:58:56
      伊朗外長向巴基斯坦遞交停戰(zhàn)條件

      伊朗外長向巴基斯坦遞交停戰(zhàn)條件

      新華社
      2026-04-26 23:15:28
      中國民間向烏克蘭捐款至少6530萬美元

      中國民間向烏克蘭捐款至少6530萬美元

      紫京講談
      2026-04-26 16:22:17
      天涯神貼之東三省人口持續(xù)流出的真正原因

      天涯神貼之東三省人口持續(xù)流出的真正原因

      回旋鏢
      2026-04-26 13:42:15
      特朗普:伊朗戰(zhàn)爭很快結(jié)束 美國將取勝

      特朗普:伊朗戰(zhàn)爭很快結(jié)束 美國將取勝

      新華社
      2026-04-26 23:33:25
      網(wǎng)友開盒掛出“深圳派出所煙男”名單,微博官方:嚴重違規(guī),已關(guān)號處理

      網(wǎng)友開盒掛出“深圳派出所煙男”名單,微博官方:嚴重違規(guī),已關(guān)號處理

      極目新聞
      2026-04-26 17:45:26
      廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

      廣告使用“清朝長辮”被指辱華,法國品牌Lemaire致歉

      南方都市報
      2026-04-26 20:40:18
      世錦賽戰(zhàn)報:吳宜澤4-4,連爆大冷,3位80后大滿貫得主都被逼平了

      世錦賽戰(zhàn)報:吳宜澤4-4,連爆大冷,3位80后大滿貫得主都被逼平了

      求球不落諦
      2026-04-26 20:17:11
      她長這么漂亮,演技那么好,為啥這么多年一直火不起來呢?

      她長這么漂亮,演技那么好,為啥這么多年一直火不起來呢?

      草莓解說體育
      2026-04-26 14:16:31
      從能耗世界紀錄到越野新品類,傳祺北京車展的炮火與底氣

      從能耗世界紀錄到越野新品類,傳祺北京車展的炮火與底氣

      汽車觀察AUTO
      2026-04-25 18:08:20
      2026-04-27 01:19:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12855文章數(shù) 142636關(guān)注度
      往期回顧 全部

      科技要聞

      漲價浪潮下,DeepSeek推動AI“價格戰(zhàn)”

      頭條要聞

      特朗普內(nèi)閣又一女部長落馬:強迫男下屬為其提供性服務(wù)

      頭條要聞

      特朗普內(nèi)閣又一女部長落馬:強迫男下屬為其提供性服務(wù)

      體育要聞

      森林狼3比1掘金:逆境中殺出了多孫穆?!

      娛樂要聞

      僅次《指環(huán)王》的美劇,有第二季

      財經(jīng)要聞

      事關(guān)新就業(yè)群體,中辦、國辦發(fā)文

      汽車要聞

      預(yù)售19.38萬元起 哈弗猛龍PLUS七座版亮相

      態(tài)度原創(chuàng)

      家居
      游戲
      時尚
      房產(chǎn)
      公開課

      家居要聞

      自然肌理 溫潤美學(xué)

      LOL最吸金戰(zhàn)隊誕生!T1主場坐滿15000人,LPL解說滿臉羨慕

      比闊腿褲還時髦?今年夏天一定要有“這條褲子”,減齡又松弛

      房產(chǎn)要聞

      新一輪教育大爆發(fā)來了!海口,開始瘋狂建學(xué)校!

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關(guān)懷版 主站蜘蛛池模板: 成年男女免费视频在线观看不卡| 久久人人97超碰人人澡爱香蕉| 一本加勒比hezyo无码资源网| 国产美女午夜福利视频| 亚洲中文在线观看| 97在线视频观看| 成人一级黄色毛片| 亚洲一区二区精品自拍| av天堂免费在线播放| 国产99久久精品一区二区| 亚洲色无码中文字幕| 久久青青草原亚洲AV无码麻豆| 夜夜添狠狠添高潮出水| 亚洲成人av| 99精品视频在线观看| 野外做受三级视频| 最近免费字幕中文大全在线观看 | 中文无码毛片又爽又刺激| 白浆视频在线观看| 国产黄色免费看| 国产三级最新在线观看不卡 | 欧美综合激情网| aaaaa级少妇高潮大片免费看| 女厕偷窥一区二区三区| 国产乱人伦偷精品视频下| 欧洲AV在线| 国产精品成人无码久久久| 日本一卡精品视频免费| 嫩呦囯产一区二区三区| 精品人妻潮喷久久久又裸又黄| 果冻传媒一区| 亚洲无码网| 夜夜高潮次次欢爽av女| 天天爽夜夜爽天天做夜夜做| 一本色道久久综合亚洲精品按摩 | 久色资源| 国产一区二区三区禁18| 日韩成人大屁股内射喷水| 旬邑县| 亚洲爆乳精品无码一区二区三区| www日韩|