<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      中國具身屠榜全球!10萬小時數(shù)據(jù)炸場,PI、英偉達(dá)集體破防

      0
      分享至


      新智元報道

      編輯:犀牛

      【新智元導(dǎo)讀】10萬小時人類數(shù)據(jù)、不搞對齊只靠規(guī)模,靈初Psi-R2登頂MolmoSpaces。


      具身智能領(lǐng)域最近有一個心照不宣的焦慮:真機遙操作數(shù)據(jù)這條路,可能走不下去了。

      成本是一方面——采集一小時數(shù)據(jù)動輒花數(shù)百元,還得搭一套專業(yè)動捕環(huán)境。

      速度更是硬傷:人盯著屏幕遙控機械臂,采集節(jié)奏很難跟上真實生產(chǎn)節(jié)拍。

      這意味著,單純依賴遙操作數(shù)據(jù),恐怕無力同時支撐大規(guī)模訓(xùn)練與產(chǎn)業(yè)落地。

      那換條路呢?

      人類本來就在真實作業(yè)場景中完成海量高精細(xì)操作,讓人直接干活,再把人的操作數(shù)據(jù)扒下來給機器人用。

      難點至少兩個。

      第一,人手和機械手長得不一樣,人類操作不能直接平移到機器人身上。

      第二,如果只靠第一視角視頻去還原人手動作,精度又往往不夠,很難支撐高精細(xì)任務(wù)。

      靈初智能最近交了一份答卷。

      他們用10萬小時人類操作數(shù)據(jù)搭了一套PSI框架,里面有兩個大模型:策略模型Psi-R2負(fù)責(zé)學(xué)「任務(wù)該怎么做」,世界模型Psi-W0負(fù)責(zé)補換種做法會怎樣,再把人類操作一步步轉(zhuǎn)成機器人真能執(zhí)行的動作。(tech blog鏈接:https://www.psibot.ai/from-human-skill-to-robotic-mastery/)

      模型之外,靈初還亮出了近10萬小時人類數(shù)據(jù),以及1000小時開源數(shù)據(jù)集。

      這套方法之外,靈初智能同時拿出了近10萬小時人類數(shù)據(jù),以及1000小時開源數(shù)據(jù)集。

      一、10萬小時人類數(shù)據(jù)

      開始被當(dāng)作機器人預(yù)訓(xùn)練的主料

      這套路子的起點很簡單:把人類操作數(shù)據(jù)直接塞進(jìn)機器人預(yù)訓(xùn)練的主干。

      據(jù)靈初披露,Psi-R2預(yù)訓(xùn)練同時用真機數(shù)據(jù)和人類數(shù)據(jù)。

      真機數(shù)據(jù)來自靈初Psi-MobiDex數(shù)據(jù)集,5417小時;人類數(shù)據(jù)總規(guī)模95472小時,覆蓋294種場景、4821種任務(wù)、1382種物體。

      背后是一種很直接的判斷。

      具身智能長期缺「存量數(shù)據(jù)」——不像自動駕駛有多年路測積累,也不像大模型能從互聯(lián)網(wǎng)白撿海量文本。

      機器人想學(xué)會做事,沒法像文字或圖像那樣從現(xiàn)成語料里撈,只能靠現(xiàn)實世界一口一口喂。

      真機遙操作曾經(jīng)是條相對自然的路,但模型規(guī)模一大、任務(wù)一復(fù)雜,這種數(shù)據(jù)供給方式就開始掉鏈子。

      于是人類數(shù)據(jù)的價值被重新抬了上來。

      它的吸引力就兩條:一是來源天然豐富,人本來就在不停干活;二是數(shù)據(jù)更貼近真實作業(yè),天然帶著任務(wù)目標(biāo)、動作細(xì)節(jié)和節(jié)拍信息。

      說白了,機器人想學(xué)會干活,最密集、最成熟的示范樣本,本來就長在人手上。

      關(guān)鍵是怎么把人類數(shù)據(jù)和真機數(shù)據(jù)捏在一起訓(xùn)。

      靈初試過一堆更復(fù)雜的招:圖像修復(fù)、關(guān)鍵點輔助損失、跨空間對齊……小數(shù)據(jù)量時確實管用。

      但數(shù)據(jù)一上量,這些精巧模塊全成了瓶頸。

      原因不復(fù)雜,這些方法本質(zhì)上是想讓人手和機械手看起來一樣,可它倆的物理規(guī)律壓根不同。

      對手機裝配這種精細(xì)活,強行對齊反而引入誤差。

      最后剩下的,反而是一條樸素的路線:Raw Data In, Raw Data Out

      落到工程上,就是把人手關(guān)節(jié)用運動學(xué)公式硬算成機械手關(guān)節(jié),圖像原封不動直接喂給模型,人為處理越少越好。

      從結(jié)果看,這條路線暫時跑通了。

      據(jù)靈初披露,Psi-R2完成預(yù)訓(xùn)練后,只要用少于100條軌跡的真機數(shù)據(jù)微調(diào),就能干手機裝配、工業(yè)包裝、紙盒折疊這些長時序、高精度的活。

      光有數(shù)據(jù)還不夠。

      怎么讓機器人「吃」進(jìn)去?這就引出這套框架的真正核心——世界模型里的強化學(xué)習(xí)。

      二、Psi-W0

      把「如果失敗了會怎樣」補了回來

      光看Psi-R2,這套方法有個天然缺口:它擅長從成功軌跡中學(xué)習(xí),但自己很難長出反事實能力。

      這正是世界模型該上場的地方。

      Psi-W0吃進(jìn)圖像、語言指令和機器人動作軌跡,吐出未來場景的視頻預(yù)測。

      它和Psi-R2最大的不同在于:動作在這里不只是預(yù)測結(jié)果,而是直接參與條件生成。

      說白了,它就是一個動作條件型世界模型(AC-WM)。

      再直白一點:Psi-R2像「會做題的學(xué)生」,Psi-W0像一套能把過程重新推演的系統(tǒng)。

      策略模型知道什么動作曾經(jīng)成功,卻不知道動作偏一點、順序亂一點、接觸晚一點會發(fā)生什么。

      可偏偏強化學(xué)習(xí)、策略評估、人類動作向機器人動作的真正遷移,全都離不開這部分信息。

      為了讓模型學(xué)會理解失敗,Psi-W0在訓(xùn)練里額外加入了約30%的失敗樣本,這些數(shù)據(jù)來自專項采集、常規(guī)采集和推理過程。

      這樣一來,它不只認(rèn)識「成功長什么樣」,也開始知道「失敗會怎樣展開」。

      在整套系統(tǒng)里,Psi-W0承擔(dān)著兩層作用

      第一層是評估。類數(shù)據(jù)規(guī)模再大,也不等于知識自動進(jìn)了模型。

      策略到底有沒有真學(xué)會「人怎么做這件事」?

      需要一個能推演軌跡、判斷結(jié)果的系統(tǒng)來檢驗,Psi-W0就是這個角色。

      第二層更關(guān)鍵:它直接參與把人類數(shù)據(jù)轉(zhuǎn)成機器人數(shù)據(jù)

      以抓取任務(wù)為例。人類抓蘋果的動作映射到機器人身上,很可能就差那么一丁點就抓不起來。

      對高精細(xì)任務(wù),這種偏差往往是致命的。

      傳統(tǒng)做法得把場景和物體重建進(jìn)仿真器,再在仿真里做強化學(xué)習(xí)微調(diào)——流程重、成本高,還得忍受Sim2Real gap。

      靈初智能的思路,是把這過程搬進(jìn)世界模型里完成。

      先讓Psi-R2學(xué)一條人類數(shù)據(jù),再把軌跡交給Psi-W0推演,在機器人視覺和機器人動力學(xué)條件下看動作結(jié)果;不理想就繼續(xù)用強化學(xué)習(xí)調(diào),直到這條軌跡更貼近機器人真能執(zhí)行的狀態(tài)。

      整體看,這相當(dāng)于多了一層「夢里試錯」的空間。

      好軌跡可以回流到訓(xùn)練中,成為新的有效數(shù)據(jù);偏掉的軌跡也有價值,它們幫助模型識別失敗邊界,推動世界模型越來越準(zhǔn)。

      所謂數(shù)據(jù)飛輪,就是這么轉(zhuǎn)起來的。

      這套方法很快在公開榜單上被驗證了。

      在由美國 Allen Institute for AI 發(fā)起的 MolmoSpaces 榜單中,靈初智能的 Psi-R2 在總榜中位列第一,整體表現(xiàn)超過具身大模型標(biāo)桿 π 以及英偉達(dá) GEAR 等主流方案,并與其他基線模型拉開差距。

      MolmoSpaces 是當(dāng)前具身智能領(lǐng)域少數(shù)與真實世界評測具有較強相關(guān)性的公開基準(zhǔn)之一。NVIDIA、PI 等全球頂尖團隊均參與本次評測。而 Psi-R2 位列其上。


      三、數(shù)據(jù)真正的分水嶺

      在于信噪比、精度和節(jié)拍

      如果說雙模型架構(gòu)回答的是「怎么學(xué)」,那這次發(fā)布里另一個更耐人尋味的問題,是「什么樣的數(shù)據(jù)才值得學(xué)」。

      靈初智能給出了一個很干脆的判斷。

      決定數(shù)據(jù)價值的核心因素,不在數(shù)量本身,而在信噪比。

      低信噪比數(shù)據(jù)不光效率低,還會拖垮訓(xùn)練效果。

      再往細(xì)了拆:在數(shù)據(jù)分布上,優(yōu)先級是任務(wù)多樣性 > 物體多樣性 >> 場景多樣性;在感知模態(tài)上,優(yōu)先級是精準(zhǔn)3D位姿 >> 觸覺模態(tài) > 2D圖像特征。

      這組結(jié)論挺有指向性。

      它說明具身智能模型真正缺的,是更豐富的任務(wù)類型、更扎實的物體交互、更高精度的動作軌跡。

      畢竟對操作任務(wù)來說,背景很多時候只是背景,模型真正要學(xué)的是物體、動作和接觸關(guān)系。

      在這幾個維度里,3D位姿精度尤其要命。

      當(dāng)前常見的人類數(shù)據(jù)采集方式里,純第一視角視頻當(dāng)然成本低、規(guī)模大,但精度始終是硬傷。

      據(jù)靈初披露的方案,他們通過端到端的第一視角手部檢測模型預(yù)測MANO參數(shù)和位姿,再結(jié)合DPVO和Any4D,把軌跡統(tǒng)一到世界坐標(biāo)系。

      即便如此,只靠純第一視角視頻恢復(fù)的人手操作軌跡,誤差仍然在毫米級;引入自研外骨骼手套之后,才能壓到亞毫米級。

      這也是為什么精細(xì)裝配場景對采集精度格外敏感。手機裝配、紙盒插接、精密抓取這類任務(wù),很多時候不是靠「差不多」就能完成,誤差只要再放大一點,動作就會徹底失效。


      除了位姿精度,另一條線索是觸覺

      這幾年,觸覺在機器人通用模型里一直是個稀罕物。

      因為機器人端的觸覺傳感器本身就難穩(wěn)定部署,不同硬件廠商的數(shù)據(jù)格式也不兼容,想把它做成可規(guī)模化復(fù)用的數(shù)據(jù)源很難。

      但人類側(cè)的觸覺采集條件寬松得多,設(shè)備更輕,成本也更低。

      靈初這次把觸覺看作一條關(guān)鍵線索。

      人和機器人外形不同、關(guān)節(jié)不同、動力學(xué)不同,但「碰到了沒有」、「接觸發(fā)生在什么時候」這類信號,本來就接近一種跨本體的共通語言。

      考慮到現(xiàn)實里大多數(shù)機器人根本沒有成熟可用的觸覺通道,靈初用了Mask Training的方式:真機數(shù)據(jù)輸入時把觸覺通道屏蔽掉,讓模型去預(yù)測觸覺信號,而不是直接拿它當(dāng)觀測輸入。

      據(jù)其披露,引入觸覺后,Psi-W0的表現(xiàn)明顯提升,模型對機器人和物體交互過程的預(yù)判能力也更強。

      再往下看,真正把實驗室和工廠區(qū)分開的,還是節(jié)拍。

      這也是人類數(shù)據(jù)被重新看重的另一個原因。

      真實工廠里的標(biāo)準(zhǔn)作業(yè)流程,往往是長期打磨出來的最優(yōu)結(jié)果,每多一個動作、每慢一個節(jié)拍,都可能在規(guī)?;a(chǎn)中被成倍放大。

      假設(shè)機械臂物理運動上限是 1200,遙操作往往只能做到 800 甚至更低;而人在本職工作中完成操作時,節(jié)拍可以逼近機械臂的運動極限。

      換句話說,人類數(shù)據(jù)的價值不只在于采得更便宜,也在于它更貼近真實 SOP,更貼近真實作業(yè)速度。

      對于想走向落地的具身智能模型來說,這種數(shù)據(jù)天然更接近產(chǎn)業(yè)需求本身。

      四、1000小時開源數(shù)據(jù)集

      背后是一條更完整的訓(xùn)練路徑

      靈初這次還順手甩出了一套開源數(shù)據(jù)集??偙P子接近10萬小時的人類操作數(shù)據(jù),先開源其中1000小時。

      別小看這1000小時。

      門道藏在結(jié)構(gòu)里:一類是高精度數(shù)據(jù),處理之后軌跡能高度對齊真機,回放性極強;另一類主攻大規(guī)模擴展,精度可控,優(yōu)先把數(shù)據(jù)量和泛化空間拉滿。

      一個管操作精度,一個管預(yù)訓(xùn)練邊界——兩種數(shù)據(jù)放在同一套體系里,訓(xùn)練框架才算真正閉環(huán)。

      順著往下看,這次發(fā)布的核心看點,早就不在模型名字、榜單排名或者開源數(shù)據(jù)本身。


      靈初真正亮出來的,是一條完整的訓(xùn)練路徑:當(dāng)真機遙操作數(shù)據(jù)撐不起大規(guī)模預(yù)訓(xùn)練,就把人類數(shù)據(jù)塞進(jìn)訓(xùn)練主脈。

      但光有人類數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠——得靠策略模型承接,得靠世界模型做反事實推演和強化學(xué)習(xí)調(diào)優(yōu),還得有一套轉(zhuǎn)換機制,把人的動作穩(wěn)穩(wěn)當(dāng)當(dāng)變成機器人的動作。

      靈初想占的,顯然不是一次榜單的C位。它在賭的,是下一階段具身智能訓(xùn)練框架的卡位戰(zhàn)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      史上最全“屬相婚配表”,建議收藏!

      史上最全“屬相婚配表”,建議收藏!

      詩詞天地
      2026-04-21 14:08:25
      打臉!公天鵝拋棄10年原配找新歡,結(jié)果一年沒動靜,原配已生三娃

      打臉!公天鵝拋棄10年原配找新歡,結(jié)果一年沒動靜,原配已生三娃

      茶余飯好
      2026-04-22 09:10:09
      深度 |大限到期,一日之內(nèi)極限反轉(zhuǎn),特朗普為何延長?;??伊朗為何不領(lǐng)情?

      深度 |大限到期,一日之內(nèi)極限反轉(zhuǎn),特朗普為何延長停火?伊朗為何不領(lǐng)情?

      上觀新聞
      2026-04-22 17:19:03
      吳京在《人民日報》發(fā)文

      吳京在《人民日報》發(fā)文

      新京報
      2026-04-22 11:19:10
      我發(fā)現(xiàn):出錢不出力與出力不出錢的老人,和孫輩的感情是不一樣的

      我發(fā)現(xiàn):出錢不出力與出力不出錢的老人,和孫輩的感情是不一樣的

      小馬達(dá)情感故事
      2026-04-21 17:40:03
      段睿悲痛萬分,深夜發(fā)布訃告:他走了,再也沒有人等我回去了!

      段睿悲痛萬分,深夜發(fā)布訃告:他走了,再也沒有人等我回去了!

      米果說識
      2026-04-22 14:41:50
      直播車輛導(dǎo)航界面出現(xiàn)bug,零跑回應(yīng)

      直播車輛導(dǎo)航界面出現(xiàn)bug,零跑回應(yīng)

      界面新聞
      2026-04-22 16:41:19
      《生化9》大尺度mod!牛奶比基尼內(nèi)含大雷比頭還大

      《生化9》大尺度mod!牛奶比基尼內(nèi)含大雷比頭還大

      游民星空
      2026-04-22 16:09:39
      山西忻州市公務(wù)員局發(fā)布情況說明:楊某媛(女)與自媒體貼文中所分析的楊某媛并非同一人

      山西忻州市公務(wù)員局發(fā)布情況說明:楊某媛(女)與自媒體貼文中所分析的楊某媛并非同一人

      環(huán)球網(wǎng)資訊
      2026-04-22 16:51:03
      高99米,北京最高摩天輪歡樂谷“大眼京”預(yù)計6月28日運營

      高99米,北京最高摩天輪歡樂谷“大眼京”預(yù)計6月28日運營

      新京報
      2026-04-22 13:06:20
      5月1日起正式嚴(yán)打!8類灰色行為直接入刑,所有人務(wù)必警惕

      5月1日起正式嚴(yán)打!8類灰色行為直接入刑,所有人務(wù)必警惕

      另子維愛讀史
      2026-04-22 07:39:03
      連車企的名字都不敢報道,這樣的新聞有什么意義

      連車企的名字都不敢報道,這樣的新聞有什么意義

      林中木白
      2026-04-21 15:51:28
      你拋美債,我拋中債!外資紛紛減持中國債,大量資金流向美國?

      你拋美債,我拋中債!外資紛紛減持中國債,大量資金流向美國?

      安珈使者啊
      2026-04-22 09:52:52
      45歲金·卡戴珊與漢密爾頓海邊嬉戲,“如膠似漆”,卻引發(fā)爭議

      45歲金·卡戴珊與漢密爾頓海邊嬉戲,“如膠似漆”,卻引發(fā)爭議

      譯言
      2026-04-22 07:23:37
      醫(yī)院的專家號剛放出就瞬間“秒空”,上海三甲醫(yī)院緊急報警!警方:對倒賣醫(yī)院號源犯罪團伙的李某、鄭某等人依法刑事拘留

      醫(yī)院的專家號剛放出就瞬間“秒空”,上海三甲醫(yī)院緊急報警!警方:對倒賣醫(yī)院號源犯罪團伙的李某、鄭某等人依法刑事拘留

      大風(fēng)新聞
      2026-04-22 15:12:13
      楊瀚森NBA生涯季后賽首勝:全場遭棄用躺贏 回主場后能否登場?

      楊瀚森NBA生涯季后賽首勝:全場遭棄用躺贏 回主場后能否登場?

      醉臥浮生
      2026-04-22 10:47:21
      "下單時2200,現(xiàn)在漲到3700",在淘寶買15張顯卡,5店鋪均拒發(fā)貨;淘寶:無法強制,望買家理解

      "下單時2200,現(xiàn)在漲到3700",在淘寶買15張顯卡,5店鋪均拒發(fā)貨;淘寶:無法強制,望買家理解

      大風(fēng)新聞
      2026-04-22 15:44:05
      中國駐美大使謝鋒:中國大蒜做夢也沒想到,有朝一日會被列為“國家安全威脅”

      中國駐美大使謝鋒:中國大蒜做夢也沒想到,有朝一日會被列為“國家安全威脅”

      每日經(jīng)濟新聞
      2026-04-22 11:09:45
      突發(fā)!廣西一大廠停業(yè),21年收入超31億,稱海外客戶拖欠巨額貨款

      突發(fā)!廣西一大廠停業(yè),21年收入超31億,稱海外客戶拖欠巨額貨款

      火山詩話
      2026-04-22 09:40:34
      炸裂!網(wǎng)傳寧波某豪宅業(yè)主群夫妻大戰(zhàn),虎狼之詞流出,444人圍觀

      炸裂!網(wǎng)傳寧波某豪宅業(yè)主群夫妻大戰(zhàn),虎狼之詞流出,444人圍觀

      火山詩話
      2026-04-22 17:56:13
      2026-04-22 19:16:49
      新智元 incentive-icons
      新智元
      AI產(chǎn)業(yè)主平臺領(lǐng)航智能+時代
      15039文章數(shù) 66798關(guān)注度
      往期回顧 全部

      科技要聞

      對話梅濤:沒有視頻底座,具身智能走不遠(yuǎn)

      頭條要聞

      三甲醫(yī)院科主任被舉報"巨額財產(chǎn)來源不明" 舉報人發(fā)聲

      頭條要聞

      三甲醫(yī)院科主任被舉報"巨額財產(chǎn)來源不明" 舉報人發(fā)聲

      體育要聞

      網(wǎng)易傳媒再度簽約法國隊和阿根廷隊

      娛樂要聞

      復(fù)婚無望!baby黃曉明陪小海綿零交流

      財經(jīng)要聞

      伊朗拒絕出席 特朗普宣布延長?;鹌谙?/h3>

      汽車要聞

      純電續(xù)航301km+激光雷達(dá) 宋Pro DM-i飛馳版9.99萬起

      態(tài)度原創(chuàng)

      家居
      數(shù)碼
      教育
      時尚
      軍事航空

      家居要聞

      極簡繪夢 克制和諧

      數(shù)碼要聞

      Beats發(fā)布3米USB-C數(shù)據(jù)線:售229元 最高240W快充

      教育要聞

      重磅!中招自主招生政策發(fā)布

      初夏穿赫本的白褲子,清新又高級!

      軍事要聞

      特朗普宣布延長?;?伊朗表態(tài)

      無障礙瀏覽 進(jìn)入關(guān)懷版