<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      具身原生元年!專訪原力靈機汪天才,解析具身智能的PyTorch時刻

      0
      分享至

      編輯|Panda

      在數字世界里,AI 智能體正通過 MoltBook 這樣社交網絡進行語義協商并協同進化,而在物理世界中,具身智能也迎來了一次里程碑式的進展。

      在原力靈機的實驗室里,一臺由 Hugging Face 開源的、3D 打印出來的 SO-101 機器臂正靈巧地將外形各異的物品放入指定的盒子中。這個動作看似簡單,實則包含了極高頻的視覺反饋、力度感知以及對復雜物理環境的直覺判斷。



      實際上,這種從「計算」到「直覺」的跨越,并非源于針對這個特定硬件的繁瑣調優,而是受益于一套標準化的底層基建。

      在 2 月 10 日的技術開發日上,原力靈機正式發布了開源具身原生框架 Dexbotic 2.0,并宣布了其與清華大學和無問芯穹支持的強化學習框架 RLinf 的戰略合作



      原力靈機合伙人汪天才將 Dexbotic 2.0 與 RLinf 的深度結合定義為具身智能行業的「PyTorch 時刻」。正如 PyTorch 通過標準化的張量計算與自動微分機制釋放了深度學習的生產力,Dexbotic 2.0 與 RLinf 的聯手試圖在具身智能這個碎片化嚴重的賽道上,建立一套通用的底座和基礎設施。

      伴隨這一框架升級和戰略合作一同亮相的,還有全球首個具身原生大模型 DM0以及具身應用量產工作流 DFOL



      這一整套全鏈路布局宣告了一個極具沖擊力的斷言。正如原力靈機 CEO 唐文斌在現場所說:「2026 年不是具身智能的元年,而是具身原生的元年。」這意味著具身智能正在告別「大模型外掛一雙機械手」的初級階段,正式進入感知、決策與控制高度協同的「具身原生」時代。

      從端到端自動駕駛算法 PETR 的核心作者,到如今投身物理 AGI 的弄潮兒,汪天才如何理解具身智能的進化路徑?Dexbotic 2.0 又將如何改變開發者與機器人的交互方式?且隨我們的這篇專訪報道一起,洞見基于具身原生的物理 AGI 的未來。



      汪天才,原力靈機合伙人,原曠視科技高級研究員,在 CVPR、ICCV 、TPAMI 等國際頂會、頂刊累計發表論文 30 余篇,是端到端自動駕駛知名算法 PETR、通用端到端多目標追蹤算法 MOTR 核心作者;截至目前,谷歌學術論文累積引用量 6000 以上

      定義「具身原生」

      物理 AGI 的進化邏輯

      當今的多模態大模型已非常強大,掌握了編寫代碼和視覺推理等諸多能力,甚至有的還能根據手繪的草稿創建出完整的應用。然而,一旦進入物理世界,接入物理機器作為肢體后,這些強大的高智商模型卻常表現得非常笨拙,甚至會讓機器人做出一些蠢笨乃至危險的行為。也因此,現在的智能機器人往往是人類遙控的,難以自主地生活在真實世界的場景中。

      原因不難理解,在這種「大模型大腦+機器肢體」的邏輯下,必然存在數字模型與物理世界的失配問題;此時,AI 智能體更像是被困于數字世界的旁觀者,而不是物理世界的真正參與者。

      要讓具身智能真正完成這樣的轉變,成為物理世界的真正參與者,我們需要的是「具身原生」。



      「具身原生(Embodied Native)」是由原力靈機首次提出的具身智能概念,其核心在于構建感知、決策與執行的高度閉環。更具體來說,具身原生包含數據原生、訓練原生和框架原生:

      • 數據原生:強調使用真實世界全要素數據與具身多模態數據。模型需要從 0 開始學習物理世界的交互邏輯,而非單純繼承互聯網數據的預訓練成果。
      • 訓練原生:旨在讓模型能夠理解、影響并預測物理世界。模型在設計之初就立足于真實環境,使用真實世界的效果作為評價標準,其獎勵(Reward)機制直接源自真機的運行反饋。
      • 框架原生:為模型提供底層的支撐能力,包括對多模態數據的深度支持、強大的記憶能力以及通用的動作(Action)執行能力。

      同時,原力靈機還指出,「具身智能正在把智能從對世界的表征與解釋推向對世界的介入與改變。」這就意味著模型必須走進復雜的物理空間,去承擔真實的因果責任。

      在虛擬的聊天框里,回復錯誤或許只是一行文字的偏差。但在現實世界中,模型的一次微小判斷失誤就可能引發碰撞、損壞或不可逆的硬件后果。具身原生框架 Dexbotic 2.0 的提出,正是為了應對物理世界的高熵與不確定性。

      對于為何將此時定義為「具身智能的 PyTorch 時刻」,汪天才有著清晰的行業洞察:當前的機器人研發正處于高度碎片化的狀態,開發者們往往需要耗費大量精力在數據格式適配、仿真器連接等底層工程上。而隨著 Dexbotic 2.0 的到來及其與 RLinf 的深度結合,這些繁瑣的碎片化工作可能都將成為過去時。他明確表示:Dexbotic 2.0 的定位是「具身算法研發的 Infra」

      也就是說,原力靈機希望 Dexbotic 2.0 能像 PyTorch 一樣,成為一個開放、統一、可擴展的基礎設施。汪天才認為,這就像將行業內各種混亂的接口統一為 Type-C 標準。

      原力靈機進一步強調,具身 Infra 直接決定了具身模型的迭代效率。在過去碎片化的環境下,開發者往往有超過一半的精力被迫消耗在適配不同的硬件接口、數據格式以及仿真環境上,這就像是在泥濘的土路上試圖跑出法拉利的速度。Dexbotic 2.0 的價值,正是通過標準化的基建將開發者從這些繁瑣的底層工程中解放出來,大大降低了試錯成本,讓模型迭代的飛輪能夠以最小的摩擦力高速轉動。



      這種基礎設施的標準化,是物理 AGI 實現規模化增長的前提。只有當底層框架變得確定且易用,開發者才能將精力集中在「算法與模型創新」這一核心目標上,推動具身智能從簡單的展示品向真正的生產力工具進化。正如汪天才說的那樣:「我們其實聚焦的就是降低用戶的開發門檻,讓開發者可以只聚焦到他想去做的事情。」

      此外,汪天才還補充道,具身原生不僅關乎算法架構,還涉及多模態傳感的深度融合。例如觸覺與六維力信息,這些感知維度的引入會直接影響模型對于整個物理世界的建模能力。汪天才總結道:「這些信息都是非常非常重要的,它會影響你對于整個世界的建模。」這種全方位的原生設計,構成了通往物理 AGI 的核心基石。

      Dexbotic 2.0

      基于模塊化的端到端具身原生框架

      在具身智能開發者的工具箱里,長期存在著一種「既要又要」的焦慮:一方面,大家渴望模塊化帶來的靈活性,希望像換鏡頭一樣隨時升級感知模型或控制算法;另一方面,為了追求極致的反應速度和決策精度,行業又在集體涌向「端到端」范式。

      Dexbotic 2.0 的出現,正是為了終結這種在模塊化與端到端之間的長期搖擺。它在架構上維持了高度解耦的模塊化設計,但底層的數據流卻是純正的端到端邏輯。



      汪天才在采訪中明確指出:「無論是記憶模塊的設計,還是整體系統架構,我們都刻意避免采用類似 RAG 這樣的顯式檢索機制。在我看來,那并不代表真正的智能。真正的智能應當發生在隱式空間中,更接近人腦的工作方式,模型不需要顯示地打印出思考過程。」

      可以說,Dexbotic 2.0 的使命就是讓智能體直接從感知輸入跨越到動作輸出,實現感知、決策與執行的深度耦合

      技術理念:對端到端范式的信仰與堅持

      事實上,汪天才對于端到端范式的堅持堪稱信仰,他也在采訪回顧了自己職業生涯中的這份堅持:「從 2020 年開始相關研究時,我們最早做的是 MOTR,一個通用的多目標追蹤算法。它并不局限于特定場景或賽道,而是面向更一般的問題設定。事實上,從那個階段起,我們在認知上就已經非常堅定地認同端到端這一范式,這也是當初選擇做 MOTR 的根本原因。從 MOTR 到 PETR(一個端到端自動駕駛算法),再到后續在具身智能和大模型方向上的探索,本質上始終是一條端到端的方法論路徑。當前的多模態大模型同樣是端到端的,這進一步強化了我們最初的判斷。」



      MOTR 與 PETR 架構示意圖

      2020 年,當時還在曠視科技的汪天才等人推出 MOTR 時,端到端多目標追蹤仍屬非主流路線,該團隊在投稿與學術交流中面臨較高的認知與說服成本,需要持續挑戰以 ReID、IoU matching 等手工設計為主的既有范式。這甚至導致了一個非常有趣但又有些苦澀的經歷:「MOTR 比 PETR 早將近兩年完成,但這兩篇論文最終幾乎是同時被接收的。」

      一個重要原因在于,到 PETR 階段,整體的說服成本已經明顯降低。汪天才解釋說:「當時特斯拉已經在 2021 年年中發布了其 BEV 方案,我們的 PETR 工作是在 2021 年底推出的,是國內最早一批能夠在理念上對標特斯拉、同時又采用不同技術路徑的方案之一。在已有特斯拉工作的前提下,端到端 BEV 路線的合理性更容易被理解和接受。再加上 PETR 是開源工作的,因此并未像 MOTR 那樣經歷極高的認知阻力。」

      「也正是從 MOTR 到 PETR 的這一過程,進一步堅定了我們持續推進端到端方法論的信念。」這位已經擁有超 6000 引用的研究者總結道,「后續我們開展了大量預研工作,例如 MemoryVLA,我更傾向于將其視為過去兩三年 StreamPETR 工作在方法論上的自然延續。區別僅在于應用場景,一個面向自動駕駛,一個面向具身智能,但其背后的思想是通用的。」



      MemoryVLA 架構示意圖

      汪天才在采訪中也透露了他從純模型研究轉向具身智能的底層邏輯。他坦言,在數字世界單純依靠模型是無法實現真正閉環的,「大模型一定要跟智能硬件結合」。這種對「閉環」的追求,正是他當初堅定選擇具身這一賽道的根本原因。

      現如今,Dexbotic 2.0 繼續延續著汪天才在端到端范式上的堅持,并在架構層面上將其重塑為一套兼具模塊化靈活性與端到端高性能的「具身原生」系統,其包含五大核心特性。



      框架原生:服務于端到端的模塊化

      雖然追求端到端的整體表現,但 Dexbotic 2.0 在架構上選擇了高度解耦的模塊化設計。它將系統拆分為三個可以自由組合的模塊,汪天才將其比作是機器人的「樂高系統」。



      • Vision Encoder(視覺編碼):負責將攝像頭畫面編碼成特征,已適配 CLIP、sigLIP、PE 等多種模型。
      • LLM(認知規劃):作為核心大腦,統一接收視覺特征與文字指令,支持 Qwen、StepFun 或 PaliGemma 等不同規模的模型。
      • Action Expert(動作專家):將意圖轉化為物理軌跡,支持 Diffusion、Flow Matching 或 Autoregression 等多種生成路徑。

      對于這種看似矛盾的設計,汪天才解釋道:「通過這種解耦設計,同一套系統可以在感知、認知和控制三個層面獨立升級。雖然模塊可以獨立迭代,但它們最終在訓練中會形成一個整體。」如此一來,可讓模型直接學習從 728×728 高清視覺輸入到毫米級動作執行的映射關系。在這種范式下,視覺模塊提取的不再是抽象的物體標簽,而是與后續動作執行密切相關的物理特征。

      這種靈活性保證了端到端模型在訓練時,每一個環節都能使用最前沿或最可靠(看開發者的具體需求)的算法組件,從而提升整體的「智能密度」。

      框架原生:操作與導航的統一

      在真實的物理任務中,機器人必須先走到目標前才能開始干活。這就要求框架必須同時具備「操作(Manipulation)」與「導航(Navigation)」的能力。



      Dexbotic 2.0 在一個框架下實現了VLA(視覺-語言-動作)VLN(視覺-語言-導航)的統一。它集成了 Pi0.5、MemoryVLA、OpenVLA-OFT 以及原力靈機自研的 DM0 等多種 VLA 方案。同時,在導航層面支持 NAVILA,用于將語言目標與視覺觀測對齊。這種融合是為了實現「能說清、能看準、能做對」的目標,并為 2026 年的「全身控制(Whole-body Control)」奠定技術基礎。

      汪天才對此評論說:「我們沒有必要去區分到底是具身還是自動駕駛,又或是所謂的多模態大模型 —— 大家的目標應該是一致的:最終你要訓出一個具身大模型。」

      數據原生:多源數據混訓

      在具身原生的邏輯下,模型需要像人類一樣同時學習理解世界與動手操作。Dexbotic 2.0 支持多模態數據與具身數據的 Co-training。這意味著系統使用同一套訓練過程,讓視覺語言模型在接收互聯網圖文與視頻數據時,學習場景描述、任務拆解以及指令與畫面中對象位置的精確對應。在此基礎上接入動作專家,將這些語義理解結果轉化為抓取、移動、放置等連續控制的動作序列。



      這種混合訓練模式讓訓練數據不僅包含互聯網通用常識,也包含機器人實操的具身軌跡。兩類數據共同優化,使模型既具備通用語義理解能力,又具備可落地的操作技能,真正做到「能說清、能看準、能做對」。下圖展示了 Dexbotic 2.0 孵化的具身大模型 DM0 混訓過程所使用的數據示例。



      汪天才指出,這種多源混合訓練甚至可以將自動駕駛數據與互聯網智能體數據一并納入,通過這種方式顯著提升模型在各個領域的泛化性能與智能密度。「這也是我們具身原生框架的 feature 之一。」他舉了個具體的例子,「就像訓練一個人一樣,我更期望這個人既能識別出這是一杯咖啡,也能輸出對應的連續動作。我們要把比如說兩張椅子之間的空間關系,以及生活中的很多常識,都包含到整個具身模型的訓練中。」

      訓練原生:全流程標準化

      目前,具身智能領域正面臨著嚴重的研發碎片化挑戰。由于不同仿真環境與硬件本體的接口各異,開發者往往需要耗費大量精力在數據格式適配、仿真器連接等底層工程上。這種高度零散的現狀就像是早期數碼產品混亂的充電接口,極大抬高了入行門檻。



      為了終結這種「作坊式」的開發模式,Dexbotic 2.0 建立了從數據采集、訓練管線到仿真評測的標準化全流程。在數據層面,框架推出了 Dexdata 數據格式,將龐雜的具身數據統一存儲為標準化的 video 與 jsonl 標注文件。在仿真側,系統深度適配了 SimplerEnv、ManiSkill2、RoboTwin 2.0 以及 Libero 等多種主流仿真器,確保算法能在統一環境下進行性能對比。此外,Dexbotic 2.0 還提供了將各類環境數據自動轉換為 Dexdata 標準格式的工具鏈,確保了不同算法能在同一套環境下進行公平的性能對比。而在開源硬件方面,Dexbotic 2.0 更是直接支持了 SO-101 與 DOS-W1 等平臺,從而實現了從標準數據到標準評測、再到真實機器人部署的一體化開發路徑。

      不僅如此,針對行業內真機評測「對比不公平」的痛點,原力靈機此前已經聯合 Hugging Face 推出了被稱為「具身智能 ImageNet」的真機評測基準 RoboChallenge。詳情可參閱我們之前的報道《具身智能迎來 ImageNet 時刻:RoboChallenge 開放首個大規模真機基準測試集》。

      汪天才指出,過去許多研究者通過針對單一任務進行「定向優化」(Hack)來刷高分數,這種「高分低能」的現象在具身領域尤為突出。RoboChallenge 的初衷便是通過統一的真機評價標準,排除變量干擾,真正檢驗基模的泛化能力。汪天才在采訪中提到:「如果你的模型基模真的強,在榜單上一定會有所體現,它不存在那種被 Hack 出來的強大。」

      通過將數據處理、訓練管線與仿真評測標準化,并與 RoboChallenge 這一真機標準相結合,Dexbotic 2.0 可幫助開發者跳出底層工程的泥潭。當這些基礎設施變得確定,開發者才能真正專注于提升模型對物理世界的理解深度。

      訓練原生:模仿學習與強化學習的統一

      單純依靠模仿學習(SFT)往往難以應對物理世界的高熵與極端場景。汪天才也在采訪中特別強調了基礎模型的重要性:「你的基模首先要夠強,才能在一些更復雜的任務中有成功率。比如說,可能對于某個任務,我第一次去做強化學習,可能基模只有 30% 成功率。但它經過比如 3 ~ 4 輪的強化學習,可能就能升到 80%。但是如果基模不強,一開始的成功率是 0,也很難通過強化學習提升。」

      Dexbotic 2.0 通過統一框架打通了從 VLA 策略初始化到強化學習(RL)后訓練的閉環流程。系統首先通過 VLA 在海量多模態數據上學習通用語義、任務分解與動作先驗,再借助強化學習在交互環境中進行持續試錯與優化。這種演進路徑旨在實現更高的任務成功率、更強的魯棒性以及跨任務的泛化能力。

      為了實現這一目標,Dexbotic 2.0 集成了SimpleVLA-RL工具,并與由清華大學、無問芯穹支持的強化學習框架 RLinf 達成深度戰略合作。在這種分工中,Dexbotic 2.0 負責構建高質量的初始策略與數據體系,RLinf 則負責大規模 RL 后訓練與工程化加速。



      這種「預訓練+強化學習」的組合模式,賦予了機器人應對動態環境的直覺反應。汪天才認為,這種全流程標準化的基礎設施解決了以往真機強化學習效率極低的痛點,為未來實現幾十臺甚至上百臺機器人的大規模自我演進奠定了基礎。

      從框架孵化到全鏈路落地

      DM0 與 DFOL 的進階路徑

      在原力靈機的技術版圖中,Dexbotic 2.0 并非一個靜態的工具箱,它在公司內部扮演著底層「母機」的角色。通過這一框架的滋養,原力靈機成功孵化出并開源了高性能的具身原生大模型 DM0,并以此為基礎,進一步延伸出了面向實際作業場景的具身原生應用量產工作流 DFOL。這種「框架孵化模型、模型驅動應用」的遞進邏輯,構成了公司完整的技術閉環。

      DM0:追求「智能密度」的大腦

      作為首個核心大模型成果,DM0 團隊將研發重點放在了物理空間中的「智能密度」上 ——DM0 也是當今智能密度最高的具身大模型。值得一提的是,DM0 是原力靈機聯合階躍星辰共同訓練的,除了深度融合多模態互聯網信息外,還涵蓋了駕駛行為、機器人操作等具身特有數據。



      • 技術報告:DM0: An Embodied-Native Vision-Language-Action Model towards Physical AI
      • 報告地址:https://dexmal.com/DM0_Tech_Report.pdf

      汪天才提到,我們往往低估了一個模型可以學習到的知識范圍,成功率和步驟分兩項指標大幅領先的 DM0 證明了小模型也能具備極強的泛化能力。



      在 RoboChallenge 真機評測中,DM0 獲得單任務與多任務雙項第一,目前位居榜單全球第一。同時,憑借 2.4B 參數的體量和 62.0% 的單機成功率,DM0 也是當今智能密度最高的具身大模型。

      DM0 采用 2.4B 參數的輕量化設計,支持三視角 728×728 高分辨率輸入,能夠實現跨 8 種機型的泛化,推理延遲僅為 60 ms 左右。



      為了讓模型學習操作的通用邏輯,DM0 引入了「空間推理思維鏈(Spatial CoT)」機制。在處理類似「對桌面商品掃碼計價」的模糊指令時,模型會先進行子任務預測與規劃,接著完成物體識別與精確定位,再生成 2D 軌跡,最終映射為可執行的 3D 動作。這種思維鏈將環境感知、任務理解、運動規劃與精細執行串成了閉環。



      DM0 模型架構示意圖,其由一個 VLM 主干和一個基于流匹配(Flow Matching)的動作專家組成。VLM 處理多模態輸入并生成具身推理表征,動作專家再利用這些表征生成連續的機器人動作。



      DM0 操作原力靈機首款開源硬件產品 DOS-W1 執行掃碼計價任務(使用了真機強化學習)

      DFOL:解鎖具身應用量產工作流

      當 DM0 具備了強大的物理推理能力后,原力靈機又進一步推出了具身應用量產工作流 DFOL(Distributed Field Online Learning)。這一方案通過「硬件通用 + 模型智能」的模式,打破非標自動化與人工的邊界。

      DFOL 的關鍵創新在于構建了完整的數據回流機制。



      在真實工作環境中,現場產生的訓練片段(episode)與負樣本塊(negative chunk)會實時回傳至云端,形成「云端訓練 - 現場執行 - 數據回流 - 模型更新」的持續進化閉環。這使得機器人系統能夠在實際作業中不斷自我改進,實現從「展品」向「產品」的跨越,即以「一個標準化的、可預測的方式來完成具身智能的批量落地」。目前,利用該數據回流機制,DFOL 能讓新任務在兩天內達到量產標準。



      經過 DFOL 方案之后的 DM0 操作 DOS-W1 分揀回收料,學習時長 48 小時,來自華勤技術

      此外,為了驗證商業價值,原力靈機還構建了評估落地的三大硬性指標:成功率、動作質量與節拍。這三者被總結為商業價值的「鐵三角」,可作為行業內評估機器人真實場景應用的重要參考。



      生態共建

      開源協作下的加速進化

      在原力靈機的邏輯里,真正的「PyTorch 時刻」不僅關乎技術底座的強大,更關乎開發者生態的繁榮。為了讓 Dexbotic 2.0 能夠真正觸達每一位具身開發者,原力靈機宣布與由清華大學、無問芯穹支持的強化學習框架 RLinf 達成深度戰略合作



      關于為何堅定地選擇開源路徑,汪天才在采訪中表達了極具開放性的心態。他認為具身智能仍處于非常早期的賽道,需要大家一起「添磚加瓦」。在他看來,具身智能領域很難由單一公司或團隊顛覆,引入外部的貢獻來增加賽道的勢能和加速度是更有必要的做法。他指出:「我們更相信開源生態,開源生態的一個好處是大家都可以彼此分享經驗,尤其是具身這樣一個非常早期的賽道。」

      在這次三方合作中,各方分工明確,像是一場精密配合的接力賽。Dexbotic 2.0 專注于 VLA 預訓練與監督微調(SFT),負責構建高質量的初始策略與數據體系,為機器人提供具備常識的「大腦原型」。RLinf 則負責大規模 RL 后訓練與工程化加速,通過在交互環境中進行海量的試錯與對齊,提升策略在復雜、極端場景下的魯棒性。

      汪天才將這種合作評價為一種「握手」。他表示:「沒有必要重復造輪子。我們兩邊其實可以做一個握手,然后就能把這件事情搞定 —— 各自關注更聚焦的那一部分。」這種分工可實現研發效率的最大化,讓具身智能的 Infra 拼圖變得更完整。

      在 2 月 10 日的技術開發日上,原力靈機公布了與 RLinf 的「Dexbotic & RLinf 融合研發計劃」,預計將在今年 5 月支持大規模真機強化學習,并在 6 月發布深度耦合的通用具身框架。



      此外,正如前文所述,原力靈機選擇開源 Dexbotic 2.0 及其標準化的 Dexdata 數據格式,還可以推動行業標準的統一。

      目前,Dexbotic 已匯聚起橫跨學術與產業的全球化社區,用戶包括清華大學、北京大學、普林斯頓大學、帝國理工學院等頂尖學府,以及騰訊、通義千問、北京具身智能機器人創新中心等行業力量。這種廣泛的信任投票證明了開源協作路徑的價值。通過打造具身智能領域的 PyTorch,原力靈機正攜手合作伙伴降低開發門檻,讓開發者能專注于算法創新與場景突破,共同讓具身智能從實驗室走向生產線。



      邁向物理 AGI 的進化之路

      汪天才在采訪最后分享了他對未來的洞察。在視覺、聽覺之外,他特別強調了觸覺與六維力的重要性,這些感官構成了具身原生的一部分,會直接影響對物理世界的建模能力。除此之外,他還透露了關于「聽覺與語音交互」的規劃,未來計劃聯合階躍星辰等合作伙伴開發全模態模型,讓機器人具備類似人類的聽覺輸入能力,進一步補全「具身原生」的形態。

      汪天才對于具身智能的「進化」有著更深層的思考。他認為,未來的機器人不應當只是冷冰冰的執行機器,而應當具備感知疼痛、理解空間并能通過直覺做出反應的能力 —— 正如原力靈機的英文名Dexmal暗示的那樣:成為像「靈巧的動物」(Dexterous Animal)一樣的智能生命。這種進化不僅體現在算法架構上,更在于多模態傳感信息的深度融合。作為這一進化邏輯的技術底座,Dexbotic 2.0 憑借其標準化的基礎設施屬性,成功銜接了模塊化與端到端范式,致力于降低整個行業的研發門檻。

      事實上,這種進化還在加速!從去年 10 月發布 Dexbotic 1.0 到如今 2.0 的推出,僅僅過去了三個多月。汪天才判斷,具身智能的發展正在顯著加速,這種高頻迭代將成為常態。這種前文提到的「Dexbotic & RLinf 融合研發計劃」也能看出。汪天才表示:「現在行業的迭代速度非常快,幾乎每周都有新發布,就像大模型領域按天進化的節奏一樣。」

      具身智能的 PyTorch 時刻正在到來,那 ChatGPT 時刻還遠嗎?對此,汪天才有著更貼近現實的愿景:「首先一定要有個本體,并且本體的外形讓人覺得沒有威脅感,讓人覺得安全。它在生活中能夠幫我處理一些簡單的事物,比如倒茶、擦擦桌子、跟我一塊出去遛彎、聊聊天。就這樣,像一個助手。我并不期望它能幫我換燈泡等高難度的事情,我沒有那么高期待。」

      對于從 CV 或 NLP 領域跨行進入具身領域的年輕研究者,汪天才建議要相信長期主義:「你要能夠沉下心來去學習具身領域的各種知識,除了算法,還要有系統和硬件知識。你可能需要一到兩年的時間先去做積累。」

      隨著開源生態的擴大,智能正在以前所未有的速度介入并改變真實的物理世界。原力靈機通過這一整套布局,已經為物理 AGI 勾勒出了一幅清晰的藍圖。

      文中視頻鏈接:https://mp.weixin.qq.com/s/8lCZm0X2pl-4BggzGovU2Q

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      精神病院騙保后續:追回醫保資金1.2個億,32個負責人被移送司法

      精神病院騙保后續:追回醫保資金1.2個億,32個負責人被移送司法

      老特有話說
      2026-02-09 23:39:05
      立陶宛最新表態!去意已決,既然等不來中國求和,那就去投資印度

      立陶宛最新表態!去意已決,既然等不來中國求和,那就去投資印度

      老沮系戲精北鼻
      2026-02-10 14:38:56
      現貨白銀大漲7%,重回80美元上方

      現貨白銀大漲7%,重回80美元上方

      每日經濟新聞
      2026-02-10 07:36:11
      烏軍俘獲18名俄軍!俄兵被俘俄后直言:若知不殺,早就投降了

      烏軍俘獲18名俄軍!俄兵被俘俄后直言:若知不殺,早就投降了

      知兵
      2026-02-08 08:00:21
      漢人最偉大的巔峰之戰!若此戰失敗,中國或將分裂成幾十個小國

      漢人最偉大的巔峰之戰!若此戰失敗,中國或將分裂成幾十個小國

      千秋文化
      2026-01-06 20:49:21
      這才是高市大勝的原因?中國軍網揭開內幕,野田:我罪該萬死

      這才是高市大勝的原因?中國軍網揭開內幕,野田:我罪該萬死

      鐵錘簡科
      2026-02-10 18:31:57
      2300一噸,5年收了3萬噸!日本狂收東北落葉,24年專家揭露真相

      2300一噸,5年收了3萬噸!日本狂收東北落葉,24年專家揭露真相

      福建平子
      2026-02-05 16:37:30
      52歲劉愷威近照曝光!醉眼朦朧,狀態回到整容前,不復之前帥氣

      52歲劉愷威近照曝光!醉眼朦朧,狀態回到整容前,不復之前帥氣

      八卦王者
      2026-02-08 15:55:15
      汪小菲心碎了!曝S家和具俊曄爭奪遺產,S媽小S回應:永遠愛歐巴

      汪小菲心碎了!曝S家和具俊曄爭奪遺產,S媽小S回應:永遠愛歐巴

      小娛樂悠悠
      2026-02-10 14:37:19
      央視動真格了!2026春晚大換血,趙本山當年的狠話終于應驗

      央視動真格了!2026春晚大換血,趙本山當年的狠話終于應驗

      手工制作阿殲
      2026-02-07 20:37:03
      何慶魁兒子爆料,閆學晶之所以有今天的發展,因為她太“會來事”

      何慶魁兒子爆料,閆學晶之所以有今天的發展,因為她太“會來事”

      西樓知趣雜談
      2026-01-24 07:22:04
      外交部:香港事務純屬中國內政,香港法治不容撼動,任何外國無權說三道四

      外交部:香港事務純屬中國內政,香港法治不容撼動,任何外國無權說三道四

      環球網資訊
      2026-02-10 15:34:20
      Seedance2.0發布24小時后:馮驥、Tim、導演、影視從業者的評價,值得我們深思

      Seedance2.0發布24小時后:馮驥、Tim、導演、影視從業者的評價,值得我們深思

      i黑馬
      2026-02-10 11:27:14
      14億人都不會忘卻!揭開核酸大王張核子的真面具:權力變現大公

      14億人都不會忘卻!揭開核酸大王張核子的真面具:權力變現大公

      大魚簡科
      2026-02-07 09:52:29
      大司馬回歸直播!檳榔臉驚呆網友 網友直呼認不出來

      大司馬回歸直播!檳榔臉驚呆網友 網友直呼認不出來

      游民星空
      2026-02-08 12:34:21
      你見識過那些父母的無效人脈嗎?網友:簡單問題硬是給復雜化

      你見識過那些父母的無效人脈嗎?網友:簡單問題硬是給復雜化

      另子維愛讀史
      2026-02-09 20:07:56
      米飯立大功!調查發現:糖尿病患者常吃米飯,或能降低7種并發癥

      米飯立大功!調查發現:糖尿病患者常吃米飯,或能降低7種并發癥

      健康之光
      2026-01-24 12:15:03
      林俊杰們用行動證明:男人的終極審美,真的很一致

      林俊杰們用行動證明:男人的終極審美,真的很一致

      橙星文娛
      2026-01-03 21:41:06
      中山、西崗、沙河口、甘井子、高新、金普新區同步設點、集中查處!

      中山、西崗、沙河口、甘井子、高新、金普新區同步設點、集中查處!

      小蜜情感說
      2026-02-10 12:51:23
      一個能拯救大腦的“邪修恢復術”,只需 10 分鐘,真的很有效!

      一個能拯救大腦的“邪修恢復術”,只需 10 分鐘,真的很有效!

      科普中國
      2026-02-09 15:35:27
      2026-02-10 19:24:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      12283文章數 142565關注度
      往期回顧 全部

      科技要聞

      Seedance刷屏:網友們玩瘋 影視圈瑟瑟發抖

      頭條要聞

      特朗普罕見承認:我犯了個大錯

      頭條要聞

      特朗普罕見承認:我犯了個大錯

      體育要聞

      NBA上演全武行,超大沖突4人驅逐!

      娛樂要聞

      全紅嬋官宣喜訊,雜志首秀太驚艷

      財經要聞

      雀巢中國近千經銷商的“追債記”

      汽車要聞

      應用于190KW四驅Ultra版 方程豹鈦7搭載天神之眼5.0

      態度原創

      教育
      本地
      房產
      公開課
      軍事航空

      教育要聞

      別只看金三銀四了!大廠校招早已在2月“偷跑”

      本地新聞

      圍觀了北京第一屆黑色羽絨服大賽,我笑瘋了

      房產要聞

      海南又一千億級賽道出現,京東、華潤、中石化等巨頭率先殺入!

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      以軍持續在約旦河西岸多地發動突襲

      無障礙瀏覽 進入關懷版