<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      NVIDIA與高校聯手SpaceTools:AI機器人實現視覺與操作雙突破

      0
      分享至


      這項由NVIDIA、密歇根大學、俄亥俄州立大學聯合完成的突破性研究發表于2024年12月,研究團隊包括陳思毅、米凱拉·安吉利娜·烏伊、宋燦熙等多位研究者。感興趣的讀者可以通過論文編號arXiv:2512.04069v1查詢完整論文。

      想象一下,你正在廚房里準備晚餐,需要同時使用多種廚具:切菜刀、炒鍋、烤箱、調味瓶等等。一個經驗豐富的廚師知道什么時候該用哪種工具,如何協調使用這些工具來做出美味的菜肴。現在,研究團隊要解決的問題是:如何讓AI機器人也擁有這樣的"廚藝",但它們面對的不是廚具,而是各種視覺分析工具。

      當前的AI視覺模型就像是一個只會用一把菜刀的新手廚師。雖然它們在回答簡單問題方面表現不錯,比如"這個蘋果是什么顏色",但當遇到復雜的空間推理任務時就顯得力不從心了。比如"哪個踏板最小,應該按哪里來啟動它?"這樣的問題需要AI同時具備識別、比較大小、定位激活點等多種能力,就像做一道復雜菜肴需要多種技能的配合。

      NVIDIA聯合研究團隊開發的SpaceTools系統就是要解決這個問題。他們的核心創新在于創造了一種叫做"雙重交互強化學習"(DIRL)的訓練方法,讓AI學會像經驗豐富的廚師一樣協調使用多種"工具"。這些工具包括深度估計器(用來判斷物體遠近)、分割工具(用來識別特定物體)、3D邊界框工具(用來測量物體大小)等等,就像廚師工具箱里的各種專業廚具。

      研究團隊面臨的最大挑戰是:如何讓AI學會在合適的時機選擇合適的工具?這就像教一個人學做菜,如果一開始就把所有復雜的技巧都教給他,他會被搞得暈頭轉向。所以研究團隊設計了一個巧妙的兩階段學習過程。

      第一階段叫做"教學階段",就像先教新手廚師使用一把最基本的刀具。研究團隊首先訓練AI使用最基礎的指向工具,讓它學會準確識別和定位物體。這個階段就像學會如何正確握刀和切菜一樣,是后續所有技能的基礎。同時,他們還讓一個"萬能老師"(實際上是Claude Sonnet 4.5這樣的高級AI模型)示范如何使用全套工具解決復雜問題,就像讓米其林星級廚師展示完整的烹飪流程。

      第二階段叫做"探索階段",這時AI已經掌握了基礎技能,可以開始嘗試使用全套工具了。就像廚師學會了基礎刀工后,開始學習如何協調使用炒鍋、烤箱、調味料等各種工具。在這個階段,AI通過不斷嘗試和獲得反饋來改進自己的工具使用策略。

      為了支撐這種復雜的訓練過程,研究團隊還開發了一個叫做"Toolshed"的技術平臺。你可以把它想象成一個超級智能的廚房管理系統,能夠同時管理和調度多種工具,確保每種工具在需要的時候都能及時響應。這個系統解決了一個關鍵問題:當AI需要同時使用多種計算密集的工具時,如何避免系統卡頓或崩潰。

      Toolshed的巧妙之處在于它的"去耦合"設計。就像一個高效的廚房里,洗菜、切菜、炒菜可以同時進行而不互相干擾,Toolshed讓不同的視覺工具可以在獨立的環境中運行,避免了資源爭奪和相互干擾。更重要的是,它支持異步處理,意味著AI不需要等待一個工具完成工作后再使用下一個,而是可以同時調用多個工具,大大提高了效率。

      研究團隊在訓練過程中還解決了一個有趣的獎勵機制問題。傳統的AI訓練就像給學生打分,對就給滿分,錯就是零分。但在復雜的空間推理任務中,這種簡單粗暴的評分方式不夠精細。研究團隊設計了更加細致的獎勵系統,比如在指向任務中,如果AI指向的位置離正確位置很近,它會得到相應的部分分數,而不是完全的零分。這種方法讓AI能夠更好地學習和改進。

      具體來說,對于不同類型的任務,研究團隊設計了不同的評分標準。在選擇題任務中,答對了就得1分,答錯了得0分,這很直接。但在更復雜的任務中就需要更精細的評分。比如在2D邊界框定位任務中,他們使用"平均交并比"來評分,簡單說就是看AI畫的框和正確答案有多少重疊。在指向任務中,他們使用一種叫做"標準化負距離質心"的方法,聽起來復雜,其實就是根據指向點離正確位置的距離來給分,離得越近分數越高。

      對于更高級的任務,比如姿態估計和抓握預測,評分標準也更加復雜。姿態估計就像要求AI準確識別一個物體在3D空間中的方向和位置,研究團隊通過比較預測的8個3D角點和真實角點來評分。抓握預測則需要AI不僅要找到正確的抓握位置,還要確定正確的抓握方向和力度,這就像要求機器人知道如何像人類一樣靈巧地拿起各種物體。

      在實際測試中,SpaceTools展現出了令人印象深刻的性能。研究團隊在多個標準測試數據集上進行了評估,包括RoboSpatial-Home、BLINK、RefSpatial、CVBench和BOP-ASK等。這些測試涵蓋了從簡單的空間關系理解到復雜的機器人操作等各個方面。

      最有趣的是,研究團隊還進行了真實機器人實驗。他們讓SpaceTools控制一個7自由度的機械臂,執行拾取和放置任務。機器人需要通過攝像頭觀察環境,識別目標物體,規劃抓握策略,然后執行動作。在這些實驗中,SpaceTools達到了86%的成功率,這個數字相當不錯,特別是考慮到機器人需要處理真實世界中的各種不確定因素。

      值得注意的是,SpaceTools不只是在訓練數據上表現良好,它還展現出了很好的泛化能力。就像一個優秀的廚師不僅能按照食譜做菜,還能根據現有食材創新菜品,SpaceTools在面對訓練中沒有見過的任務時,也能表現出不錯的性能。

      研究團隊還做了詳細的消融實驗來驗證他們方法的各個組成部分的重要性。消融實驗就像是一道菜的"去除某個調料"實驗,看看少了某個成分后效果會如何。他們發現,如果去掉IRL訓練的老師模塊,性能會顯著下降。如果去掉萬能老師的示范,在需要多工具協作的復雜任務上表現會變差。如果去掉第二階段的探索訓練,最終的工具協調能力會受到限制。

      這些實驗結果證明了雙重交互強化學習方法的每個組成部分都是必要的,就像一道復雜菜肴中每種調料都有其不可替代的作用。

      除了技術層面的創新,這項研究還在系統工程方面做出了重要貢獻。Toolshed平臺的開發解決了在大規模AI訓練中管理多個復雜工具的難題。這個平臺采用了現代化的分布式計算架構,基于Ray框架實現,支持工具的動態擴展和負載均衡。

      從技術實現角度來看,Toolshed支持多種類型的工具,包括視覺工具和機器人工具。視覺工具包括SAM2分割工具、DepthPro深度估計工具、RoboRefer和Molmo指向檢測工具等。機器人工具則包括圖像捕獲、深度捕獲、抓握執行、物體放置等功能。這種模塊化設計使得系統可以根據需要靈活配置和擴展。

      研究團隊還特別注意到了訓練數據的質量和平衡性問題。他們發現,原始的RoboSpatial數據集中超過75%的答案都是"否",這種不平衡會導致AI偏向于預測"否"。就像如果一個學生做的選擇題中大部分正確答案都是A,他可能會養成無論什么題都選A的壞習慣。研究團隊通過重新平衡數據集解決了這個問題,讓AI能夠做出更準確和均衡的判斷。

      在模型架構方面,研究團隊選擇了Qwen2.5-VL-3B-Instruct作為基礎模型。這是一個相對較小但性能優秀的多模態模型,具有25億個可訓練參數。他們只對語言模型部分進行微調,而保持視覺編碼器和投影層凍結,這種做法既保證了訓練效率,又維持了模型在視覺理解方面的原有能力。

      訓練過程中,研究團隊采用了Group Relative Policy Optimization(GRPO)算法。這個算法的核心思想是通過比較同一批次中不同回答的相對表現來更新模型,而不是依賴絕對的分數標準。這種方法更加穩定,也更適合處理獎勵信號可能存在噪聲的情況。

      具體的訓練配置經過了精心調整。第一階段的IRL訓練使用了4000個樣本,學習率設置為1e-6,KL散度系數為1e-4。SFT訓練使用了8000個高質量軌跡,學習率為1e-5,采用余弦學習率調度。第二階段的IRL訓練重新使用約8000個樣本,繼續優化工具協調能力。

      值得一提的是,研究團隊在獎勵設計方面投入了大量精力。他們嘗試了多種不同的獎勵函數,最終發現標準化負距離質心(NNDC)獎勵在指向任務中表現最佳。這個獎勵函數使用指數衰減的方式,距離目標越近得分越高,同時加入了二進制準確性項來強調精確性。

      在機器人實驗部分,研究團隊使用了Kinova Jaco機械臂,配備ZED2 RGB-D攝像頭。他們將機器人系統也抽象為工具,提供了圖像捕獲、深度獲取、抓握執行、物體放置等API接口。這種設計讓AI可以像使用其他視覺工具一樣控制機器人,實現了感知和行動的統一。

      機器人實驗涵蓋了三類任務:簡單拾取、關系拾取和拾取放置。簡單拾取任務要求機器人拾取指定物體,關系拾取任務需要機器人理解空間關系(如"拾取更遠的椰子水"),拾取放置任務則要求完整的操作流程。實驗結果顯示,SpaceTools在所有任務類型上都表現良好,特別是在關系拾取任務上顯著優于其他方法。

      研究團隊還進行了與商業AI模型的對比實驗。他們將同樣的工具系統接入到GPT-5和Claude Sonnet 4.5等先進模型中,發現雖然這些模型在某些任務上表現不錯,但在需要精確工具協調的任務上,專門訓練的SpaceTools表現更優。這說明專門的訓練對于復雜的多工具協調確實是必要的。

      從技術細節來看,SpaceTools的成功還得益于其精心設計的系統提示詞。這個提示詞不僅定義了可用工具和使用方法,還規定了推理格式和輸出結構。模型需要在標簽中進行思考,在標簽中調用工具,在標簽中給出最終答案。這種結構化的對話格式幫助模型形成了清晰的推理流程。

      在工具可靠性方面,研究團隊發現SpaceTools學會了一些有趣的錯誤恢復策略。比如當一個指向工具失敗時,它會自動切換到另一個指向工具;當抓握生成器無法找到無碰撞的抓握姿態時,它會回退到基于圖像的手動估計。這種自適應行為說明模型不僅學會了使用工具,還學會了處理工具故障的情況。

      研究的一個重要發現是,工具增強的訓練不僅提高了模型在訓練任務上的表現,還顯著改善了泛化能力。一個只在RoboSpatial數據集上訓練的模型,在完全不同的RefSpatial數據集上也能達到34.3%的準確率,而其他方法幾乎是零。這種跨域泛化能力表明,通過工具使用學到的空間推理技能具有更好的可遷移性。

      從更廣闊的視角來看,SpaceTools代表了AI發展的一個重要趨勢:從單一模型處理所有任務,轉向模塊化、可擴展的系統架構。就像現代軟件開發中的微服務架構一樣,這種方法允許系統的不同部分獨立發展和優化,同時保持整體功能的協調性。

      這種方法的另一個優勢是可解釋性。當SpaceTools解決一個復雜問題時,我們可以清楚地看到它調用了哪些工具,每個工具返回了什么結果,以及模型如何基于這些信息做出最終決策。這種透明性對于需要可靠性和可解釋性的應用場景非常重要。

      研究團隊也誠實地討論了當前方法的局限性。首先,雖然Toolshed平臺能夠高效管理多個工具,但在實際部署中仍然需要相當的計算資源。其次,當前的方法主要專注于相對短期的任務,對于需要長期規劃的復雜任務還有改進空間。第三,工具本身的質量直接影響整個系統的性能,如何持續改進和更新工具仍然是一個挑戰。

      盡管存在這些局限性,SpaceTools的成功為AI系統的發展指出了一個新方向。它證明了通過合適的訓練方法,AI可以學會像人類專家一樣靈活地使用各種工具來解決復雜問題。這不僅對機器人技術有重要意義,對其他需要復雜推理和決策的AI應用也具有啟發價值。

      展望未來,這種工具增強的AI系統可能會在更多領域發揮作用。想象一下,一個醫生有各種診斷工具可供使用,一個工程師有各種分析軟件可以調用,一個科學家有各種實驗設備可以操控。如果AI也能像這些專家一樣熟練地使用專業工具,那么它們在各個專業領域的應用潛力將大大增加。

      SpaceTools的成功還說明了一個重要觀點:AI的發展不一定需要越來越大的模型,而可以通過更智能的方法來提升能力。通過讓AI學會使用外部工具,我們可以用相對較小的模型實現強大的功能,這對于資源有限的環境和應用場景具有重要意義。

      總的來說,NVIDIA聯合研究團隊的這項工作為AI的工具使用能力樹立了新的標桿。它不僅在技術上實現了突破,還在工程實踐方面提供了寶貴經驗。隨著Toolshed平臺的開源發布,相信會有更多研究者和開發者基于這個框架開發出更強大、更實用的AI系統。

      從商業應用的角度來看,SpaceTools這樣的技術可能會帶來新的產業機會。在制造業中,具備復雜空間推理能力的機器人可以處理更精細的裝配任務。在服務業中,這樣的AI系統可以更好地理解和響應人類的空間指令。在教育領域,它可以成為更智能的教學助手,幫助學生理解空間幾何概念。

      這項研究的社會意義也值得關注。隨著AI系統變得越來越有能力,如何確保它們的決策過程是透明和可理解的變得越來越重要。SpaceTools的工具化方法提供了一種可能的解決方案:通過明確的工具調用序列,我們可以追蹤和理解AI的推理過程,這對于建立人機信任關系具有重要價值。

      說到底,SpaceTools代表的是AI從"獨奏者"向"指揮家"的轉變。就像一個優秀的指揮家不需要會演奏每一種樂器,但需要知道如何協調整個樂團一樣,未來的AI系統可能不需要內置所有功能,但需要學會如何智能地調用和協調各種專業工具。這種理念的轉變可能會深刻影響AI技術的發展方向,推動我們向更加模塊化、可擴展、可解釋的AI系統邁進。對于普通人來說,這意味著我們即將迎來更加智能和實用的AI助手,它們不僅能回答問題,還能真正幫助我們解決現實世界中的復雜問題。

      Q&A

      Q1:SpaceTools和傳統AI視覺模型有什么不同?

      A:傳統AI視覺模型就像只會用一把菜刀的新手廚師,只能處理簡單的識別任務。而SpaceTools就像經驗豐富的廚師,能夠熟練使用多種工具:深度估計器判斷物體遠近、分割工具識別特定物體、3D邊界框工具測量大小等,并知道在什么時候使用什么工具來解決復雜的空間推理問題。

      Q2:雙重交互強化學習DIRL是怎么訓練AI的?

      A:DIRL采用兩階段訓練法,類似學做菜的過程。第一階段是"教學階段",先教AI使用最基礎的指向工具,就像先學會基本刀工;同時讓高級AI模型示范完整的工具使用流程。第二階段是"探索階段",AI開始嘗試協調使用全套工具,通過不斷嘗試和反饋來改進策略,最終學會像專家一樣靈活運用各種工具。

      Q3:SpaceTools在真實機器人操作中表現如何?

      A:SpaceTools控制7自由度機械臂執行拾取和放置任務時達到了86%的成功率。它能夠通過攝像頭觀察環境,準確識別目標物體,規劃抓握策略并執行動作。特別在需要理解空間關系的任務上(如"拾取更遠的椰子水"),表現明顯優于GPT-5和Claude等商業AI模型,證明了專門訓練對復雜工具協調的重要性。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      WOC!楊瀚森排在NBA聯盟第3...

      WOC!楊瀚森排在NBA聯盟第3...

      左右為籃
      2025-12-12 12:29:32
      “新冠疫苗之父”落馬,榮譽清零!打過三針的網友慌了

      “新冠疫苗之父”落馬,榮譽清零!打過三針的網友慌了

      胡嚴亂語
      2025-12-07 15:51:07
      苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

      苦等5年,蒙古熟鴨子還是飛了,中俄誰也不讓步,坐視大項目泡湯

      科普100克克
      2025-12-07 18:20:34
      華人在國內的錢,想匯出來難了!

      華人在國內的錢,想匯出來難了!

      以希臘之名
      2025-12-09 18:10:47
      因中國游客減少,日本一溫泉12月損失超1800萬,現已停業

      因中國游客減少,日本一溫泉12月損失超1800萬,現已停業

      隨波蕩漾的漂流瓶
      2025-12-12 18:30:08
      解放軍進入臺海,美航母早已跑路,統一已成定局,鄭麗文開始追責

      解放軍進入臺海,美航母早已跑路,統一已成定局,鄭麗文開始追責

      朝子亥
      2025-12-12 12:00:03
      特朗普和克林頓等在列!美國民主黨陸續公開愛潑斯坦的相關照片!

      特朗普和克林頓等在列!美國民主黨陸續公開愛潑斯坦的相關照片!

      AI商業論
      2025-12-13 10:35:59
      被冤枉6年!36歲貝爾再談皇馬爭議事件:我被媒體抹黑了

      被冤枉6年!36歲貝爾再談皇馬爭議事件:我被媒體抹黑了

      葉青足球世界
      2025-12-10 21:18:51
      太炸裂了!印度首富小兒媳和大兒子被曝驚天丑聞,倆人牽手摸腰很自然

      太炸裂了!印度首富小兒媳和大兒子被曝驚天丑聞,倆人牽手摸腰很自然

      小魚愛魚樂
      2025-12-12 08:39:41
      “只要給錢什么都行”,43歲保姆的話,讓62歲的我破防了

      “只要給錢什么都行”,43歲保姆的話,讓62歲的我破防了

      新時代的兩性情感
      2025-12-03 12:59:07
      柬埔寨是世界最貧窮的國家之一,但統治該國的洪森家族卻富可敵國

      柬埔寨是世界最貧窮的國家之一,但統治該國的洪森家族卻富可敵國

      大道無形我有型
      2025-09-05 11:31:52
      WTT總決賽:孫穎莎轟11-1零封日乒黑馬,國乒包攬女單4強太強了

      WTT總決賽:孫穎莎轟11-1零封日乒黑馬,國乒包攬女單4強太強了

      寒律
      2025-12-13 10:53:35
      香港總決賽混雙四強!莎頭回應被打1-11,日本組合險勝雨果兩口子!

      香港總決賽混雙四強!莎頭回應被打1-11,日本組合險勝雨果兩口子!

      好乒乓
      2025-12-13 11:27:55
      放棄中國國籍投靠日本,結果日本不收中國不要,成為夾縫中的黑戶

      放棄中國國籍投靠日本,結果日本不收中國不要,成為夾縫中的黑戶

      牛牛叨史
      2025-12-13 02:23:07
      中國申請CPTPP4年還在門外?這3座大山比想象中更難爬

      中國申請CPTPP4年還在門外?這3座大山比想象中更難爬

      明月光
      2025-12-11 22:04:44
      被拐30年兒子認親14小時就走,全程冷臉,網友:窮家標簽太刺眼

      被拐30年兒子認親14小時就走,全程冷臉,網友:窮家標簽太刺眼

      老特有話說
      2025-12-06 17:31:27
      中國政府已經暫停大型粒子加速器計劃!

      中國政府已經暫停大型粒子加速器計劃!

      達文西看世界
      2025-12-11 17:05:23
      他們要來10000只死蚊子,把它們的嘴做成了3D打印噴頭

      他們要來10000只死蚊子,把它們的嘴做成了3D打印噴頭

      果殼
      2025-12-10 16:09:31
      明星母親導演父親,他出道16年不火,如今47歲演《大生意人》紅了

      明星母親導演父親,他出道16年不火,如今47歲演《大生意人》紅了

      查爾菲的筆記
      2025-12-10 18:11:47
      蘋果iOS 26.2正式版發布:負一屏終于不卡頓 動效Q彈絲滑

      蘋果iOS 26.2正式版發布:負一屏終于不卡頓 動效Q彈絲滑

      快科技
      2025-12-13 08:16:07
      2025-12-13 12:07:00
      科技行者 incentive-icons
      科技行者
      科技正在如何變革商業世界
      6531文章數 542關注度
      往期回顧 全部

      科技要聞

      比亞迪、小鵬、北汽,集體表態

      頭條要聞

      央媒談美新國安報告:時隔8年 美國提到中國的語氣變了

      頭條要聞

      央媒談美新國安報告:時隔8年 美國提到中國的語氣變了

      體育要聞

      有了風騷白人禿頭,忘掉談了10年的前任

      娛樂要聞

      保劍鋒方回應爭議,否認出軌贈送香水

      財經要聞

      鎂信健康闖關港交所:被指竊取商業秘密

      汽車要聞

      表面風平浪靜 內里翻天覆地!試駕銀河星艦7 EM-i

      態度原創

      時尚
      本地
      數碼
      親子
      藝術

      導演們,該有危機意識了!野生創作正在崛起

      本地新聞

      云游安徽|阜陽三朝風骨,傳承千年墨香

      數碼要聞

      華碩預熱新一代Zenbook DUO雙屏本,雙電池設計將亮相CES 2026

      親子要聞

      打卡得能湖才懂為何家長繞道周末都要來(附上實用遛娃攻略)

      藝術要聞

      砸50億!從網紅小城到摩天地標!230米淄博第一高樓

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 性大毛片视频| 国产毛片三区二区一区| 999精品全免费观看视频| 青青操影院| 亚洲精品99| 午夜精品久久久久久| 国产精品美女一区二区三区 | 国产人妻人伦精品一区二区| 精品国产av一区二区三区| 男女做爱网站| 91视频在线观看18| 91热| 精品国产AV二区| 亚洲色无码国产精品网站可下载| 国产精品久久久久aaaa| 制服丝袜无码视频| 内射自拍| 亚洲精品无码乱码成人| 久久亚洲国产成人亚| 国产成人一区二区三区A片免费| 玉环县| 国产成人综合欧美精品久久| 亚洲AV免费| 国产老熟女伦老熟妇露脸| 特克斯县| 午夜成人鲁丝片午夜精品| 色五月激情五月| 一区二区三区国产| 亚洲熟女av中文字幕| 亚洲午夜无码av毛片久久| 99re在线观看| A片黄色| 九九免费精品视频| 欧美不卡一区二区三区| 国产毛片三区二区一区| 五月婷婷成人| 人妻在线网站| 狠狠躁夜夜躁人人爽蜜桃| 最近免费中文字幕大全| 精品3p| 99re热这里只有精品视频|