當機器人從標準化車間走向復雜家居、醫療場景,僅靠視覺和語言指令已難以應對動態物理環境。
1月21日,微軟研究院(Microsoft Research)正式發布首款基于Phi視覺-語言模型家族的機器人專用AI系統Rho-alpha,這款被定義為“VLA+”的創新模型,通過植入觸覺感知、融合仿真訓練與人類反饋機制,讓機器人在雙手協同操作中具備了更強的適應性與可靠性,為物理AI的落地按下加速鍵。
![]()
在人工智能從數字空間向物理世界延伸的浪潮中,視覺-語言-行動(VLA)模型一直是核心支撐,但傳統系統受限于單一感知維度,在非結構化環境中常顯得“笨拙”。
英偉達CEO黃仁勛曾預判,物理AI將引爆新一輪工業革命,賦予自主機器在現實場景中“感知—推理—行動”的完整能力,而微軟Rho-alpha的發布,正是這一理念的落地實踐。
▍VLA+:將感知維度從視覺拓展至觸覺
對人類而言,擰緊螺絲、插拔插頭等動作需依賴指尖觸覺微調力度與角度,但這對機器人來說曾是技術難關。Rho-alpha首次將觸覺感知深度集成至模型架構,通過六維力傳感器捕捉三維力與三維力矩信息,使其能實時感知接觸壓力、剪切力甚至微小扭轉力。
微軟表示,Rho-alpha的突破在于打破了VLA的能力邊界,將感知維度從視覺拓展至觸覺,同時構建了“感知-行動-反饋”的閉環架構,這也是其被稱為“VLA+”的核心原因。
在微軟公布的演示視頻中,兩臺搭載觸覺傳感器的UR5e協同機械臂,在Rho-alpha驅動下執行插頭插入任務:左臂精準定位接口,右臂調整姿態推進,當遇到接觸阻力時,傳感器迅速反饋力信號,模型隨即微調角度避免卡滯。即便右臂出現定位偏差,操作人員通過3D鼠標實時干預后,系統能吸收糾正信息并優化動作軌跡。

目前Rho-alpha已實現觸覺感知與視覺、語言指令的跨模態融合,微軟透露,后續還將加入更精細的力感知機制,進一步提升機器人在精密裝配、醫療輔助等場景的操作精度。
▍真實機器人演示、仿真任務以及視覺問答的數據訓練方式
機器人領域長期受困于高質量訓練數據稀缺,尤其是觸覺、力覺等特殊感知模態的數據,靠人工遙操作采集不僅成本高昂,在危險、精密場景中更不切實際。為此,Rho-alpha采用了真實機器人演示、仿真任務以及大規模視覺問答數據相結合的訓練方式。

華盛頓大學助理教授Abhishek Gupta表示:“雖然遠程作機器人系統生成訓練數據已成為標準做法,但許多場景中遠程作不切實際甚至不可能實現。”“我們正與Microsoft Research合作,利用模擬和強化學習結合,豐富從實體機器人收集的預訓練數據集,進行多樣化的合成演示。”
“訓練能夠推理和行動的基礎模型,需要克服多樣化、真實世界數據的稀缺,”NVIDIA機器人與邊緣人工智能副總裁Deepu Talla表示。“通過利用Azure上的NVIDIA Isaac Sim生成物理精確的合成數據集,Microsoft Research正在加速開發像Rho-alpha這樣能夠掌握復雜作任務的多功能模型。”
▍人機協同,試錯中迭代進階
即便感知能力大幅提升,機器人在真實環境中仍難免犯錯。Rho-alpha的核心優勢的在于“動態適應”,不僅能根據傳感器信號調整動作,還能將人類干預轉化為學習樣本,實現部署后的持續進化。
在BusyBox物理交互基準測試中,Rho-alpha展現出強大的糾錯能力。當系統接到“整理工具箱”的自然語言指令后,若因物體擺放角度刁鉆導致抓取失敗,操作人員通過遠程設備的糾正反饋會被實時納入模型訓練,后續遇到同類場景時成功率顯著提升。這種人機協同的學習模式,讓機器人從“被動執行”轉向“主動優化”,為其在非標準化場景的應用奠定基礎。
![]()
目前Rho-alpha已在雙臂機器人與類人機器人平臺開展測試,微軟團隊正優化訓練流水線與數據庫,重點突破雙手協同操作的性能瓶頸。微軟研究院企業副總裁兼總經理Ashley Llorens透露,詳細技術說明將在未來數月內發布,屆時會披露更多關于跨模態融合、力覺感知的技術細節。
作為微軟將云端AI能力延伸至物理世界的重要載體,Rho-alpha走了開放合作的路線。目前,微軟已啟動Rho-alpha研究早期訪問計劃,邀請機器人制造商、系統集成商及終端用戶參與測試,共同探索基于自有數據的模型定制、部署與迭代方案。后續,該模型還將通過Microsoft Foundry向更廣泛用戶開放。
Rho-alpha的發布,體現了當前大模型研究的一個重要趨勢:即從純數字世界的認知與交互,邁向與物理世界深度融合與協作。通過整合語言理解、視覺感知、機器人行動能力,并融入觸覺反饋與持續學習機制,這類研究正致力于構建能夠適應開放環境、理解人類意圖、并通過協同作業完成復雜任務的智能系統。
機器智能的發展方向正逐漸從執行預先設定的程式,轉向在動態真實場景中學習、調整并與人類協作。隨著此類技術的演進,機器人有望在更多日常與專業場景中,成為人類自然、靈活的工作伙伴。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.