AIPress.com.cn報道
1月22日消息,據微軟官方披露,其研究團隊推出了一款名為 Rho-alpha 的機器人模型,這是首個基于 Phi 系列視覺—語言模型衍生的機器人基礎模型。該模型被定位為新一代“視覺—語言—動作”系統,目標是在更動態、非結構化的真實環境中提升機器人的理解與操作能力。
![]()
微軟研究院表示,傳統機器人系統主要依賴視覺和語言輸入,而 Rho-alpha 在感知層面引入了觸覺信息,并計劃進一步擴展至力反饋等感知模態。在學習機制上,該模型支持在人類反饋的持續引導下不斷優化,從而提高操作穩定性與可靠性。
從能力設計上看,Rho-alpha 可將自然語言指令直接轉化為雙臂協作的控制信號,適用于雙手精細操作任務。微軟將其描述為一種“增強型視覺—語言—動作模型”,強調其在感知維度與學習方式上的擴展。
在訓練方法上,Rho-alpha 結合了三類數據來源:
1.來自真實機器人演示的物理軌跡數據;
2.通過仿真環境生成的合成任務數據;
3.來自網絡規模的視覺問答數據。
微軟指出,這種混合訓練路徑旨在緩解機器人領域長期存在的高質量、多模態訓練數據不足問題,尤其是在觸覺等非主流傳感領域。
針對數據獲取難度,微軟研究團隊與學術機構合作,利用仿真與強化學習技術生成多樣化合成數據,以補充真實機器人數據的規模與多樣性。相關研究人員認為,這一方法有助于突破機器人訓練對人工遠程操控的依賴限制。
在實際運行過程中,Rho-alpha 仍可能出現操作偏差。微軟表示,系統允許人類通過三維控制設備進行實時干預和“糾偏”,并將這些修正反饋重新納入模型學習流程,以實現持續改進。
目前,Rho-alpha 正在雙機械臂平臺及類人機器人上進行評估測試。微軟表示,未來將公布更完整的技術細節,并希望與機器人制造商、系統集成商及行業用戶合作,探索該模型在云端物理智能系統中的訓練、部署與長期演化路徑。(AI普瑞斯編譯)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.