品玩12月3日訊,據pandaily 報道,字節跳動Seed團隊近日推出新型強化學習框架GR-RL,顯著提升視覺語言動作(VLA)模型在長時間、精細操作任務中的能力。
該框架通過從離線數據篩選到在線實機微調的全流程優化,首次實現機器人連續完成整根鞋帶穿引全過程,成功率達83.3%。
相較此前基于監督學習的GR-3模型,GR-RL將穿鞋帶任務成功率從45.7%大幅提升近一倍,失敗率降低近70%,標志著機器人靈巧操作能力取得重要進展。該成果為復雜精細操作的自動化提供了新路徑。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.