中文搜索引擎指南网

 找回密码
 禁止注册

QQ登录

只需一步,快速开始

搜索
查看: 13|回复: 0
打印 上一主题 下一主题

字节跳动 Seed 团队发布最新研究成果 GR-RL

[复制链接]
跳转到指定楼层
1#
发表于 昨天 23:39 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
字节跳动 Seed 团队发布最新研究成果 GR-RL,GR-RL 提出了一套从离线数据筛选到在线真机微调的强化学习框架,可以让机器人给整只鞋连续穿鞋带。

相较前作监督学习模型 GR-3,GR-RL 在穿鞋带任务上将成功率从 45.7% 提升至 83.3%,减少了近 70% 的失败情况。

据介绍,GR-RL 的工作验证了对于长时程、极高精度的柔性物体操作,真机强化学习是一条行之有效的技术路径。

它让我们在无法依赖仿真的情况下,依然能通过闭环交互突破模仿学习的性能天花板。 #人工智能##机器人##具身智能#



字节跳动 Seed 团队发布最新研究成果 GR-RL
https://weibo.com/tv/show/1034:5 ... om=old_pc_videoshow
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏

Archiver|手机版|小黑屋|教你搜 ( 鲁ICP备16006309号

GMT+8, 2025-12-3 10:14 , Processed in 0.475409 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表