ClutterGen:用于机器人学习的杂乱场景生成器 原创

发布于 2024-7-11 13:24
浏览
0收藏

模拟在推动机器人学习方面发挥了重要作用,通过提供一个受控而多变的环境来开发和测试算法。特别是数据驱动方法通常将机器人部署到仿真环境中,在各种多样化和随机化的设置中进行广泛训练,以实现可泛化和适应性强的行为。通过随机化物体形状、纹理和动态特性,机器人学习取得了显著进展。然而,尽管物体属性是一个关键因素,但物体布局仍然具有挑战性,难以实现完全开放式的随机化。与可以在不干扰其他物体的情况下轻松指定范围的物体属性不同,物体布局必须考虑其他物体的存在和物理可行性。例如,在场景中布置物体需要确保它们不重叠,并且放置在稳定的位置,而不是从空中掉落。现有的努力通常通过固定物体的基础来解决这个问题,但这种策略对于像瓶子或杯子等许多物体并不适用。随着物体数量在有限空间内的增加,生成随机化而又稳定的物体布局变得指数级困难。图(a)展示了使用广泛采用的随机采样和拒绝失败轨迹的方法在桌子上放置七个物体时遇到的挑战。其他方法需要人工手动指定物体区域以进行局部随机化,或者将可能的放置空间离散化以避免碰撞。然而,导航和操作混乱环境是将机器人学习应用于现实世界的重要挑战。

近日,杜克大学研究人员提出了ClutterGen,一个物理上可适应的仿真场景生成器,能够生成多样化、混乱且稳定的场景,用于机器人学习。生成这样的场景具有挑战性,因为每个物体都必须遵守重力和碰撞等物理法则。随着物体数量的增加,找到有效的姿势变得更加困难,需要大量的人工工程工作,这限制了场景的多样性。为了克服这些挑战,研究人员提出了一种强化学习方法,可以利用仿真器提供的基于物理的奖励信号进行训练。ClutterGen是一个自回归仿真场景生成器,用于创建物理合规且高度多样化的混乱场景。通过将混乱场景生成视为强化学习问题,ClutterGen从3D观测中学习闭环策略,无需预先存在的数据集或人工规范。一旦训练完成,ClutterGen可以应用于原始环境的各种变化,无需进行精细调整。实验表明,ClutterGen可以在有限的桌面表面上生成包含多达十个物体的混乱物体布局。此外,该策略设计明确鼓励生成场景的多样性,以支持开放式生成。真实机器人实验结果表明,ClutterGen可以直接用于混乱重新排列和稳定放置策略的训练。

译自(有删改):http://www.generalroboticslab.com/blogs/blog/2024-07-06-cluttergen/index.html


本文转载自公众号AIGC最前线   

原文链接:​​https://mp.weixin.qq.com/s/85u-GzpTesyko-Ma7dO-QQ​



©著作权归作者所有,如需转载,请注明出处,否则将追究法律责任
收藏
回复
举报
回复
相关推荐