教机器人"倒水"是融入生活的第一步!AR收集和生成演示(ARCADE)框架发布
文章链接:https://arxiv.org/pdf/2410.15994
项目链接:https://yy-gx.github.io/ARCADE/
亮点直击
- 引入了一个从单一增强现实(AR)捕获的演示生成大规模演示的新框架。
- 在此框架内,开发了两项创新技术:关键姿势检测器和自动验证,旨在通过用户提供的一个AR演示生成高质量的演示。
- 在一个物理的Fetch机器人上对ARCADE进行了三项操作任务的评估。通过ARCADE生成的演示训练出的BC策略在所有任务中表现出色。在更复杂的倒水任务中的进一步验证显示机器人达到了80%的成功率,突显了ARCADE在家庭环境中实现现实机器人辅助的潜力。
总结速览
解决的问题:
机器人模仿学习面临两个主要的可扩展性挑战:非用户友好的演示收集方式和大量时间积累足够的演示样本以进行有效训练。
提出的方案:
引入了ARCADE框架,结合增强现实(AR)和自动生成合成演示的能力,简化了演示收集并减少用户的努力和时间。
应用的技术:
- 利用AR技术,使用户可以像执行日常任务一样自然地收集演示数据。
- 从单个人类演示中自动生成额外的合成演示,减少了用户手动收集演示的需求。
达到的效果:
在 Fetch 机器人上的三项任务(3-Waypoints-Reach、推送和抓取-放置)中,使用经典的模仿学习算法行为克隆(BC)快速训练政策并取得良好表现。此外,在实际的倒水任务中,ARCADE达到了80%的成功率。
方法
框架概述
ARCADE框架,以一种用户友好且可扩展的方式生成演示,如下图1所示。后面详细说明了基于AR的初始用户演示(图1A)。接下来,描述了生成演示的方法(图1B)。然后详细说明了用户验证生成的演示的方法(图1C)。最后,介绍了一种自动验证方法,用于快速扩展演示集的规模(图1D)。
AR辅助演示收集
为了收集用户的机器人手臂轨迹演示,使用了Microsoft HoloLens 2,这是一种增强现实头戴显示器(ARHMD)。在演示收集过程中(下图2),用户佩戴ARHMD,该设备在用户上方叠加了机器人的数字孪生体,并提供了从机器人视角的自我中心视图。该设置为用户提供了机器人物体运动的实时视觉反馈。对于本文的任务和学习算法,机器人的末端执行器必须与用户的手对齐并跟踪其动作。通过当前的逆运动学(IK)算法来实现这一目标,该算法根据演示者的手位置计算机器人的关节角度。用户食指和拇指之间的距离用于指示夹具的开/合状态,以执行拾取或放置物体的操作。当在演示过程中计算关节角度、末端执行器位置以及拾取或放置动作时,这些信息会被记录在另一台机器上,并通过Unity Robotics Hub的ROS-TCP-Endpoint和ROS-TCP-Connector从HoloLens传输。
演示生成
采样航点和检测到的关键航点的组合集构成了航点集,记为W。为了到达W中的这些航点,使用MoveIt的内置运动规划器和逆运动学(IK),这通常会产生多样化的轨迹,从而涵盖更广的状态空间。
用户验证
- 由逆运动学(IK)不稳定性引发的不自然运动;
- 潜在的危险行为(如机器人手臂过于靠近桌面);
- 用户可能认为不理想的行为(例如一些用户可能偏好较短的轨迹,而另一些用户可能更看重人类化的运动)。
自我验证
行为克隆(BC)的有效训练通常需要大量的演示,通常以数百计。即使用户角色转变为验证生成的演示,BC所需的演示数量仍可能令人望而生畏。因此,设计了一种自动方法,用于扩展生成演示的验证规模,用户只需观察并批准一小部分(例如10到15个候选演示),系统即可基于用户批准的特征集自动生成并自我验证候选演示。
系统验证
本文使用真实的Fetch机器人对框架进行了评估。首先,在三个典型任务上测试了性能:三点到达、推动和抓取与放置(如下图4所示)。选择这些任务是因为它们代表了基本的操作行为,结合起来可以完成各种复杂的家务活动。在第四个更复杂的倒水任务中提供了这一点的示例。
引入了任务完成误差(TCE)度量标准,以米为单位,用来评估BC(行为克隆)在三个典型任务中的表现。对于三点到达任务,通过评估过程中到三个路径点的最小距离的平均值来计算此指标。对于推动和抓取与放置任务,它衡量物体最终位置与目标点的距离。
为了评估 ARCADE 框架在三个典型任务上的性能,比较了四种不同的策略:
评估方法
对于每个任务,执行这四种基于行为克隆(BC)学习的策略十次,报告每种策略的任务完成误差(TCE)的均值和标准差。以下是具体的评估方法:
- 任务完成误差 (TCE):该指标以米为单位,用于评估在三个典型任务上的 BC 性能。对于 3-Waypoints-Reach 任务,TCE 通过在评估过程中对三个预定义的路标的最小距离进行平均来计算。对于 Push 和 Pick-And-Place 任务,TCE 测量物体最终位置与目标位置之间的距离。
通过这种比较,能够评估 ARCADE 框架在不同策略下的表现及其有效性。
下图 5 展示了在三个典型任务中四种基于行为克隆(BC)策略的结果。进行了双向方差分析(ANOVA),以测试演示收集类型(动觉教学基线与ARCADE 框架)和演示集大小(|Ξ|= 1 或 |Ξ|= 100)是否影响 BC 策略的任务完成误差(TCE)。结果发现这两个因素及其交互作用对 TCE 具有显著的主效应,所有三个任务的 p 值均小于 .001。
真实家庭任务 - 倒水
为了展示 ARCADE 在处理更复杂家庭任务方面的能力及其在家庭机器人广泛部署中的潜力,本文引入了一个额外的任务:倒水。在此任务中,目标是让机器人学习从用户给出的单个演示中抓取瓶子并将水倒入杯子。该任务利用与 Pick-And-Place 任务相同的状态和动作空间,当水成功倒入杯子时,任务被视为成功。测试使用从 ARCADE 的 Ξscale 训练得到的 BC 策略,实现了 80% 的成功率(10 次试验中有 8 次成功),失败主要归因于塑料瓶形状的改变。下图 6 捕捉到了机器人成功执行倒水动作的实例。
结论
ARCADE,这是一个可扩展的框架,能够通过增强现实(AR)从单个用户收集的演示中收集大量高质量的演示。这种方法为演示收集提供了一种用户友好且高效的方式。在三个典型机器人任务上的实证评估证明了 ARCADE 在生成适用于有效训练逆向学习(IL)算法的高质量演示方面的有效性。将 ARCADE 应用到真实家庭任务(倒水)中,展示了该框架促进机器人广泛融入日常生活的潜力。
本文转自AI生成未来 ,作者:AI生成未来