人类或许很快就能够通过向机器人展示如何工作,让机器人学会如何完成工作任务,而且只需要演示一次。美国加州大学伯克利分校的研究人员已经研发出一种方式来加速我们对这些机器朋友的教育。在最近发表的一篇论文中,研究人员公布了一种全新的学习算法,能够让机器人模拟完成在视频中只观看过一次的行动。
现在训练机器人是一项艰难的工作,即使是拿起一个杯子这样非常简单的动作也需要一段又一段的编码,来告诉机器人每一个步骤需要做什么。这个编程过程对于我们人类来说非常困难而且复杂,甚至有时会令人感到沮丧。
即使是编码完全编写完成之后也还有许多工作要做。我们拿装配线的机器人来举例。在所有的指令被输入到电路当中之后,这些机器人必须经历一个长时间的训练过程,在这个训练过程中它们必须重复执行每一个步骤。它们需要不断重复这个过程,直到它们能够在不犯错误的情况下完成任务。
最近已经有程序员研发出了一种软件,能够让机器人仅仅通过观察特定的任务就能够实现编程。虽然这种学习方式非常类似于我们或者动物的学习方式,但这仍然是一种笨拙的方法。目前来说,我们需要向我们的机器人朋友展示这样的训练视频,而且在它们完全掌握之前需要播放数千次。
然而,加州大学伯克利的研究团队已经描述了他们研发的另外一项新技术,这项技术能够让机器人只观察一次人类的某种动作就学会它。研究人员称,他们研发的这项技术将模仿学习与一种元学习算法结合到一起。
他们把这个系统命名为“未知模型元学习系统(简称MAML)”。元学习本质上意味着学会学习的过程。MAML系统意味着机器人能够在之前获得经验的基础上来学习某种新的东西。比如说,如果向机器人展示的是某人拿取苹果并且放进一个杯子的视频,那么它就能够估计自己的目标是什么,就是把苹果放进杯子当中。
当它学会如何处理这些物体时,它就能够将这种知识推广到其它类似的行为。比如说,如果你随后向它展示一段某人将一个桔子放在盘子上的视频,它就能够识别这些行为并且快速将其转变成为自己完成这个任务需要的动作。
对于那些流水线的装配机器人来说,它们不需要了解什么是桔子或者什么是盘子,它只需要执行需要完成的任务。简言之,MAML系统提供了一个平台,让神经网络或者机器人以相对较少的数据学会如何执行各种任务。这几乎与现在的神经网络工作方式完全相反,后者执行一项简单任务就需要大量的数据。
研究团队在几个机器人身上对MAML系统进行了测试。研究人员声称,在展示了一段演示视频之后,机器人能够成功完成视频中展示的任务。研究人员推断,经过元学习之后,机器人借助人类的演示视频就能够学会放置、推动以及拾取和放置新物体。