(原标题:Kindred AI要借助强化学习,让人甚至猴子戴着VR眼镜训练机器人变得聪明)
本文作者:蒋鸿昌
去年9月份,一家叫Kindred AI的公司进入了媒体的视线,这个加拿大公司向美国专利局提交了一项听起来有些异想天开的专利:借助VR眼镜和其他外置传感器,人类操作员可以远程操控机器人,操控数据还可用于训练机器学习算法,让机器人的行为更接近人类,也更聪明。
(Kindred AI专利文件中的图片)
日前,这家颇为神秘的公司终于出来接受了《麻省理工科技评论》的采访,介绍了这个专利背后的技术以及Kindred AI对未来机器人的想法。
Kindred AI由D-Wave的几位研究人员创立。据雷锋网查询,D-Wave称得上是最有名的量子计算机公司,2011年5月,该公司推出了D-Wave One,被称为世界上第一个商用量子计算机。不过,Kindred AI的CTO,也是D-Wave前员工的Suzanne Gildert在参加媒体采访时曾表示,“量子计算机的确很有魅力,但是和人类相似的机器人更酷。”
现在,Kindred AI正在测试让一些常规的工业机械臂在抓取小件东西时更快、更稳定,方法是让机械臂偶尔地需求人类操作员的帮助,这些操作员带着虚拟现实眼镜,可以实时控制机械臂。
“操作人员可以看到、听到及感受机器人看到、听到和感受到的东西。当操作员采取行动时,机器人会同步运动,”Geindie Rose,Kindred的联合创始人兼首席执行官说到。 “这使我们德仪向机器人展示如何像人一样行动。把东西放到特定位置,人类的操作方式并不是最好的机器人控制模式,但在处理复杂状况和不可预见的情况时,人类依然是最好的。”
Kindred AI的系统使用好几种机器学习算法,并尝试预测哪一种能提供所需的结果,例如在机械臂抓取物品时。如果没有好的算法,它就向人类寻求帮助。最重要的是,这些算法能从人类的行动中学习。为了实现这一目标,该公司采用了一种强化学习的方法。据雷锋网(公众号:雷锋网)了解,强化学习曾入选《麻省理工科技评论》发布的“2017全球十大突破性技术”,这种方法讲究在一系列的情景之下,通过多步恰当的决策来达到一个特定目标。
Rose介绍说,在抓取小件衣服时,这个系统的速度是人的两倍,而独立的机器人则根本无法完成这个任务。同时,借助系统,一个人也可以一次操作几个机器人。“我们的想法是,如果你能进行足够长时间的研究,同时机器人背后有AI模型,那么,你就可以尝试不同的模型来验证哪一种模型训练的效果最好。如果你能够让人通过机器人来进行各种操作,那机器人没有理由不能学习到像人类一样。”Kindred AI的专利甚至描述了让猴子通过这个系统控制机器人的可能性。
Kindred AI所追求的方法似乎有巨大的潜力,加州大学伯克利分校的教授肯·戈德伯格(Ken Goldberg)专门从事机器学习和机器人技术,他说,挖掘人类技能将大大加速机器人学习。戈德伯格本人也正在机器人手术上使用类似的方法,他补充说,让机器人从人类学习是一个非常活跃的研究领域。 “这是我认为机器人技术的一个重大机会的核心,有人类示范有巨大的好处。”
不过,让机器人向人类学习也面临很多技术挑战,麻省理工学院的副教授Sangbae Kim正在从事遥控操作的人形机器人工作,他说,将人类控制与机器动作映射在一起是非常复杂的。 “第一个挑战是通过将刚性连接器绑到人体的皮肤上来跟踪人的运动。这是非常困难的,因为我们是内骨骼动物。更大的挑战是真正了解人类进行决策的步骤,其中大部分都是在潜意识中发生的。”
但是Kindred AI的创始人一点都没被吓倒, “我们的目标是解构认知,”该公司CEO,Geordie Rose说到, “所有生物都遵循某些行为和动作模式,我们正在尝试建立具有同样原则的机器。”
Source: MIT Technology Review