▲ 图源波士顿动力公司 YouTube 视频截图
10 月 27 日消息,波士顿动力公司于数小时前在其官方 YouTube 频道上传了一段视频,展示了波士顿动力机器狗的“语言能力”。视频中,波士顿动力机器狗化身“导游”带领工作人员参观自家公司的各种设施。
这只机器狗目前能够回答问题,在发出声音的同时,“嘴巴”也可以随之张开。据介绍,波士顿机器狗目前之所以可以开口说话,是因为工程师们使用了 ChatGPT 的 API 和一些开源的大语言模型来对其进行训练。同时,工程师们为机器狗配备了扬声器,并添加文字转语音功能。视频中的机器狗使用一口“英国口音”询问员工是否可以开启旅程,并介绍即将参观的充电站。
据波士顿动力公司的首席软件工程师 Matt Klingensmith 介绍,为了实现上述的“导游”功能,团队为机器狗提供了一个非常简短的脚本,涉及公司设施中每个房间的信息。然后,机器狗将脚本与它身体上的摄像头等硬件获得的图像结合起来,让它在产生反应之前,能够获得更多关于它所见事物的资料。
波士顿机器狗这次能够实现的能力不只是“导游”,它还可以吟出“发电机在没有欢乐的房间里低声哼唱,好像我的灵魂”这样的诗句。当工作人员有一次问及机器狗的“父母”是谁时,它指向了办公室中陈列的旧款机器狗。
综合IT之家此前报道,波士顿动力公司的机器狗已经陆续展现了包括翻跳舞蹈、智能重新规划路线、跑酷、倒啤酒等在内的多种技能。2020 年 12 月,现代汽车宣布以 10 亿美元收购波士顿动力,成为波士顿动力的母公司。