Josh.ai 展示了使用其语音助手进行概念验证的 ChatGPT 集成。Josh 系统目前只能通过专业安装人员使用。图片来源:Josh.ai
如今,智能家居用户可以让 Alexa 打开灯或让 Siri 告诉你卧室的温度,有时它们会准确无误。或者你可能会听到,“您有 15 个名为灯的设备;你想控制哪一个?” 或“XXX目前的温度是35摄氏度。” 但是,如果你的语音助手不仅总是准确的,而且还可以回应模糊的评论,比如对“我今天过得很糟糕;有什么好的放松方式?” 有“智能”反应?例如,通过降低窗帘、调暗灯光、调节恒温器以及在网络平台上购买一些好吃的东西?
Josh.ai 家庭自动化系统的联合创始人 Alex Capecelatro 表示,这就是由新的 AI 语言模型提供支持的语音助手的潜力。Josh.ai 已经开始使用 OpenAI 的 ChatGPT进行原型集成。这段概念验证视频展示了 Capecelatro 要求 Josh 的助手打开窗帘、关闭音乐并告诉他天气(同时控制三件事是 Josh 已经具备的能力)。然后他继续为智能家居使用更自然的语音命令,比如“我正在拍摄视频;这里有点黑,”语音助手通过打开房间的灯来回应——虽然有点笨拙。
通过使用 AI 语言模型解析自然语言来改进智能家居控制的可能性非常诱人。Capecelatro 认为这是未来。“我们正在努力弄清楚我们能以更自然、更直观的方式控制您的环境,”他说。
如今,语音助手通常需要精确的语言,并且经常将基本的智能家居命令与信息请求混淆,这导致令人沮丧的响应,有时甚至是无用的响应。这是 Josh.ai 在 Capecelatro 和 Tim Gill( Quark 的创始人)于 2015 年创办公司时着手解决的问题。其同名语音助手旨在出色地控制连接的小工具,无论如何表达请求。
“如果我们不采用 ChatGPT 类技术,像我这样的企业将在一年内不复存在。这对任何在家中进行语音控制的人的未来至关重要。”
使用广泛的知识图谱模型,Josh 可以在听到“卫星”而不是“开灯”时进行解析并做适当的事情。“拉开窗帘”听起来像是“拿些葡萄”,但 Josh很聪明,知道你不住在葡萄园里。“我们花了很多时间在引擎盖下工作来修复听错,处理不同的口音,理解不完美的句子等等,所以即使你说'打开该死的灯',我们也知道你的意思,”Capecelatro 说。
目前,Josh 仅在由 Crestron 和 Control4 等公司提供支持的定制智能家居装置中用作语音控制层。在那个更受保护的环境中,系统由专业安装人员设置和控制,并使用Josh.ai 的专有硬件,Josh 以更可靠、更私密的语音助手而闻名——尽管进入成本更高. (虽然 Josh 有一个云组件,但大多数请求都是在Josh Core上本地处理的,并且在使用基于云的 API 时,可识别信息会被删除,Capecelatro 表示。)
Josh.ai 系统包括一个集线器和两种型号的智能扬声器以及一个应用程序和与 Ava 智能遥控器的集成。图片来源:Josh.ai
该公司最近宣布与亚马逊建立合作伙伴关系,现在正押注 ChatGPT 和其他聊天机器人使用的新一代大型语言模型 (LLM)。Capecelatro 认为,这些系统将使今天的语音助手变得更有用。“一年后,没有人会愿意容忍 Alexa、谷歌、Siri 甚至 Josh 的旧运作方式。这还不够,”Capecelatro 说。“如果我们不采用 ChatGPT 类技术,像我这样的企业将在一年内不复存在。这对任何在家中进行语音控制的人的未来至关重要。”
对于 Josh.ai 来说,它的一般知识深度不如其竞争对手,ChatGPT 集成添加到语音助手的知识库是一个巨大的飞跃。“我们一直想让 Josh 尽可能聪明,但我们是一个小团队,”Capecelatro 说。
但对于一般的智能家居而言,希望在于将 AI 语言模型的对话能力与家庭自动化系统可以提供的上下文相结合。例如,通过了解您家中有哪些智能设备以及您如何使用这些设备的详细信息,Josh 可以将自然语言命令解析为您家中的操作。说,“嘿 Josh ,孩子们回家的时间快到了,天快黑了。你能确定一切都准备好了吗?” 例如,语音助手可以打开门廊的灯,开始预热烤箱,拉下窗帘,打开厨房的灯。
Josh 还致力于使用 ChatGPT 在智能家居中进行媒体发现。迄今为止一直缺失的链接。“如果您不知道自己想要什么,那么语音控制就不是理想的选择,”Capecelatro 说。“我们构建了与Ava 遥控器的集成,您可以使用它来浏览您想要观看的内容。通过将 ChatGPT 添加到组合中,您可以说,“Netflix 上有哪些非常好的节目,可能是 romcoms 和特色(这个)演员。” ChatGPT 可以编制一个列表并将其显示在遥控器的屏幕上。” 那就是家庭电影之夜了。
Josh 的 AI 升级尚未上线,Capecelatro 表示公司正在密切关注其他公司在该领域的新兴技术,以应对他们提供更好的模型。除了 ChatGPT 目前非常慢(视频经过编辑以加快速度)之外,还有一个非常真实的人工智能生成问题。(事实上,训练 ChatGPT 的数据集在 2021 年年中结束。值得注意的是,在演示视频中,当 Josh 被问到“有哪些节目可以在 Netflix 上观看”时,它列出的最新节目于 2019 年首次亮相.) 但 Capecelatro 表示,某种形式的生成式 AI 语音助手将进入智能家居。
谨慎是绝对必要的。没有企业希望种族主义、恐同、杀人的语音助手通过他们的硬件将其“意见”传播到人们的家中,这是一个明显的可能性,因为生成 AI 本质上是在没有过滤器的情况下反刍内容。“我们非常谨慎。我们本可以立即使用 ChatGPT 集成,”Capecelatro 说。“我们没有那样做。因为我们不想给人们非常糟糕的数据。我们不想说谎。”
该公司计划花时间弄清楚如何设置正确的护栏,这对于将这项技术转化为智能家居至关重要。“我认为微软和谷歌[在他们的搜索 ChatBot 模型中] 有点过火了,他们现在看到了后果,”Capecelatro 在谈到最近迅速横盘整理的高调发布时说。
假设谷歌、苹果和亚马逊都在研究如何将新的人工智能语言模型整合到他们的语音助手中并不是一个飞跃,而智能家居爱好者已经找到了使用方法Siri 快捷方式让 ChatGPT 进入他们的智能家居。与智能扬声器交谈比在网络浏览器中输入要容易得多。
但我们真的希望在家中安装这种人工智能吗?我们对一个“能正常工作”的语音助手的渴望是否如此之大,以至于我们会很高兴有一个可以尝试教我 8 岁的孩子量子物理学的语音助手?就个人而言,我认为一个可靠的、语音控制的智能家居系统知道我说“关掉该死的灯”时的意思就够了,而不是一个无所不知的智能来管理我的家。
虽然天生有能力、非常直观的语音助手完美的家庭管家的承诺非常吸引人,但我担心现实可能更像太空漫游而不是唐顿庄园。但让我们看看我是否被证明是错误的。