计算机和其他机器是出色的工具,可让我们提高生产力,了解更多信息并保持相互联系。但是,为了使用它们,我们需要以某种方式与它们“通信”。从历史上看,这一直是使用鼠标和键盘(或触摸屏)的手动输入,使用屏幕读取计算机返回给我们的内容。
在过去的十年左右的时间里,我们已经看到了一种新的与机器交谈的方式:语音和语音识别。但是这种“与机器对话”的模式会持续到未来吗?如果是这样,它将如何发展?
技术现状
首先,让我们看一下现代技术的状态。人们在日常的大部分互动中仍在使用键盘,鼠标和触摸屏,但越来越多的人开始转向基于语音的互动。我们可以用一个简单的短语在流行的搜索引擎上运行搜索。我们可以大声说出要输入的内容,我们的手机可以将其翻译成书面文字。我们甚至可以安装可以与客户交流或直接与他们互动的数字标牌。
多年来,基于语音的交互已经变得非常复杂。在这项技术发展的初期,它基本上是一场博弈。在大多数情况下,系统无法正确“听到”您的声音,或者会误解您想说的话。但是如今,最受欢迎的数字助理和语音识别程序可以像人一样准确地检测和理解人的语音。
与此相符,人类逐渐习惯了基于语音的交互。在2010年,您可能对其中一台设备说“ OK Google”或“ Hey Alexa”之类的内容很愚蠢。但是到2020年,这是司空见惯的。实际上,当我们看到某人不经常以某种方式与他们的机器进行交互时,这很奇怪。
为什么声音已经被接管
为什么近年来语音识别取得如此可观的增长和发展速度?有一些可能的解释。首先,语音比起手来做任何事都更方便。如果您正在开车,并且想在输入信息时将手放在方向盘上,则可以简单地“大声”思考并加以处理。如果您一整天的打字都感到手指酸痛,可以切换到基于语音的输入,并让您的手稍事休息。如果您在客厅附近没有设备,并且需要在刚刚观看的节目中知道演员的姓名,则可以大声说出查询内容,并在短时间内得到解决。
在技术发展方面,声音也是很容易获得的成果。正如我们将看到的,还有其他一些人机交互模式,它们更加复杂,可能需要数十年的时间才能全面发展,但实际上,我们已经在短短几年内掌握了语音搜索。
消费者看到了好处,技术不断进步。因此,为什么基于语音的与机器的交互已成为新规范是有道理的。
语音的潜在问题
也就是说,即使是长期来看,基于语音的机器交互也存在一些潜在问题:
- 数据隐私。每一项新技术都会带来对隐私的担忧。我们基于语音的搜索和语音识别技术很多时候都在我们身边。我们的人身上有一部智能手机,客厅的角落里有一部智能扬声器。当我们不希望这些系统时,这些系统是否在听我们的对话?他们收集哪些数据并将其发送给技术公司的主管?
- 误解。即使近年来发展迅速,语音识别也会失败。当人们用口音讲话时,或者由于各种原因而无法表达完整的思想时,尤其如此。
- 学习曲线。无障碍获取也可能是一个问题,特别是对于那些仍在讲话中挣扎的人们。为了获得最佳效果,您必须以清晰,直接的声音说话,并准确地表达每个单词。这并非对所有用户都直观。
- 背景噪音。如果存在很大的背景噪音,那么高质量的语音识别仍然会变得混乱。这意味着语音识别仅在某些位置和上下文中是理想的;例如,您不能在摇滚音乐会或建筑工地上使用它。
- 心理影响。我们仍处于语音搜索的初期,但从长期来看,我们可能会发现基于语音的机器交互具有心理影响。例如,我们可能会发现很难与机器交谈而不感到某种情感上的依恋,或者由于我们与机器的相互作用,我们可能会限制自己以不同的方式与世界互动。
如何改善声音
科技公司一直在寻找可以改善语音交互并在竞争中脱颖而出的方法。这些是最重要的重点领域:
- 准确性。语音识别系统已经至少与人类一样好,其中一些系统已经超越了人类的能力。但是,在准确性方面仍有改进的空间,特别是在边缘情况下。
- 预测功能。 结合预测分析,基于语音和语音的交互可能会更加令人印象深刻。机器可以问我们提示性问题,而不是依靠我们的单向输入,并就我们可能需要的东西提出积极的建议。
- 情感背景。同样值得考虑的是在数字助理中发展情感情境阅读,甚至在响应中模仿人类情感内容。例如,数字助理可以通过您的语气告诉您生气或恐惧,并且可以用一种技术模拟的同理心来回应您。尽管“令人毛骨悚然”的因素在这个维度上可能很高,但可能会导致更自然的互动。
语音替代
那么,我们是否将语音作为与机器交互的一种方式而离开呢?这还有待观察,但是有一些竞争者有一天可以取代语音和手动输入,即使它们距离全面开发还差很多年。
- 手势。最有趣的可能发展之一是以手势形式与机器通信。您可以以某种模式移动眼睛以调用特定功能,或者可以空中移动手指来操作全息界面,而不是明确指示设备应执行的操作。手势是无声的,比语音更抽象,从而使手势在许多方面更简单,更易于访问。但是,学习曲线可能仍然很陡峭,并且该技术还没有准备好成为主流。
- 想法。少数公司正在研究直接脑机交互的可能性。换句话说,您也许有一天可以只用自己的思想来控制计算机,就像控制手臂和腿部的运动一样。对于许多人来说,这是一个令人恐惧的想法,因为它暗示结缔相互作用可以在两个方向上起作用。但是,该技术仍处于最早阶段,因此很难预测是否存在问题。
- 其他通讯方式。很难想象机器和人类通信的未来会是什么样子,因此我们不能排除其他更抽象的模型的可能性。一些技术创新者可能想出了一种我们甚至还无法想到的新颖的直接交流方法。
目前,基于语音的控件和通信仍然是我们与机器交换信息的方式中的主导力量。该技术是如此复杂,以至于大多数人可以轻松利用其潜力。它的使用存在一些问题,包括隐私问题和有限的预测能力,但是可以通过进一步开发来缓解(或消除)这些问题。