现代计算机视觉技术完全有能力给我们展示只有在电影中才能看到的那种技术超能力。我们可以将视频加载到人工智能系统中,并告诉它放大低分辨率的帧,通过一点训练和一些巧妙的算法,我们可以使它“增强”图像进行识别。
这听起来可能没什么大不了。但想想特斯拉在驾驶辅助功能中使用的相同技术可以用于无数目的,从癌症检测到统计照片中的大量物体,我们使用计算机视觉进行一切工作。这就有些可怕了。
没有什么能阻止一个聪明的开发人员训练人工智能系统从击键或手指移动中推断文本。这很可怕,我们稍后会解释原因。
首先,值得一提的是,自2017年以来,计算机视觉已经取得了长足的进步,当时的人工智能仍然犯了一些简单的错误,例如乌龟被识别为步枪(rifle)。
今天的计算机视觉系统可以用非常少量的数据做出令人难以置信的推断。例如,研究人员已经证明了计算机只需基于人工智能的打字生物特征识别和心理学家开发的自动化压力检测系统进行敲击分析。
研究人员甚至训练人工智能模仿人类打字。因此,我们可以开发更好的工具来帮助我们学习拼写、语法和其他交流技巧。简单来讲,我们正在教人工智能系统从我们的手指运动中做出大多数人做不到的推断。
想象一下,开发能够分析手指运动并将其解释为文本的系统并不困难,就像唇读器将嘴的运动转化为文字一样。我们还没有见过像这样的人工智能产品,但这并不意味着它不存在。
那么可能发生的最坏情况是什么?
现在的互联网无处不在,“肩部冲浪”对于计算机安全是最大威胁之一。也就是说,窃取某人密码最简单的方法就是看着他们输入密码。这就是为什么大多数密码输入屏幕在你键入密码时会隐藏密码,但你永远不知道谁可以看到你的屏幕。
大多数人没有能力确定你到底按了哪个键,或者你在屏幕上敲了什么数字。当我们知道自己在做什么时,我们的手指移动速度惊人,而且我们的手眼协调性非常好。但是AI可以在这些微小的动作上进行训练,而在数据充足的AI世界里几乎什么都有可能。
从理论上来说,对于一个拥有足够资源的开发人员来说,开发一个既可以在AI芯片上运行(比如许多旗舰智能手机上的芯片)也可以连接到基于云技术的模型应该很简单。它将让世界上几乎任何人都能够“看到”其他人在手机和键盘上键入的内容。
如果该技术被坏人利用,后果不堪设想。所以科技公司和政府必须参与其中,此类技术必须严格把控,让它们用在该用的地方。