在电影《黑客帝国:复活》(2021年)中,主人公尼奥与电脑生成的世界“黑客帝国”战斗,他的战士团队聚集在一组电脑周围,试图找到尼奥的搭档崔妮蒂,她仍然被困在黑客帝国中。尼奥指着电脑屏幕上代表矩阵的绿色代码说:“就是她,在舰桥上。”镜头切换到崔妮蒂骑着摩托车在桥上,她不知道自己是模拟的一部分。计算机是如何“看到”舰桥上的崔妮蒂的?这不是电影所关注的(他们需要拯救人类),但这是本文的重点。
我们在《黑客帝国:复活》中看到的被称为“计算机视觉”。这项技术使计算机能够“看到”并理解视觉信息。计算机视觉依靠算法和人工智能的结合来处理形状、颜色和纹理等信息,以理解它面前的东西。《黑客帝国》中的电脑能够通过视觉线索,比如她的头发、面部结构、衣服等,找到崔妮蒂,并与崔妮蒂相匹配,就像我们用同样的线索来识别一个人一样——即使有时我们比电脑花的时间更长!
“计算机视觉依赖于算法和人工智能的结合,来处理形状、颜色和纹理等信息,以理解它面前的东西。”
虽然计算机能够在几秒钟内识别出母体中的崔妮蒂,但在计算机能够正确识别她之前,还需要进行一些步骤。
1.图像采集:计算机视觉需要视觉输入。在电影中,我们看到尼奥和他的朋友们在黑客帝国中崔妮蒂居住的无名城市里接入了许多摄像头和传感器。
2.预处理:在分析开始之前,可能需要对视觉输入进行一些调整以提高其质量。这可以包括调整大小、降噪或取消等等。在电影中,当镜头开始放大到崔妮蒂骑摩托车时,我们巧妙地看到了这个过程。她的第一张照片是鸟瞰图,但后来随着镜头对准她,镜头变得更加聚焦。
3.特征提取:一旦视觉输入被“清理”,算法就开始提取相关的视觉属性,以帮助理解图像或视频的内容。
4.特征表示:提取的视觉特征或属性必须以机器学习算法可以处理的方式表示。 在电影中,我们看到三位一体的视觉输入在计算机屏幕上由一系列数字和字符表示。
5.机器学习和训练:在这一步中,计算机将被训练来理解基于之前输入的新视觉输入的特征。例如,如果计算机已经接受了组成人类的特征(如鼻子、耳朵、手臂等)的训练,它将知道如何识别一个新的人类。
6.识别和解释:经过训练的计算机视觉系统现在可以识别新的、未见过的视觉数据。在电影中,我们看到电脑通过金色的轮廓标记了三一学院的代表。
在这一点上,你可能非常了解计算机视觉-这是伟大的!但你可能会想,这项技术只出现在科幻电影里吗?答案是否定的!计算机视觉在我们的世界中有许多用途和应用。
让我们从现实世界中一个非常简单而普遍的计算机视觉例子开始。你可能正在电脑或手机上阅读这篇文章。如果你正在使用手机,你可能必须使用密码、个人识别码或面部识别来解锁。如果你使用面部识别,你就看到了计算机视觉的作用!你的前置摄像头拍下你的面部图像,识别出关键特征,然后将图像与你在设置面部ID时注册的保存图像进行比较。一旦计算机视觉识别出图像与授权用户(您)相匹配,手机将解锁。
现在,让我们来尝试另一个计算机视觉的例子,你可能不会每天都接触到它,但它已经慢慢地进入了人们的每周例行公事。你可能每周至少买一次食品杂货。你的杂货店有自助结账亭吗?当你扫描商品时,收银台上方通常会有一个摄像头对着你。计算机视觉可以用来理解这些自助结账亭的摄像头信息,以识别和标记任何可疑行为——比如有人没付钱就把东西放进口袋,或者焦虑地四处张望。
这是计算机视觉的第三个例子,希望你们不用和它互动太多。计算机视觉可以用于交通摄像头,以检测超速和闯红灯等违规行为。然后,计算机视觉可以提取违规车辆的车牌,这样执法部门就可以把罚单发给合适的人。如果你曾经得到一张超速罚单,即使事故发生时没有警察阻止你,那就是计算机视觉在起作用。
因此,《黑客帝国:复活》对计算机视觉的探索——即使它没有使用这个术语——植根于我们生活的现实。我们可以使用计算机视觉来帮助我们解锁手机,在杂货店里追踪商品,或者帮助找到亲人。