以假乱真的“人造脸”,能骗过面部识别吗?

人工智能 人脸识别
如果你过去几年间曾在网上发过自己的照片, Clearview人工智能很有可能已将这图储存下来,添加到该公司庞大的容纳超过31亿张图片的面部识别数据库中。

[[360561]]

如果你过去几年间曾在网上发过自己的照片, Clearview人工智能很有可能已将这图储存下来,添加到该公司庞大的容纳超过31亿张图片的面部识别数据库中。《纽约时报》称,Clearview可以“终结我们的所谓隐私”。1月份时,笔者拿到了自己的Clearview 人工智能配置文件,这让我为之一怔。

Clearview面临着许多法律上的挑战。美国公民自由联盟(AmericanCivil Liberties Union)曾引用笔者的一篇文章对该公司发起集体诉讼,该诉讼具有里程碑意义。但即使立法者限制了Clearview,阻止线上面部识别就像打地鼠:总有另一个公司会取代它的位置。

随着线上面部识别的普及,消费者如何才能让自己的面部远离大规模监控数据库收集呢?合成内容创业公司GeneratedMedia提出一个解决方案:把脸换成一个由神经网络创建的高科技假脸。假脸会让人们知道你的长相,但真正的脸是不显示的。

这家公司专门制作人工面部。他们使用了一种被称为收集对抗网络(GANs)的技术,这类技术让两个神经网络相互对立。以GeneratedMedia为例,随着两种网络相互竞争,其中一个网络(生成网络)在生成人脸方面做得越来越好。GANs的技术非常先进,足以制作出以假乱真的脸。

该公司最近在《纽约时报》上发表了一篇关于生成人工面孔背后技术的文章,引起了巨大轰动。

GANs也可以大规模地生成人工面孔。Generated Media成立不到一年,已经生成了超过200万张人工面孔。这些面孔代表了各种年龄和外貌的人。它们看起来完全真实,但描绘的人实际上并不存在,也从未存在过。GeneratedMedia允许这些图像以储备照片的形式存在网站上,并将它们作为训练数据以减少其他人工智能系统中的偏差。

运用大量面部图像数据,Generated Media正将目光转向消费者。通过一款今天刚发布的工具Anonymizer,用户可以在上传面部真实图像后获得许多以假乱真的脸。用户可以在社交媒体上,或其他任何需要在公共互联网上发布照片的地方,使用人工面孔而非真脸。这些假照片供个人免费使用,还可以选择使用透明背景。

GeneratedMedia称这些人工面部看起来同真人非常相似,所以可信度高。但由于这并非用户的真脸,如果Clearview或其他面部识别公司将用户的人工面部添加到数据库中,这些公司将无法通过假脸来找到真正的用户。

GeneratedMedia表示,用户“至少每天”都可以将自己的照片换成新的假照片,以享受真脸识别所不具备的隐私性。

在接受采访时,GeneratedMedia的策略主管Tyler Lastovich称,他“私下使用领英时看到有人用了一张合成图片作为头像”,公司也发现“有更多的图片用在推特的个人简介里”之后,该公司设计了Anonymizer。还有一些人试图创造基于人工智能工具改变抗议者和活动人士的头像,从而掩盖他们在网上的身份。

但是Clearview告诉《纽约时报》,这些工具无法欺骗它的系统。一张完全伪造的照片,比如用GeneratedMedia生成的照片,可能是一个更安全的解决方案。

笔者上传了一张自己在加州圣拉蒙一家高档披萨店拍摄的照片,以此测试Anonymizer。

Anonymizer展示了约20个相似图像,还可以选择查看更多。笔者滚动屏幕,选择了一张最相似的假脸。

图源:Generated Media

现在点对点比较。这张假脸的背景是透明的,所以可以把它叠加在一张照片上,这张照片摄于在一家漂亮的披萨店,而真实照片就是在这家店拍的。

看起来像吗?不,笔者不会把发型梳成这样。但这两幅图太相似了,亲密的朋友和家人以外的人可能会把假脸误认为是真人——尤其在推特这样的社交媒体网站上使用假照片时,那里的个人资料照片只有49x49像素。

电脑也可能会犯同样的错误。为了测试真人和AI照片看起来有多相似,笔者用一款广泛运用的面部比较API,由面部识别软件face ++提供,对两幅图进行了比较。Face++得出结论是:“正常概率”下真人同和照片相匹配,并且估计有64%的几率是同一个人。

这个数字不完美,但对于电脑创造出来的人工面部来说,已经相当不错。而且效果会随着时间的推移而改善。Anonymizer的工作原理是分析用户的脸,然后从Generated Media现有的数据库中找到最接近的匹配。随着公司制造出更多的人工面孔,找到高可信度匹配的几率也会增加。

在这次实验中,笔者发现面部越容易辨认,越难伪造人工面孔。为了测试这一点,笔者上传了一张唐纳德·特朗普的照片,结果和他实际的样子完全不一样。不管怎样,在过去的四年里,看特朗普的脸肯定比自己的脸还要多。

把一张非常熟悉的真脸(例如特朗普的脸)和一张假脸进行比较时,人工面孔的漏洞就非常明显了。对于不太熟悉的面孔,它们更容易被忽视,而且人工的看起来还更有说服力。

这展现了该系统的另一运用场景。Anonymizer的对抗程序不一定能创造出用户足以以假乱真的脸。相反,该系统可能最适合这样的情况:用户想让从未见过他的人知道他长什么样子,却不泄露实际长相。

Generated Media表示约会软件就是一个很好的例子。假如用户创建一个在线约会档案,可以从Anonymizer中获取一个假的图像,用它来代替真实面孔。照片能清晰展示出外貌——但如果遇到了某个特别的人并想展露真实面孔,他们最好不会感到很尴尬。

但除非用户选择揭露真实的面部,人工面部能防止那些经常约会网站跟踪狂获取真实外表,从而把用户当成目标。

在一个类似的案例中,该公司与调查记者合作,使用类似工具为希望保持匿名的情报人员创建人工面孔。人工面孔可以让记者(和读者)了解情报人员的年龄、肤色、头发长度及外貌的其他关键因素,同时确保他们的真实身份得到保护。

Clearview AI从新闻文章和社交媒体网站下载了数百万张图片,所以在敏感文章中使用人工面部是防止Clearview搜索情报人员的脸并将其链接回敏感文章的一个好方法。

如果用户打算发布一些敏感话题,也可以考虑采取类似的方法。即用假脸来创建一个独立的社交媒体账户。这样的话,敏感的内容就不会链接到真实面孔上,也不会被那些可能在Clearview这样的平台上搜索面孔的人看到。

在上传一张人工面孔之前,一定要检查社交网络的服务条款:例如Twitter不允许出于欺骗目的使用假脸,但若是用假脸来保护自身言论自由,多数情况不会有事。

然而,并非所有的隐私倡导者都相信Anonymizer等系统行之有效。哈佛大学肯尼迪学院肖伦斯坦中心的研究员、激进主义克里斯·吉利亚德(ChrisGilliard)对我说:“对于任何假脸保护匿名的说法,我并不十分肯定。”

数据共享远远超出公共照片发布到互联网上的范畴。他告诉我,“一部分是因为缺乏监管,不论是在社交媒体上还是从车管所收集信息,人们对数据的疏忽都能致使许多数字工具获得人们的照片。”他认为这是社会而非技术问题,并不是什么能通过“技术”解决的问题。

假脸也有风险。据《纽约时报》报道,这些假脸可以“被用作面具,例如戴着迷人面孔试图潜入情报机构的间谍、隐藏在虚假资料、照片等背后的右翼宣传者、带着友善表情寻找目标的线上骚扰者。”今年早些时候,有人用假脸来分享一家假情报公司关于亨特·拜登的事。

在别有用心的用户手中,Anonymizer可以创造出这些虚假信息。但对于那些心怀叵测的想要做人工面孔的人来说,可能有更简单的方法。网站ThisPersonDoesNotExist.com能使用GANs技术在浏览器中生成假脸,类似Generated Media技术而不需要上传图片。

而且,由于面部生成GANs背后的代码可被广泛使用,大多数心思复杂的罪犯可能会建立他们自己的面部生成系统,而不是依赖那些可以追溯到某个特定公司的面部,因为有可能找到他们。GeneratedMedia表示,用户不能“使用图片冒充他人或进行非法活动”。

如果想在网上发布自己的个人信息而不用担心被监控,或者只是想测试一下联系人对自己的了解程度,可以通过Anonymizer把推特头像换成假脸,看看有没有人注意到。至少,看到一个自己的虚拟克隆脸很有意思。

如果在网上发布敏感内容,担心会成为跟踪的目标,或者只是想掌控那些知道真实面目的人,Anonymizer就不只是一个玩具,而是一个潜在的强大工具。

本文转载自微信公众号「读芯术」,可以通过以下二维码关注。转载本文请联系读芯术公众号。 

 

责任编辑:武晓燕 来源: 读芯术
相关推荐

2021-06-08 10:23:12

人工智能人脸识别Deepfake

2020-11-05 18:59:23

指纹识别人脸识别生物识别

2022-01-04 08:00:00

面部识别安全技术

2023-04-25 13:54:07

游戏AI

2015-03-27 10:39:22

2022-02-20 23:57:29

人工智能语音合成技术

2015-06-12 10:27:46

2019-11-06 13:57:05

AI 数据人工智能

2017-03-16 16:57:56

2023-11-10 00:09:25

人工智能虚假图片

2023-03-29 10:04:18

图像AI

2021-05-18 11:14:55

人脸识别人工智能技术

2010-06-21 10:09:47

Java

2019-02-15 14:33:56

AI模型翻译语言

2020-09-17 20:19:35

人工智能机器学习技术

2020-11-03 09:02:37

人脸识别信息安全技术

2019-07-20 11:00:00

神经网络数据图形

2022-11-21 14:02:14

2015-08-11 09:39:25

重构提高代码质量

2017-08-08 09:18:03

数据大数据云计算
点赞
收藏

51CTO技术栈公众号