本文转载自公众号“读芯术”(ID:AI_Discovery)。
十年前,一些最基本的人工智能算法(比如图像识别)需要数据中心通常具备的那种计算能力才能使用。而如今,这些工具在智能手机上就可以使用,并且功能更强大、更精密。
像核能或火箭推进一样,人工智能也被视为一种“两用”技术,也就是说,它既能带来好处,又能造成危害。
不久前,Vice报道了人工智能最新造成的一个危害案例:编码人员正用性虐待图像训练算法制作色情作品。这篇报道详细披露了这名匿名博士生是如何将未经双方同意的图像编译为数据集,并结合现有算法生成自定义视频的。
用人工智能生成色情作品的创作者将这些作品发布在Pornhub、OnlyFans等平台上。他向Vice透露自己使用了StyleGAN2,一种由Nvidia构建的开源算法。如果你曾经在网上看到过极其逼真的假人脸(比如ThisPersonDoesNotExist.com网站),那么它们很有可能是由StyleGAN2生成的。
这项技术并不是一夜之间就出现的。从某些最早的现代图像生成算法出现,到这种人工智能生成色情作品现象的发生,都是有迹可循的。
图源:Getty Images
向生成对抗网络(GAN)的飞跃
2014年,图像生成算法的能力突飞猛进,生成对抗网络(GAN)应运而生。这是一个名叫伊恩·古德费洛(Ian Goodfellow)的人工智能研究员在酒吧和别人争论时所想到的,即让算法之间相互竞争,从而产生最佳结果。
生成图像需要“生成器”和“鉴别器”。生成器生成图像,而鉴别器将根据其训练时接触到的真实图像来判断该图像是真是假。鉴别器只会接受最真实的图像,从而确保最终结果是人工智能生成图像中的精品。
让技术变得有用
古德费洛对生成对抗网络的最初研究在行业基准测试中表现良好,但他创建的许多图像看起来仍然像是让人难以接受的一团乱麻(以抽象和非人性的方式来表达创建者的想法)。
2016年,其他研究人员已经开始试验这项技术,并找到了制作逼真图像的方法,尽管分辨率很低。当时,有一篇出色的论文描述了研究人员是如何生成逼真的卧室图像的,以及初次尝试生成人脸的过程。
这项研究再次表明,生成对抗网络能够以训练时接触到的数据为基础进行调适。这种技术能够生成逼真的卧室图像,同样也能生成逼真的人脸图像,这意味着生成对抗网络实际上能够识别各种不同类型图像中的图案。
深度伪造变得越来越普及
以生成对抗网络架构为基础,目前有多种免费的开源方法来合成人脸。随着亚马逊云服务(AWS)和谷歌云(Google Cloud)这样的云服务变得越来越容易访问,训练这些算法的能力也变得越来越容易获得。
在人工智能研究领域中,最有名的是Nvidia团队开发的StyleGAN。它于2018年12月发布,虽然它能够生成不可思议的高质量假脸图像,但这些图像上仍然会出现奇怪的模糊画面和数字伪像。之后不到一年的时间内,Nvidia团队发布了StyleGAN2。
为防止形成这些模糊画面和伪像,并提高图像的保真度,该版本修复了算法的体系结构,这些算法能够适应不同的领域。通过使用色情图像(不仅仅在面部图像上)训练算法,该系统能够生成一些它可能从未打算生成的东西。
通过DeepFaceLab和Wav2Lip等开源项目,生成对抗网络也已经被用来专门从事深度伪造。想要使用这些服务确实很容易:从Wav2Lip项目的网站上可以了解到,如何用一行代码实现视频人物与任何音频文件自动对上口型。
这些技术仍处在起步阶段,但它们将变得更加精密、更有说服力。某些应用确实很有趣,但目前看来,这些算法更容易被某些别有用心之人利用去做一些坏事。如果不采取措施,深度伪造的危害可能超过其微不足道的娱乐价值。