本文经极客视界(ID:geekview)授权转载
美国经典诈骗题材电影《11 罗汉》系列
自从微信成为国民级社交软件之后,各类骗子的主战场也随之进行转移,从原来的电话短信诈骗进行了产业升级,成功步入了移动互联网时代。
毕竟作为熟人社交的社交工具,微信获取信任的成本远远低于其他方式,「秦始皇打钱」的时代宣告结束。
骗子们依托微信开发了非常多的诈骗方式,比如针对年轻男性群体的「茶叶诈骗」。
在早期微信还没有完全成为熟人社交软件之前风靡一时,基本套路都是以武夷山某茶庄庄主外孙女在外公重病,亲戚觊觎茶庄的时候走投无路,通过「摇一摇」或者「附近的人」找到了天选之子的受骗者,最终一步一步的让受骗者热血上头打钱买茶叶保卫茶庄所有权。
随着媒体的曝光,此类骗术逐渐失去了效果。但是骗子们的招数依然层出不穷,最近媒体又爆出了一个更新的骗术:近日,赵女士收到父亲的语音留言,对方称买菜没带钱要赵女士转 200 元。
赵女士问了一句「爸,是你吗?」很快收到语音答复。赵女士一听是父亲的口音,便将钱转了过去,结果还是被骗。
同样受害的还有来自沧州的王女士,王女士接到同学发来的微信,让她帮忙转点钱,并发来语音催促。一听就是同学的声音,王女士好心打款 500 元,同样被骗。
这种骗局主要原因还是由于微信盗号造成的,虽然目前通行的微信版本语音是不能转发的,但是骗子可以通过提取语音文件或者安装「增强版微信」(一般是基于 xposed 框架的插件),都能达到转发语音的效果。
虽然这种骗局技术含量不高,如果警惕性高一点,直接打电话联系就可以让骗子不攻自破。
这种「增强版微信」相当于外挂
但是骗子很聪明的利用了中国人给彼此留面子的社交规则,如果是亲朋好友语音跟你说借个百来块钱,一般是不太可能去直接打电话质疑的,这样会显得自己很小气。
再加上又有对方的语音,自然更不会去进一步深究,所以这样的骗局能成功也不意外。
所谓道高一尺魔高一丈,你真的以为打电话就能够攻破骗子的骗局吗?
现在的技术已经完全可以通过算法来生成人的全套语音了,甚至连愤怒、高兴等不同语气情绪都能够做到惟妙惟肖,足以以假乱真,而所需要的材料也仅仅只需要被生成者的几段话。
开发这项技术的是谷歌 2016 年在加拿大蒙特利尔大学建立的人工智能实验室(MILA)。
基于声音合成技术,MILA 在 2017 年 4 月份成立了 Lyrebird 公司。Lyrebird 是一种名为琴鸟的鸟类,这种鸟具有一种特殊的天赋,它不仅能模仿多种其他鸟类的声音,它还能模仿几乎一切它听到的声音。
创造你自己的声音阿凡达
在其网站 DEMO 部分,你可以听到官方合成的足以以假乱真的特朗普以及奥巴马的声音,而美国那边也有记者用机器合成的句子跟家里人打电话做实验,他的母亲完全分不清楚真假。
之所以能产生如此高还原度的合成声音,背后的技术正是神经网络(Neural Network)和机器学习(Machine Learning)。
神经网络模拟电信号在人脑神经元之间的传递过程,对输入数据进行处理。
它利用分层的神经元,从大量样本数据中总结出共同特征。第一个用神经网络来生成人类自然语音的,就是 DeepMind 的 WaveNet。没错,就是那个做 AlphaGo 的公司。
具体的原理比较复杂,就不过多赘述了,总而言之 WaveNet 可以把 PS 痕迹明显的机器语音,转换成更加流畅自然的语音,与人类声音之间的差异大幅降低,目前在鬼畜视频界做的风生水起。
而 Lyrebird 则更进一层,它可以基于音色、音调、音节、停顿等多种特征,来定义某个人的声音,然后生成更加拟真的声音。
对于骗子来说,完全可以通过骚扰电话录音来提取你的声音在 Lyrebird 上进行生成,从而可以完成把我们上面说的打电话验证真伪的这个过程给搞定。
声音靠不住了,那就只能靠脸了。在接到骗子的语言诈骗微信消息的时候,反手就是一记视频通话,这样应该骗子就慌了。
其实不止声音可以伪造,现在连脸都可以通过 AI 来进行伪造了,比如前段时间在 Reddit 上大火的明星换头「成人短片」。
一个网名为 deepfakes 的程序员,他在业余时间用家里的电脑和开源的 AI 工具 fakeapp,通过机器学习算法,成功移花接木,将神奇女侠女主角盖尔·加朵的脸移植到了一名成人女演员身上。
deepfakes 此举一石激起千层浪,由于 Fakeapp 使用门槛极低,无需安装 Python和 Tensorflow 等编程语言和开源软件库就能运行,甚至连高性能显卡都不用,完全可以租用谷歌的云 GPU 搞定。
一时间欧美各大女星的小电影充斥了整个社区,导致 Reddit 做出了紧急封杀处理,一群老司机就此做鸟兽散。
换脸原理
而比成人片更可怕的还是制造假新闻,在今年的 4 月份,就有人利用 Fakeapp 做出了一段假视频,在视频中美国前总统奥巴马对着镜头说出了一句令人震惊的话:「川普总统完全就是个笨蛋。」
这瞬间在美国造成了轰动的影响,大家在这场精心准备的玩笑中,发现了一个可怕的事实,那就是:我们已经进入了这样一个时代,我们的敌人可以做出看起来像任何人在任何时候说任何话的东西。
而 Fakeapp 和 Lyrebird 就是一套组合拳,可以围绕脸和声音两个主要的辨识点去做出以假乱真的材料出来,虽然目前这两个技术还有着不少问题,但是我们看到在机器学习的加持下,它们正在变得越来越强大。
Fakeapp 已经 2.2 版本了
而这两项技术创立的初衷其实也并不是为了作恶,Lyrebird 的创始人就表示他们希望自己的这个技术能帮助那些发声困难的人,通过官方 API 接口,为他们打造出自己克隆出的更真实声音,而不再是过去那种机器发出的声音。
而 deepfakes 也表示「任何技术都可以被邪恶的动机利用,这种事情无法被禁止。我认为人人都可参与机器学习研究不是一件坏事」,虽然这老哥车发起来是迅雷不及掩耳,但是看得出来,这更多也是一名程序员的炫技。
这个技术一旦用好了,对于影视行业后期来说,是一项重大福音,比如斯坦·李老爷子的客串彩蛋也会一直进行下去。
保罗·沃克在《速激 7》的部分场景就是用到了相关的技术
deepfakes 的这番话倒是让人很容易想起当年快播创始人王欣在法庭上的那句「技术无罪」,如今已经出狱的王欣一头扎进了区块链里面。
也许很多年以后,王欣也会想起在风声已经变紧的情况下,他决定继续做一个「有种」的男人的那个下午。
留 言 有 礼 活 动
作为程序员,请谈谈AI技术的利与弊?扫描下方二维码,关注51CTO技术栈公众号。欢迎在技术栈微信公众号留言探讨。小编将精选出最有价值的三条评论,分别获得 50、30、20 元 的 红 包 奖 励,活动截止时间 11 月 30 号 12 时整。