我们每年向几百名学生教授数据科学,他们都对人工智能很着迷,并会提出很好的问题。汽车如何学习自动驾驶?亚历克莎(Alexa)如何理解我在说什么?声田(Spotify)是怎样为我选择如此精彩的播放列表的呢?脸书如何在我上传的照片中识别我的朋友?这些学生意识到,人工智能不是来自未来的某种科幻机器人。
它存在于此时此刻。它在通过每一部智能手机改变世界。学生们都想理解人工智能,而且都想参与其中。
我们的学生,不是唯一对人工智能产生热情的人。和他们一样欣喜的,还有世界上最大的公司——从美国的亚马逊、脸书、谷歌到中国的百度、腾讯、阿里巴巴。你可能听说过,这些大型科技公司正在发动一场针对人工智能人才的昂贵的全球“军备竞赛”,他们认为这对他们的未来非常重要。
现在,我们看到更多公司参与到人工智能领域的人才争夺之中——比如坐拥海量数据的保险和石油公司,他们同样可以提供可观的薪水和独具特色的咖啡机。
这种军备竞赛当然是真实的,但我们认为人工智能领域目前还有另一个更加强烈的趋势——这个趋势不是集中,而是扩散和传播。是的,每家大型科技公司都在努力囤积数学和编程人才,但与此同时,人工智能背后的基本技术和思想正在以极快的速度扩散,被小公司、其他行业以及世界各地的爱好者、程序员、科学家和研究人员所掌握。这种民主化趋势是最让我们今天的学生感到激动的事情,因为他们正在考虑各种急切需要人工智能解决方案的问题。
比如,谁会想到一群大学生会对黄瓜数学如此着迷?当他们听说日本汽车工程师小池诚(MakotoKoike,音译)的故事时,他们的确很着迷。小池诚的父母有一座黄瓜农场。在日本,黄瓜具有各种令人眼花缭乱的大小、形状、颜色和毛刺度——人们必须根据这些外观特征将黄瓜分属九种类别,这些类别具有不同的市场价格。
过去,小池的母亲每天要花八个小时手工分拣黄瓜。后来,小池意识到,他可以用谷歌的开源人工智能软件TensorFlow完成这项任务。他可以编写一种“深度学习”算法程序,根据照片为黄瓜分类。
小池之前从未使用过人工智能和TensorFlow,但他很容易就根据现有的所有免费资源完成了自学。当他的人工智能分拣机器视频在YouTube上出现时,小池成了深度学习和黄瓜这两个领域的国际名人。他不仅为人们提供了一个有趣的故事,为他的母亲免除了无数个小时的辛劳,他还向全世界的学生和程序员传达了一个令人鼓舞的消息:既然人工智能可以解决黄瓜农场的问题,那么它应该可以解决几乎所有领域的问题。
这条消息目前正在迅速传播。医生正在用人工智能诊断和治疗癌症。电力公司用人工智能提高发电效率。投资者用人工智能管理财务风险。石油公司用人工智能提高深海钻井平台的安全性。执法机构用人工智能追捕恐怖分子。科学家用人工智能获取天文、物理和神经科学的新发现。世界各地的公司、研究人员和爱好者正在以数千种不同的方式使用人工智能,比如探测天然气泄漏,开采铁矿石,预测疾病暴发,避免蜜蜂灭绝,量化好莱坞电影中的性别歧视。
这仅仅是开始。
我们认为,人工智能的真实故事恰恰体现了这种扩散:从过去几十年甚至几百年间的几个核心数学概念,到今天的超级计算机和讲话、思考、分拣黄瓜的机器,到明天无处不在的新的数字奇迹。
我们这本书的目的就是向你讲述这个故事。它在一定程度上是科技故事,但它主要讲述的是思想以及思想背后的人——这些人所处的时代比现在早得多,他们只是在低调地解决他们面对的数学和数据问题,他们并不知道他们的解决方案将对现代社会起到怎样的作用。读完这个故事,你会理解人工智能的含义、来源、原理及其在生活中的重要意义。
人工智能到底是什么意思?
当你听到“人工智能”时,不要想到机器人。你应该把它看成一种算法。
算法是一组带有步骤的指令。这些指令非常清晰,就连计算机这样头脑简单的事物也能遵循。(你可能听说过下面的笑话。一个机器人卡在浴室里出不来了,因为洗发水瓶身上的算法是:“涂抹。冲洗。重复。”)算法本身并不比电钻更加聪明,它只能把一件事情做得很好,比如为数组排序,或者在网上搜索可爱的动物照片。不过,如果你将许多算法巧妙地组合在一起,你就可以生成人工智能,使人觉得它在某个领域可以做出智能行为。例如,你可能会向谷歌Home这样的数字助理提出“奥斯汀最好的早餐玉米卷饼在哪儿”等问题。这种询问会引发算法的连锁反应:
一个算法将原始声波转化成数字信号。
另一个算法将这个信号转化成一串英语音素,即独特的
听觉感知:“brek-fust-tah-koze”。
下一个算法将这些音素划分成词语:“breakfasttacos”。
这些词语被发送到搜索引擎——搜索引擎本身就是海量算法的集合,可以处理查询,做出回答。
另一个算法将这种回答转化成清晰的英语句子。
最后一个算法以听上去不像机器人的方式表述这个句子:
“奥斯汀最好的早餐玉米卷饼在杜瓦尔街的胡里奥餐厅。您需要导航吗?”
这就是人工智能。几乎每个人工智能系统都会遵循这种“算法管道”模式,不管是自动驾驶汽车、自动黄瓜分拣机还是监测信用卡账户盗刷的软件。这种管道会接收来自某个具体领域的数据,执行一系列计算,然后输出预测或决定。
人工智能使用的算法有两个明显特征。首先,这些算法处理的通常不是确定性,而是概率。例如,人工智能中的算法不会直接指出某笔信用卡交易存在欺诈。相反,它会指出欺诈概率是92%,或者它根据数据得到的任何概率。第二个特征涉及这些算法是如何知道应该遵循哪些指令的。在传统算法中,比如运行网站或处理文字的算法,这些指令是程序员提前固定下来的。不过,在人工智能中,这些指令是算法直接从“训练数据”中学到的。没有人告诉人工智能算法如何判断信用卡交易是否存在欺诈。相反,算法会看到每个类别(欺诈,无欺诈)中的许多案例,它会找到区分二者的模式。
对于人工智能来说,程序员的作用不是告诉算法应该做什么,而是告诉算法如何根据数据和概率规则获知自己应该做什么。
我们是如何走到今天的?
自动驾驶汽车和家庭数字助理等现代人工智能系统属于新鲜事物。不过,你可能会吃惊地发现,人工智能的重要思想其实很古老——许多思想已经存在了数百年——我们的祖先一直在用它们解决问题。以自动驾驶汽车为例,谷歌第一款自动驾驶汽车于2009年首次亮相。不过,你将在第三章发现,这些汽车背后的主要思想之一是某个长老会牧师在18世纪50年代发现的——50多年前,某个数学家团队还用这种思想解决了冷战时期最大的轰动性谜团之一。
另一个例子是图像分类,比如自动在脸书照片中为你的朋友做标记的软件。图像处理算法在过去五年取得了很大进步,但你将在第二章看到,这里的关键思想来自1805年——而且,一位不知名的天文学家亨丽埃塔·莱维特(HenriettaLeavitt),在一个世纪前利用这些思想帮助人类解答了历史上最深刻的科学问题之一:宇宙有多大?
再以语音识别为例,这是人工智能近年来的伟大胜利之一。亚历克莎和谷歌Home等数字助理在语言方面非常流利,而且它们只会变得越来越好。不过,第一个让计算机理解英语的人是一位美国海军少将,而且这件事发生在将近70年前。(见第四章。)
这里只举了三个例子,但它们说明了一个惊人的事实:不管你考察人工智能的哪些方面,你都会找到一个被人们长期研究过的思想。所以,从各方面来看,最大的历史谜团不是人工智能为什么会在今天出现,而是它为什么没有在很久以前出现。要想解释这个谜团,我们必须考虑将这些宝贵思想带入新时代的三个强大的技术力量。
第一个使人工智能成为可能的力量是计算机长达几十年的指数增长速度,通常被称为摩尔定律。你很难直观地理解计算机目前的速度有多快。过去的常见说法是,阿波罗宇航员登陆月球时使用的计算能力还比不上一只袖珍计算器。不过,这种说法已经无法使人产生共鸣了,因为……袖珍计算器是什么东西?所以,让我们用汽车来类比。1951年,尤尼瓦克是速度最快的计算机之一,每秒可以进行2000次计算,而速度最快的汽车之一阿尔法罗密欧6C的时速可达180公里。之后,汽车和计算机都在提速。不过,如果汽车能像计算机那样提速,那么现代阿尔法罗密欧的速度将达到光速的800万倍。
人工智能的第二个助推器是新的摩尔定律:随着人类所有信息的数字化,可用数据量出现了爆炸式增长。美国国会图书馆拥有10太字节的存储量,但是谷歌、苹果、脸书、亚马逊四大科技公司2013年一年收集的数据就是这个数字的大约12万倍。而且,从互联网视角来看,这已经是上一代的事情了。数据积累的加速节奏比阿波罗火箭还要快。2017年,YouTube每分钟上传的视频超过300小时,instagram每天贴出的照片超过1亿张。更多的数据意味着更聪明的算法。
第三个支撑人工智能的因素是云计算。消费者几乎看不到这种趋势,但它对人工智能产生了巨大的民主化影响。为说明这一点,我们要对数据和石油进行类比。假设20世纪早期的所有公司都拥有一些石油,但是它们需要独自建设基础设施,以便开采、运输和提炼石油。如果一家公司有了利用石油的新思想,它需要面对巨大的固定起步成本。因此,大多数石油都不会得到使用。同样的逻辑也适用于数据,即21世纪的石油。如果用自己的数据打造人工智能系统需要购买所有的装备和专业人才,大多数爱好者和小公司都会面对难以负担的成本。不过,微软Azure、IBM和亚马逊WebServices等平台提供的云计算资源将这种固定成本转化成了可变成本,极大地改变了大规模数据存储和分析的支出比重。今天,任何想要使用个人“石油”的人都可以租用其他人的基础设施,以降低成本。
当你将这四种趋势——更快的芯片、大量数据、云计算以及最重要的优秀思想——放在一起时,用人工智能解决实际问题的需求和能力就会出现爆炸式增长。
人工智能焦虑
我们已经向你讲述了我们的学生对于人工智能多么兴奋,以及世界上最大的公司是如何迫不及待地迎接人工智能的。不过,如果我们说每个人都对这些新技术如此看好,我们就是在说谎。实际上,许多人对于工作、数据隐私、财富集中或者制造假新闻的俄罗斯推特机器人感到焦虑。一些人——最著名的是特斯拉和太空探索技术公司背后的科技企业家埃隆·马斯克(Elon Musk)——描绘了更加恐怖的图景:机器人获得了自我意识,不再愿意被人类统治,开始用硅片之拳统治我们。
让我们先来谈一谈马斯克的忧虑。他的观点获得了许多关注,这可能是因为拥有亿万身家的颠覆者对于人工智能的论述容易引起人们的注意。马斯克声称,人类开发人工智能技术是在“召唤魔鬼”,智能机器是“对我们的存在产生最大威胁”的物种。
读完我们这本书时,你可以自行判断这些担忧是否可信。不过,我们想提前警告你,你很容易落入认知科学家所说的“可得性启发法”的陷阱,即人们根据头脑中最早出现的任何例子来评估某种说法可信度的心理捷径。对于人工智能,这些例子主要来自科幻小说,而且大部分是邪恶的——比如终结者、博格和哈尔9000。我们认为,这些科幻案例具有强大的锚定效应,会使许多人减少对于“邪恶人工智能视角”应有的怀疑。我们可以想象,可以拍电影,但这并不意味着我们能把它制造出来。今天,没有人知道如何制造出像人类或者终结者那样拥有通用智能的机器人。在遥远的未来,你的后代子孙也许可以想出办法,甚至可以用机器人恐吓埃隆·马斯克的后代子孙。不过,这将是他们的选择和问题,因为今天的人们甚至无法确定遥远的未来是否存在这种可能性。对于现在和可以预见的未来,“智能”机器只在其特定领域拥有智能:
亚历克莎可以把意大利肉酱面的菜谱念给你,但她不能切洋葱。而且,她显然不能用菜刀攻击你。
自动驾驶汽车可以把你带到足球场,但它并不能充当比赛裁判,更不能根据自己的意志将你绑在门柱上,并把球踢向你的敏感部位。
此外,如果你担心我们很快会被拥有自我意识的机器人征服,这种担忧就会产生机会成本。现在关注这种可能性就像1952年实现首次商业飞行的德哈维兰航空公司担心高速星际旅行的影响一样。也许它在未来值得担忧,但是现在,我们有更加重要的事情值得担忧——还是用航班作类比,比如如何为今天天空中的所有飞机制定明智的管理政策。
这个政策问题引出了另一组对于人工智能的焦虑,它们更加可信,急切。人工智能会使人们失去工作吗?机器会毫无责任地制定关于我们人生的重要决策吗?拥有最聪明机器人的人最终会拥有未来吗?
这些问题非常重要,它们一直在被人们讨论——在科技会议上,在全球各大报纸上,在我们同事的午餐餐桌上。我们应该提前告诉你,你无法在我们的书中找到这些问题的答案,因为我们不知道答案。和我们的学生一样,归根结底,我们对人工智能的未来是乐观的。当你读完这本书时,希望你也能拥有这种乐观。不过,我们不是劳动经济学家、政策专家和预言家。我们是数据科学家——同时也是学术人员,这意味着我们的本能是坚守我们的专业。我们相信我们的专业知识。我们可以让你了解人工智能,但是不能明确告诉你未来是怎样的。
不过,我们可以告诉你,我们知道人们对于人工智能的常见观点,这些观点都是不完整的。这些人强调大型科技公司的财富和力量,但是他们忽视了人工智能正在发生的、令人难以置信的民主化和扩散。他们强调机器用有偏数据制定重要决策的危险性,但是他们没能承认人类决策中持续存在的偏差甚至恶意。最重要的是,他们强烈关注机器可能破坏的东西,但是他们没有看到我们将会得到的东西:新的、更好的工作,新的便利,远离重复劳动的自由,更安全的工作环境,更好的医疗保健,更少的语言障碍,新的学习和决策工具。它们将会帮助我们成为更好、更聪明的人。
以就业为例。在美国,从2010年到2017年,失业报告不断创造新低,尽管人工智能和自动化作为经济力量在不断壮大。机器人自动化的脚步在中国更加迅猛,但中国的工资多年来一直在大幅上升。这并不意味着人工智能没有威胁到个体的工作。这种威胁是存在的,而且会持续存在,就像动力织布机威胁到了织工的工作,或者汽车威胁到了马车夫的工作。新技术总会改变经济所需要的劳工成分,压低一些领域的工资,提升另一些领域的工资。人工智能也不例外。我们强烈支持通过工作培训和社会福利为那些被技术取代的人提供有意义的帮助。我们甚至可以将普遍基本收入作为解决方案,就像许多硅谷老板认为的那样。我们承认,我们不是这方面的专家。不过,到目前为止,人工智能会使未来的人失去工作的观点完全没有得到事实证据的支持。
还有市场操纵问题。亚马逊、谷歌、脸书和苹果等大型公司拥有巨大的力量。我们必须对这种力量保持警惕,以免它被用于遏制竞争或削弱民主标准。不过,不要忘了,这些公司之所以成功,是因为它们提供了人们喜爱的产品和服务。只有保持创新,它们才能继续取得成功,而这对于大型机构并不容易。此外,许多预测认为,今天的大型科技公司会永远保持统治地位,但是这些预测并不能解释过去,更不能预测未来。还记得戴尔和微软在计算领域保持统治地位的年代吗?或者诺基亚和摩托罗拉称霸手机领域的年代——当时它们极为强盛,你很难想象到后来的事情。还记得每个律师拥有黑莓手机、每个乐队在Myspace上开设账户、每个服务器来自太阳微系统的年代吗?还记得美国在线、百视达、雅虎、柯达或者索尼随身听吗?不同的公司来来去去,但时代一直在前进,产品一直在变得越来越先进。
我们对于人工智能的出现抱有现实的观点:它现在已经出现了,未来还会变得越来越普遍,不管我们每个人是否喜欢它。这些技术会带来巨大的利益,但它们也会不可避免地反映出我们这个文明的弱点。所以,我们需要警惕一些危险,比如隐私、平等、现有制度的危险以及没有人能预见的危险——如果我们希望在即时评论和140字符的世界里制定明智的政策,我们必须在社会层面上均衡地讨论这些问题,同时考虑到它们的重要性和复杂性。本书不会进行这种讨论。不过,我们会告诉你,要想在这种讨论中扮演明智的角色,你需要知道什么。
关于数学
在开始之前,我们要提醒你最后一点:本书将会涉及一些数学内容。即使你从不认为自己擅长数学,你也不需要担心。人工智能的数学知识极其简单,我们保证你能理解。我们还可以保证,这种理解是值得的:如果你懂得人工智能背后的一点数学知识,人工智能在你心中的神秘感就会大大降低。
我们当然可以写一本关于人工智能的、不包含任何数学内容的书,因为我们一直在听人说,你可以选择数学或朋友,但你不能全选。我们的编辑最初恳求我们采取这种策略,并且低声嘟囔了什么,好像是“每增加一个数学符号,就会失去三千个读者”,也可能是“每增加一个希腊字母,就会失去五千个读者”。不管他说了什么,我们都拒绝了,因为经验告诉我们,你们并没有如此怯懦。
我们两个人已经教了40年的数据科学和概率,许多工商管理硕士和本科生在学习之前也很害怕数学,甚至讨厌数学。不过,当他们知道他们听说过的所有人工智能应用程序(比如亚历克莎和图像识别)的工作原理时,这些学生全都眼前一亮——说到底,这些都只是大数据的概率而已。他们开始明白,那些公式并不像他们最初想象的那么难。到了最后,他们甚至觉得数学给了他们力量。他们意识到,在合适情况下,更加接近机器的思考方式——即根据数据和概率规则制定决策——甚至可以让你变得更加聪明。