2016年年初,传奇的围棋棋手李世石与一个围棋界的"新手"开始了一系列举世瞩目的较量。
围棋是一种棋盘类游戏,于2500年前发源于中国。它是一种比国际象棋更为复杂的策略游戏,全球有75个国家的选手积极地参与其中。
李世石,围棋九段棋手,从2002年起多次获得世界冠军。他面对的是一个看不见的敌手-AlphaGo。AlphaGo是由伦敦的谷歌DeepMind团队开发的。不知道李世石在赛前对他的对手了解多少,也许他从科学作家马修布拉加的关于围棋的文章中得到了安慰。该文章于2014年发表,其中谈到了围棋:
“…是少数几种计算机智能尚未掌握的游戏之一。该游戏有着太多的可能的走法,让程序员长期以来陷入僵局。”
但在数据科学领域, 24个月已经是一段相当长的时间了。谷歌的深度学习算法可以打败优秀的计算机对手,甚至是在让对手四子先手的情况下。 2016年1月, AlphaGo曾以5:0的比分完胜欧洲冠军樊磨。2016年3月, AlphaGo挑战传奇选手李世石。
1、最后一子
在最后一子落下之前,胜负已经十分明了。法国著名媒体机构CAUSEUR尖叫: "李世石感到羞耻的一天。"震惊的九段冠军挣扎着讲述他被数学算法打败:
“...我应该表现得更好,应该有更好的结果以及更好的比赛过程。我为没能满足很多人的期望而道歉。我有些无能为力。”
李世石仅仅是另一个在人机对战中被高度关注的选手。人机对战的历史可以追溯到约翰亨利和新技术蒸汽钻那场史诗般的对战。在那场无限制的比赛中,双方表现得旗鼓相当,最终亨利获胜,但不久就因虚脱而死。随着铁路蜿蜒穿越整个美国,蒸汽钻成了必不可少的工具。深度学习之于李世石如同蒸汽钻之于约翰享利。
1.2 —件怪事
奇怪的是,对于那些以建立专家模型为生的人,从神经网络和其他来自机器学习的高度技术中获益是显而易见的。实际上(与理论猜测相反) ,深度学习的惊人成果受到了商界、政府机构、研究界以及越来越多的学者的高度重视。正如一位学者所说:
"20世纪90年代,经验主义的复兴是一个激动人心的时刻。我们从来没有想到,我们的努力会如此成功。当时,我们想要的只不过是一席之地而已。在当时流行的各项研究之外,我们所想的只是为不同于当时其他研究的工作争取一点空间。”
1.3 两类人
还记得那个古老的笑话吗?世界上有两类人——一类人相信世界上有两类人,而另一类人完全不相信前一观点。好吧,我确实相信世界上有两种数据科学家。我并不是在说那些学习计算机科学的数据科学家和那些学习统计学的数据科学家。任何称职的数据科学家都可以在需要概率、统计、数据结构和算法的时候信手拈来。实际上,本书中的建议同样适用于这两个学科的数据科学家,我们也会看到对两者都有很大好处的例子。
我也不是在谈论机器学习狂热分子与传统统计建模的数据科学家。经典的统计建模和由现代机器学习开发的算法在识别和利用数据集的重要特征方面都起着重要的作用。本书将帮助你更好地理解这两种方法,并将它们更有效地结合到分析数据集中。
我甚至谈论的也不是具有专门领域知识的数据科学家和那些通才的数据科学家。在一个学科深入进去并精通,是会有很好的回报的;灵活地跨越多个学科之间需要非凡的天分,也会是收获颇丰的。本书会在这两个方面帮助到你。
好吧,我认为世界上的两种数据科学家是具备深度学习技术知识的和不具备深度学习技术知识的。我不是说那些缺乏这些知识的人就比他们当代的同行们不专业。简单来说,深度学习的知识能让你接触到更广范围的工具,能从不同的角度解决具有挑战性的问题,并能快速有效地得出解决方案。简而言之,深度学习扩展了你的数据科学工具包。
一位数据科学家,如果对深度学习优秀的方法知之甚少,那么与具有该技能的同事相比,这会是一个非常显著的缺点。从衰老研究到动物学分析,对深度学习技能的需求都是非常高的。
2、什么是深度学习
深度学习是机器学习与神经网络、人工智能、图形化建模、优化、模式识别和信号处理等技术融合后产生的一个领域。在严谨的学术期刊中,这个新兴学科的模型一直受严肃理智的学者所推崇:
"深度学习网络是神经网络革命性的发展,人们甚至认为可以用它来创建更强大的预测模型。”
2.1 成功的蓝图
简单来说,深度神经网络是一种用多层抽象来表示概念或特征的方式。其实,任何工程师或者建筑师都在用这种基本方法。想想大型办公楼的蓝图:在最底层,会标示出电路、水管和排水系统的详细情况;而在最高层,可能会有一个旋转观景台和旗杆,能看到整个30层楼的轮廓。
深度神经网络也遭循这个非常有用的方案。该方案几乎被用于生活的各个领域。医生有诊断书,教师有教学大纲,企业有盈利策划书,甚至学术界都有一个发表研究论文的规范。
实际上,在生活中很难找出不用多层抽象来表达观点的例子——军队指挥官用相同的原则部署作战,政治家以此赢得竞选。相同的原理同样适用于神经网络或者其他多层模型的分类和预测,这是室无道理的。
更快的计算机处理器,日益廉价的内存以及层出不穷的新数据格式,使得任意规模的企业都能用深度学习来做数据分析。
2.2 有监督学习和无监督学习
深度学习使用多层机器学习模型对数据进行有监督学或无监督学习。模型中的不同层由非线性数据变换的多个阶段组成,数据的特征在相继更高、更抽象的层表示。
数据科学领域有如下两种基本的学习类型。
有监督学习:训练的数据包含已知的结果。模型相对于这些结果进行训练。
无监督学习:训练数据不包含任何已知的结果。算法自行发现数据中的联系。
2.3 深度学习的流程
在学习深度学习的核心思想时,我们采取的通用方法一般如图2.1所示。无论开发什么类型的机器学习模型,最终都回归到这个基本模型。输入数据传递给模型,经过多个非线性层进行过滤,最后一层包含分类器——决定该对象所属的种类。
图2.1 通用深度学习框架
用数据进行学习的目标是预测响应变量或者用一组给定的属性对响应变量分类。这与线性回归有点类似,在线性回归中,用一组独立变量(也叫属性或特征)通过一个线性模型来预测因(响应)变量。不过,传统的线性回归模型并不被视为深度学习,因为它们没有对数据进行多层的非线性变换。
其他流行的数据学习技术有决策树( decision tree ) 、随机森林( random forest )和支持向量机(support vector machine )。这些技术虽然强大,但是并不深入。决策树和随机森林工作在原始输入数据上,不进行变换,也不生成新特征;支持向量机层次较浅,因为它们仅由核函数和线性变换组成。类似地单隐藏层神经网络也不被视为深度神经网络,因为它们只包含一个隐藏层。
3、深度学习能解决什么问题
深度学习的威力来自于用适量的并行非线性步骤对非线性数据进行分类或预测的能力。从原始输入数据到数据的实际分类的过程中,深度学习模型学习输入数据的分层特征。每一层从前一层的输出中提取特征。
本书所指的深度学习模型是有多个隐藏层的神经网络。如图2.2所示,最简单的深度神经网络至少包含两层的隐藏神经元。其中每一层的输入来自上一层的输出。
图2.2 带两个隐蔽层的前馈神经网络
多层深度神经网络有多个非线性层级,可以紧凑地表示高度非线性的和/或高度变化的函数。它们擅长识别数据中的复杂模式,可以用来改进计算机视觉和自然语言处理等工作,并可以解决非结构化数据难题。
全球发行且读者众多的杂志《IEEE Spectrum》 报道 :"数据科学家供不应求。这些专业人士享有高薪和大型股票期权......"据麦肯锡全球研究所称,仅美国就缺少14万~19万具备适当技能的数据科学家,哈佛商业评论声称数据科学是21世纪最吸引人的工作。
4、哪些领域使用深度学习
深度学习技术正商业化地应用在医疗保健行业、医学图像处理、自然语言处理和提高广告点击率等领域。微软、IBM、雅虎、Twitter、百度、PayPal和Facebook都在运用深度学习来了解用户的偏好,以便能推荐针对性的服务和产品。深度学习无处不在,甚至用在智能手机上来支持语音辅助技术。
很难想出一个不能从深度学习受益的商业活动。思考5分钟,把你一些最好的想法列下来。
这是我想到的领域列表:
过程建模和控制
健康诊断
投资组合管理
军事目标识别
核磁共振和X光分析
银行和其他金融机构的个人信用评级
营销活动
语音识别
股市预测
文本检索
金融欺诈检测
Richard Socher写下了自己的列表,从中找到了一个有用的应用,与他人联合创立MetaMind,该公司专门从事医学图像分析和自动图像识别。其他数据科学家、企业家、应用研究人员,甚至可能是你,将会跟随Richard的脚步进入这个日益增长的利润空间。
4.1深度学习能揭开永葆青春的秘密吗
有一天,我从一个科研机构获得一篇新闻稿,其中有一则新奇的消息-发生了一件极具吸引力的事情,其中涉及深度学习。这则新闻报道涉及美容行业,该行业每年有超过2600亿美元的全球市场。
美容产品的核心在于保持青春-逆转衰老。在世界各地,这一承诺反映在人们每年每天花费在市场营销的数百万美元上。充满青春活力、成熟快乐人士的形象广告充斥着人们的手机、平板电脑和笔记本电脑。
无论你在什么时候碰巧读到本书,都会有一个承诺永葆青春的新美客产品刚刚发布。不信你去看看,快速地在网上搜索一下......
4.2衰老的挑战
有史以来,衰老的挑战一直是伟大思想家、政治家和科学家关注的前沿。期美国老年学家I.L. Nascher在他的经典著作中写到 :
“为什么人会变老,或者为什么经过一段时间的身体机能完美后,器官和组织会退化,其功能变弱并病变,直到它们无法维持生命所必需的、和谐的相互关系,这个问题是生与死这一伟大问题的一部分。”
直到1601年,英国伊丽莎白女王宣布的《济贫法》使这一问题有所缓解,被遗弃的老人因无工作能力穷困无依的困境,是制定该法律的一个关键问题:
“...维持秩序,为国家的福祉做出贡献。”
《济贫法》要求儿女赡养他们的父母和祖父母,因为I.L.Nascher观察到:
“在中国有敬奉祖先和老人的精神,但在我们这里没有。”
《济贫法》在英国持续了250多年。在这段时间里,英国人的预期寿命从约40岁翻了一番,超过了80岁。其他国家也有类似的趋势。
4.3众多的理论
预期寿命的稳步上升有很多原因。临床外科专家Victor Horsley爵士将衰老归因于甲状腺的退化;著名科学家Elie Metchnikoff提出“吞噬作用"的理论--大肠白细胞破坏加速老化的细菌;著名的老年学家Shock博士在一次激烈的讨论中大胆地宣称:
"或许老年医学研究最有用的贡献之一就是证明衰老不一定与退化和疾病有关。”
衰老问题依然存在无数理论,生物学家、老年学家和人口学家之间存在巨大的分歧。衰老是一种疾病吗?人类的寿命是有限的吗?衰老可以停止甚至反转吗?
4.4数据科学家的答案
一则新的消息引起了我的注意,因为它说到,深度学习很可能一劳永逸地解决衰老这个问题。由青年实验室联合创始人Alex Zhavoronkov带领的研究人员进行了一项研究,旨在确定与衰老相关的一组生物指标,一旦成功,这些指标便可以用来有针对性地长期跟踪干预治疗的有效性。这项研究一个令人震惊的地方便是-它仅需进行基本的血液检测。
研究人员开发了一套深度神经网络来预测实际年龄。它用超过60000个样本进行训练。研究人员惊奇地发现,该系统确定了5个核心的生物指标,预测精度达81.5%。
这个非常新颖且颇具开拓性的分析发表在世界著名的研究杂志上。该研究结果极具价值,研究人员也受邀参加世界美容创新峰会——深度学习进军美容行业了。
深度学习需要专业的数据科学人才,而这些人才仍供不应求。目前只有屈指可数的少数公司能从深度学习中获益,其他企业正在迎头赶上。
5、想使用深度学习——却不知如何开始
深度学习已经成为迄今为止使用人工智能构建解决现实世界问题的系统的有效方法之一。互联网时代产生的海量数据正越来越多地被应用在深度学习中。正如记者Robin Wigglesworth在《金融时报》中写到:
“简单来说,深度学习建立在20世纪90年代神经网络发展的基础上,机器使用人造神经元矩阵扫描信息,寻找模式并做出决策,很像人脑的运作模式,但速度超快。”
深度学习在需要分类和/或预测的领域非常有用。在商业、工业或者研究的任何领域,任何对预测和分类问题感兴趣的人都应该学习深度学习。实际上,如果有足够的历史数据、需要预测或分类的研究案例,便可以构建一个深度学习模型进行研究。
要学习一个新的东西,最难的事情就是找到容易理解和部署的例子。找到课题相关的大量技术论文非常容易,但找到入门学习并快速搭建的具体的例子是很难的。本书就是为了解决这个问题。书中有直观的插图、实用的例子以及对模型的简单解释,这些可以用Python直接搭建和测试。这样就很容易上手,通过数据和Python进行试验。
运用本书中的想法将改变你的数据科学实践思维。即使仅实践了本书每章中的一个想法,你也不仅可以使用深度学习完成任务,还将能游刃有余地面对更多数据的机会和挑战。