从计算上来讲,大数据分析这股潮流并不会像是流星那样转瞬即逝。随着数据量的不断增加,对大数据分析的改进也不会停止。 对于预测分析方面的应用,我们只看到了冰山一角。 一些机构正在使用数据挖掘、机器学习和人工智能技术来分析当前的数据以求更好地开展业务(例如预测销售情况、优化营销活动等)。 所有这些不同类型的人工智能技术已紧密地结合了在一起,改变了我们的日常生活,而且这种改变仍将持续。
以下是人工智能、大数据、预测分析和机器学习方面主要的统计数据:
- 到2018年,75%的开发人员将在一个或多个业务应用或服务中采用人工智能技术 - IDC
- 到2019年,人工智能技术可应用在100%的物联网上 - IDC
- 到2020年,30%的公司将引入人工智能以至少增加一个主要的销售过程 - Gartner
- 到2020年,算法将积极地改变全球数十亿工人的行为 - Gartner
- 到2020年,人工智能市场将超过400亿美元。 - 星座研究
- 到2025年,人工智能将驱动95%的客户交互 - Servion
2018年八个人工智能趋势观察
趋势1 - 较大的公司将赢得未来
亚马逊、谷歌、Facebook和IBM将***人工智能技术的发展。作为大型公司,他们拥有更多的资源来收集数据,从而拥有更多的数据可供使用。
这是行业中的***企业在人工智能方面所做的工作:
亚马逊:
- 在人工智能方面的投资已经持续了20多年
- 抓取的网页数据来自于超过50亿个网页
- 在一个正在运营的亚马逊配送中心里,有超过50万张JPEG图片和相应的JSON元数据文件用于描述产品信息
- 每天监测世界各地的广播、出版物和网络新闻超过四十亿条记录
- 近100万个图像和视频,包括音频和视觉上的特征和注释
- 亚马逊的Echo***着语音助理市场,市场份额超过70%
谷歌:
- 拥有***的数据集仓库之一,拥有10-15EB(译者注:1EB=1024PB)的数据 - Cirrus Insight
- 专注于应用和产品开发,而不是长期的人工智能研究
- 拥有超过1300名研究人员的团队 - Google Brain
- 语音助理市场23.8%的用户份额 - Voicebot
- 利用开源平台TensorFlow让任何人都有机会使用机器学习平台
- Google Earth数据库的大小约为3,017 TB或3 PB - Google Earth Blog
- Google街景视图大约有20 PB的街景照片 - Peta Pixel
Facebook:
- 每天处理25亿段内容超过500TB的数据 - Tech Crunch
- Facebook人工智能研究人员(FAIR)包含了大约80名研究人员和工程师 - FAIR
- 每天产生20亿个“喜欢”和3亿张照片 - Tech Crunch
- 每30分钟扫描大约105TB的数据 - Tech Crunch
- 建有一个6.2万平方英尺的数据中心,可容纳500个具有1EB的存储机架
- 每天翻译超过40种语言的20亿用户的帖子,每天有8亿用户可看到翻译后的内容 - Fortune
IBM:
- 计划在10年内,投资2.4亿美元用于创建麻省理工学院 - IBM沃森人工智能实验室 - IBM
- 全球有2000多名员工,在纽约总部有600多名员工 - IBM
- 沃森客户合作跨越六大洲和超过25个国家 - IBM
- IBM正在向沃森集团投资10亿美元,其中包括1亿美元用来支持IBM初创企业的风险投资,以及与沃森一同搭建认知应用程序业务 - IBM
- 通过沃森生态系统已经创建了7000多个应用程序 - 财富
在为应用程序和产品开发服务部署机器学习方面,谷歌可能是处于最前沿的。他不仅是***家开展人工智能研究的公司,而且还拥有7万多名员工。谷歌是一家很大的公司。此外,谷歌大脑是一个深度学习人工智能研究项目,谷歌拥有其整个团队。谷歌大脑的研究涵盖了机器学习、自然语言理解、机器学习算法和技术以及机器人技术等领域。
全球100家最有前途的人工智能公司名单
趋势2 - 算法和技术将会进行整合
所有已经对人工智能进行投资的第二梯队公司(比如英特尔、Salesforce和Twitter)都紧跟在拥有大数据的公司的后面,并开始使用他们的数据算法和人工智能技术。数据交易将存在于行业用户之间,而算法和技术很有可能会进行整合。数据交易以及算法和技术的整合将使人工智能发挥更强大的作用。
随着像谷歌和Facebook这样的大公司不断地收购小公司,小公司手中的算法将被集成到大公司的核心平台或解决方案之中。谷歌收购了DeepMind这家构建了通用学习算法位于伦敦的人工智能公司,目的就是为了获得比其他科技公司更大的商业优势。另一方面,Facebook收购Wit.ai是为自己的语音识别和语音接口提供帮助。它还收购了人工智能创业公司Ozlo,以改进其M虚拟助理的技术。
趋势3 - 数据众包市场将非常巨大
所有的人工智能公司都渴望获得庞大的数据集,以便实现他们对人工智能的野心。这些公司将采用众包的方式来获取大量的数据。目前已经有多种不同的方式来评估众包数据的质量和可靠性,不仅企业可以从这些数据中获得收益,而且也能给消费者一个保证。
OpenDataNow.com的创始人兼编辑Joel Gurin表示:“我们生活在众包文化中,越来越多的人愿意并且乐于通过社交媒体分享他们的知识。”
谷歌正通过众包的方式获取大量的图像来构建成像算法。它还使用众包来协助改进服务质量,如翻译、转录、手写识别和地图。亚马逊还使用众包人工智能来改进Alexa超过15000个的现有功能。
趋势4 - 企业并购,以及更多的并购
根据CBInsights的统计数据显示,收购人工智能公司的竞争已经开始。在2018年,我们将看到更多为了智力资本和人才而并购企业的行为。机器学习和人工智能领域中的所有小公司都将可能被大型企业收购,这主要有两个原因:
人工智能不能在没有数据集的情况下独立工作。由于大公司拥有大量的数据集,所以对于小公司而言,自己并没有太大的竞争优势。
没有数据的算法没有任何用处。没有算法,数据几乎没有用。数据是算法的核心,获取大量的数据非常重要。
哥伦比亚大学创意机器实验室的机器人工程师和总监,Hod Lipson指出,“如果说数据是燃料,那么算法则是引擎。”
趋势5 - 用工具的民主化换取更大的市场份额
大公司将会把自己的算法和工具集开源出来以获得更大的市场份额。基于市场的数据和算法获取壁垒将大大降低,而人工智能的新应用将会增加。通过对工具的民主化,原本有限制或无法获得人工智能工具的小公司将可以获得大量的数据来训练和启动复杂的人工智能算法。
谷歌的***执行官Sundar Pichai谈到了人工智能的民主化问题:“我们大家可以做的最令人兴奋的一件事就是揭开机器学习和人工智能的神秘面纱,让所有人都可以一亲芳泽。”
此外,框架、SDK和API将成为所有主要企业引导消费者使用习惯的标准。基于SaaS和PaaS的模型将成为所有这些公司遵循的商业模式。
趋势6 - 人机交互技术将得到改进
Siri和Alexa可能是两个***的人机交互工具了。更多与它们类似的基于机器人的解决方案将成为人工智能公司的入门级产品。例如,计算机目前可用于语音分析和面部识别,而以后,计算机将能够根据用户的语调来识别他的心情,这称为情感分析。
制造自动化和非消费者关注领域的解决方案将***个得到改进。制造自动化的改进主要归因于采用自动化、机器人和先进制造在内的复杂技术而节省下来的劳动成本。在2018年,非消费者解决方案的改进将普遍存在,比如农业和医药领域的人机交互技术。
趋势7 - 人工智能肯定会逐步影响所有的垂直行业
制造业、客户服务、金融、医疗保健和交通运输已经受到了人工智能的影响。自动驾驶车辆预计2018年就会上市。明年,人工智能将会影响更多的垂直行业,例如:
- 保险 - 人工智能将通过自动化技术改进索赔流程
- 法律 - 自然语言处理可以在几分钟内总结数千页的法律文件,从而减少时间和提高效率
- 公关与媒体 - 人工智能能提高数据处理的速度
- 教育 - 虚拟导师的开发;人工智能辅助论文分级;适应性学习计划、游戏和软件;由人工智能驱动的个性化教育课程将改变学生和教师的互动方式
- 健康 - 机器学习可用于创建更复杂、更准确的方法来预测患者出现症状之前的患病时间
工业革命在100年前几乎改变了一切,而人工智能将在未来几年里改变整个世界。
趋势8 - 安全、隐私、伦理与道德问题
人工智能大旗下的所有东西,包括机器学习和大数据,都容易受到新型安全问题和隐私问题的威胁。有时候,起重要作用的是关键性的基础设施。与隐私问题有关的安全方面的需求,如将银行帐户和健康信息进行保密,将更多地依赖于安全性方面的研究。 2018年将是安全和隐私问题得到解决的一年,也是会有新发展的一年。
人工智能的伦理问题也将成为2018年的主要关注点。需要解决的伦理和道德问题包括了人工智能是否会对人类产生伤害,还是对人类有益。有人担心机器人可能会取代人类,特别是在需要同理心的领域,比如护士、理疗师和警察。要处理的另一个问题则是自主武器。考虑一下一定程度的自主功能,人工智能应掌控武器的某些功能,而不是由人类来完全控制武器。
我们的建议
虽然人工智能已经存在了许多年,但我们今天所知道的人工智能仍然处于起步阶段。目前到处都充斥着有关人工智能及其应用的炒作,从自主车辆到虚拟个人助理,以及其他很多需要人类智能才能完成任务的技术。虽然有大量的人工智能使用案例,其中的大部分都是对具体流程的改进,但要成功部署却需要一定的时间。此外,人工智能行业内的企业并不多,所以碎片暂时还不会出现,非结构化的数据和处理这些数据算法将会出现。人工智能之路任重而道远。