斯坦福全球AI报告：人才需求两年暴增35倍，中国机器人部署量涨500%-斯坦福ai指数

刚刚，斯坦福全球AI报告正式发布。

从去年开始，斯坦福大学主导、来自MIT、OpenAI、哈佛、麦肯锡等机构的多位专家教授，组建了一个小组，每年发布AI index年度报告，全面追踪人工智能的发展现状和趋势。

“我们用硬数据说话。”报告的负责人、斯坦福大学教授、前任谷歌首席科学家Yoav Shoham谈到这份最新的报告时表示。

今年的报告，从学术、工业、开源、政府等方面详细介绍了人工智能发展的现状，并且记录了计算机视觉、自然语言理解等领域的技术进展。

报告要点：

一、美国AI综合实力最强

美国的AI论文发布数量虽然不是第一，但美国学者论文被引用的次数却是全球第一，比全球平均水平高出83%。

2018年美国AI创业公司的数量，比2015年增长2.1倍。而从2013年到2017年，美国AI初创企业获得的融资额增长了4.5倍。均高于平均水平一倍以上。

二、中国AI追赶速度惊人

清华2017年学AI和机器学习的学生数量，是2010年16倍。

70%的AAAI论文来自美国或中国，两国获接收的论文数量相近，但中国提交的论文总量比美国多30%。

基于经同行评议论文数据库Scopus的数据，2018年发布AI论文最多的地区是欧洲(28%)、中国(25%)和美国(17%)。

与2000相比，2016年中国AI学者论文被引用的次数，提高了44%。

中国一年的机器人部署安装量，从2012到现在增长了500%。ROS.org来自中国的访问量，2017年比2012年增加了18倍。

三、全球AI发展提速但仍不均衡

2017年，全球ML人才需求已经是2015年的35倍。

整体来说，自2016年以来，美国、加拿大、英国政府在国会/议会会议中对人工智能和机器学习的提及激增。

80%的AI教授是男性，统计数据来自UC伯克利、斯坦福、UIUC、CMU、UC London、牛津和苏黎世联邦理工学院。

美国AI工作岗位的应聘者中71%为男性。

看过这份报告之后，人工智能大牛吴恩达总结了两点：1、AI正在快速发展，不管是学术界还是工业界都是如此。2、AI的发展仍不均衡，在多样性、包容性方面仍需努力。

以下是这份报告的主要内容：

AI论文情况分析

发表总量增长迅猛

从1996年到2017年，CS领域的年发表论文增长了约五倍 (6x) ，AI领域的年发表论文增长了约七倍 (8x) 。对比一下，所有学科的年发表论文总量增长了不到两倍 (<3x) 。

划重点，AI论文的年发表量，比CS论文增长要快。

各地区AI论文发表情况

2017年，Scopus上面的AI论文，有83%来自美国以外的地方。具体数据是，28%来自欧洲，25%来自中国，17%来自美国。

从2007年到2017年，中国的年发表AI论文数增长了150%。

细分领域论文发表情况

2017年发表的AI论文中，有56%来自机器学习与概率推理这一研究方向。

对比一下，2010年发表的AI论文，只有28%来自这个方向。

另外，图表里显示的大部分研究方向，在2014-2017年间，复合年均增长率 (CAGR) 比2010-2014年要高。

比如，神经网络这一方向的论文发表数量，2014-2017年之间，复合年均增长率达到37% (如图中红色曲线) ，最为突出。

做个对比，在2010-2014年之间，神经网络论文发表数，复合年均增长率仅有3%。

arXiv论文

自2010年以来，arXiv论文总体呈现迅速增长，从2010年发布的1,073篇，到2017年发布的13,325篇，增长超过11倍 (12x) 。许多细分领域也呈现增长。

这表示，论文作者们倾向于把自己的研究成果传播出去，不论是经过同行评审还是在AI会议上发表的论文。这也体现了，AI这个领域竞争激烈的特质。

在细分领域中，计算机视觉 (CV) 是自2014年起增长最快的一个 (上图蓝色曲线) ，从1,099篇增长到2017年的4,895篇，涨幅近400%。

AI论文引用量

FWCI是领域权重引用影响系数，可以用来衡量论文的影响力。

报告重新定义了一种“改装版” (Re-based) 的FWCI，不按地区，而按世界平均值，来计算影响力。

在这个标准之下，虽然欧洲发表的AI论文数高于中国和美国，不过论文影响力曲线比较平缓;相比之下，中国发表的论文影响力增长剧烈：与2000年相比，2016年平均每位中国AI论文作者的引用率增长了44%。

不过在这方面，美国依然全球领先，美国AI论文作者的平均引用率，比世界平均值高出83%。

AAAI论文

AAAI 2018，提交论文，中美占70%，中选论文，中美占67%。

中国的论文提交数高出美国约1/3，但二者中选论文数相差无几，中国入选265篇，美国入选268篇。

高校AI课程注册情况

AI和ML进军高校的速度提升了不少。

报告显示，截止到2017年底，AI课程注册人数是2012年的3.4倍，ML课程注册人数是2012年的5倍。

其中，UC伯克利的ML课程的注册人数增长最快，是2012年的6.8倍，但此数值较2016年增长速度有明显下降。

报告进一步统计了非美国地区院校AI+ML课程注册人数的变化。结果显示，清华是非美国院校外增长率最高的高校，几乎是第二名多伦多大学的2倍。

纵向对比来看，清华2017年AI+ML课程注册人数是2010年的16倍。

学术会议热度

在大型会议中，NeurIPS (曾用名NIPS) 、CVPR和ICML，是参与人数最多的三大AI会议。自2012年以来，论参与人数的增长率，这三者也领先于其他会议。

NeurIPS和ICML参与人数增长最快：将2018年与2012年相比，NeuRIPS增长3.8倍 (4.8x) ，ICML增长5.8倍 (6.8x) 。

上面讨论的是大型会议，但小型会议的参与人数同样有明显的增长，甚至可以比大型会议的增长更加明显。

这里最突出的是，ICLR 2018的参会人数达到了2012年的20倍。

原因很可能是近年来，AI领域越来越关注深度学习和强化学习了。

AI创业投资情况

从2015年1月到2018年1月，人工智能创业公司的数量增长到了原来的2.1倍，而所有活跃的创业公司增长到了原来的1.3倍。

大多数情况下，创业公司的增长都保持相对稳定，而人工智能创业公司呈指数级增长。

在风投资金方面，从2013年到2017年，人工智能领域的风投资金增长到了原来的4.5倍，而所有的风投资金只增长到了原来的2.08倍。这些数据都是年度数据，不是逐年累积的。

图表中有两个高峰期，1997-2000年风投资金的激增，对应的是网络泡沫时期。2014-2015年出现了一个较小的增长，因为当时正处于一个相对较大的经济增长时期。

人才需求

报告显示，近几年，社会需要的AI相关人才大幅度增加，目前对有ML技能的人才需求最大，其次是深度学习。

可以看出，ML人才需求也是这两年增长速度最快的。

报告统计，2017年，全球ML人才需求是2015年的35倍，从2016年到2017年的增幅尤为明显。全球对AI人才的需求在2016年骤增。

专利

2014年，大约30%的人工智能专利发明人来自美国，其次是韩国和日本，各拥有16%。

在韩国和中国台湾地区，专利的增长速度较快。2014年人工智能专利的数量几乎是2004年的5倍。

财报电话会议中提及AI和ML的次数

2015年，科技公司在财报电话会议中提及AI和ML的次数开始有所增加。

2016年，其他行业提及AI次数才开始增长。

相比之下，科技行业的公司提及AI和ML的次数远比其他行业多。

在财报电话会议中，除了科技行业之外，提及AI次数最多的公司，基本上分布在消费、金融和医疗保健行业。

机器人安装量

2012年到2017年，中国机器人年安装量增长了500%，其他地区，比如韩国和欧洲，分别增长了105%和122%。

在安装量较小的地区中，中国台湾比较突出，在2012-2017年增长最快。

开源框架GitHub标星数

各框架的标星数反映着他们在开发者群体中的流行程度。不过，因为开发者们日常不会“取关”GitHub项目，所以这些星星都是多年来积攒下的。

我们可以明显发现，TensorFlow的受欢迎程度在开发者中遥遥领先、稳步增长。

排除了第一热门，第二名和第三名分别是scikit-learn和BVLC/caffe。

TensorFlow官方力推的keras排到了第四，但近一年来几无增长势头。

另外两大热门PyTorch和MXNet分别排到了第七和第六，尤其是PyTorch，作为一个年轻的框架，自2017年初发布以来至今，GitHub标星数至少增长了4倍。获取新用户的势头很猛，不知道其中有多少被TensorFlow逼疯的人类。

各类任务最新成绩

这个部分分为CV和NLP两块，分别列举了各主流任务从发展之初到现在的成绩进步情况。

ImageNet图像识别准确率

2017年是ImageNet比赛的最后一届，2018年这项比赛就不再进行了。不过，验证集依然有人在用。

图中，蓝色的线条为ImageNet挑战赛历年的成绩变化，由于每年比赛所用的数据不同，旁边多了一条黄色线条，是以ImageNet 2012验证集为评价标准绘制的。

可以看出，到2015年，机器在图像分类任务上的能力已经明显超越了人眼，而即使比赛不再继续，学术研究者依然在认真推进该任务的表现。

这也侧面说明，如果一项工作有了明确的评价标准和固定的挑战内容，研究者们围绕此竞争，更容易让技术在该领域取得突破。

ImageNet训练速度

这张图是训练ImageNet图像分类神经网络所需时间的历年变化(当然，是买得起足够计算资源的人和机构所用的时长)。

从2017年6月的1小时，到2018年11月的4分钟，ImageNet图像分类神经网络的训练速度提升了16倍，除了硬件方面的贡献，算法上的提升也不容小觑。

图像分割COCO

ImageNet挑战赛“退休”之后，CV领域的朋友们就把重点放在了微软的COCO，挑战语义分割和实例分割。

四年来，COCO数据集上图像分割挑战的精确度已经提升了0.2，2018年的成绩比2015提升了72%。不过，目前还没有超过0.5，这一项还有充足的进步空间。

另外值得一提的是，COCO比赛近年来占据冠军位置的多是来自中国的公司，包括旷视、商汤等计算机视觉独角兽日常包揽数个项目的冠军。

语法分析(Parsing)

在确定句子结构这种语法分析的任务上，2003年到2018年的15年间，AI的表现(F1 Score得分)提升了将近10%。

机器翻译

在机器翻译任务上，报告拿英语-德语互相翻译举例，评估了AI模型在经典机器翻译评估算法BLEU标准中的表现。

报告显示，2018年英语转德语的BLEU评分是2008年的3.5倍，德语转英语成绩是2008年的2.5倍。

机器问答：AI2 Reasoning Challenge(ARC)

在问答领域，AI表现进步更明显，可以按月计数了。

报告统计了2018年从四月到11月间，AI在ARC推理挑战赛上成绩的变化：简单组得分从63%提升到69%，挑战组得分从27%提升到42%。

这些，都仅是半年间的进步。

机器问答：GLUE

同样用于机器问答的GLUE基准(General Language Understanding Evaluation)推出至今只有7个月的时间，但目前的表现已经比半年前提升了90%。

GLUE的推出者、纽约大学助理教授Sam Bowman说，虽然围绕GLUE的大型社区还没有出现，不过已经有了像谷歌BERT这样的代表性技术用了GLUE基准，面世一个月内已经被引用8次。在EMNLP会议中，GLUE时常被讨论，可能会成为语言理解领域中的一个基准线。

政府提及

整体来说，自2016年以来，美国、加拿大、英国政府在国会/议会会议中提及人工智能和机器学习的次数激增。

2016年之前，机器学习很少被提及，与人工智能相比，机器学习在总提及量中只占很小的一部分。

报告下载

目前，这份2018年度报告已经开放下载了，可以登录官网获取：

http://aiindex.org/

在量子位公众号(QbitAI)对话界面回复“94页报告”，也可直接下载PDF版报告一份~