每年,斯坦福大学以人为中心的人工智能研究所(HAI) 都会发布其 AI 指数,这是一份试图总结人工智能现状的大量数据和图表汇编。本周出炉的2022 AI 指数一如既往地令人印象深刻,共有 190 页,涵盖研发、技术绩效、伦理、政策、教育和经济。我阅读了报告的每一页,并挑选了 最具代表性的12 个图表。
值得注意的是,我从去年的 2021 年指数中报告的许多趋势仍然存在。例如,我们仍然生活在一个AI 的黄金时代,出版物不断增加,AI 就业市场仍然是全球性的,企业对 AI 风险的认识与减轻上述风险的尝试之间仍然存在令人不安的差距。我们不在这里重复这些要点。
下面,我们来开始今年的总结报道:
1. 投资脱钩
涌入人工智能的资金数额依然令人难以置信。最值得注意的部份来自全球私人投资,这个数字从 2020 年的 460 亿美元飙升至 2021 年的 935 亿美元。增长来自于大型融资轮次的增加;2020 年有四轮融资超过 5 亿美元,2021 年有 15 轮。报告还指出,所有这些资金都流向了更少的公司,因为自 2018 年以来新融资的初创公司数量一直在下降。这是一个伟大的时刻加入一家人工智能初创公司,但也许不是自己找到一家。
2. 美中关系复杂
这些天来,关于中美之间的人工智能竞赛 的讨论颇多。“当你看到所有关于地缘政治紧张局势的新闻时,你会认为这两个国家之间的合作数量会减少,”斯坦福大学 HAI 的政策研究员兼今年 AI Index 的主编Daniel Zhang说。相反,他告诉IEEE Spectrum,“过去 10 年,中美合作一直呈上升趋势。” 在出版物的跨国合作方面,中国和美国的产出是中国和英国合作的两倍多。
3. 申请专利和获得专利是两件不同的事情
中国专利申请量居世界第一;该报告指出,中国在 2021 年占全球专利申请量的 52%。但美国在授予的专利数量上占主导地位,占全球总数的 40%。张指出,授予专利“证明您的专利实际上是可信和有用的”,并表示这种情况有点类似于出版物和引用的情况。虽然中国在出版物数量、出版物引用和会议出版物方面领先,但美国在会议出版物的引用方面仍然领先,这表明美国研究人员的著名论文仍然具有巨大的影响力。
4. 计算机视觉的高原(Plateau)?
计算机视觉领域发展如此迅速,很难跟上最新的消息。AI 指数显示,计算机视觉系统非常擅长涉及静态图像的任务,例如对象分类和面部识别,并且它们在视频任务(例如活动分类)方面也越来越出色。
但是一个相对较新的基准显示了计算机视觉系统可以做的事情的局限性:它们擅长识别事物,而不擅长推理它们所看到的。视觉常识推理挑战赛于 2018年推出,要求 AI 系统回答有关图像的问题并解释其推理。例如,一张图片显示人们坐在餐桌旁,而服务员端着盘子走近;测试询问为什么其中一个坐着的人指向桌子对面的人。该报告指出,近年来性能改进变得越来越微不足道,“这表明可能需要发明新技术来显着提高性能。”
5.人工智能还没有为法学院做好准备
自然语言处理 (NLP) 领域比计算机视觉晚了几年才开始蓬勃发展,但它与计算机视觉的位置有点相似(图 4)。文本摘要和基本阅读理解等任务的基准显示出令人印象深刻的结果,人工智能系统通常超过人类的表现。但是当 NLP 系统必须对他们所读到的内容进行推理时,他们就会遇到麻烦。
此图表显示了由 LSAT 考试中用作法学院入学考试的逻辑推理问题组成的基准测试的表现。虽然 NLP 系统在该基准的一组较简单的问题上表现良好,但在一组较难的问题上表现最佳的模型的准确率仅为 69%。研究人员从要求 NLP 系统从不完整信息中得出结论的基准测试中得到了类似的结果。推理仍然是人工智能的前沿。
6. 道德无处不在
报告中有一个好消息:从参加ACM 公平、问责和透明度会议(FAccT) 等会议以及NeurIPS的道德相关研讨会来判断,现在人们对 AI 道德有极大的兴趣。对于那些还没有听说过 FAccT 的人,报告指出,它是最早关注算法社会技术分析的主要会议之一。这张图表显示了 FAccT 的行业参与度不断提高,张认为这是进一步的好消息。“这个领域一直由学术研究人员主导,”他说,“但现在我们看到更多的私营部门参与其中。” 张说,很难猜测这种参与对行业内如何设计和部署人工智能系统意味着什么,但这是一个积极的信号。
7.Detox:如果你不这样做该死,如果你这样做该死
AI 的一大伦理问题涉及大型语言模型,例如 OpenAI 的GPT-3,它有一个非常糟糕的习惯,即生成文本,其中充满了从其训练数据(互联网)中学到的每一种偏见和偏见。多个研究小组(包括 OpenAI 本身) 正在研究这个toxic-language 问题,用新的基准来衡量偏见和detoxification计划。但上图显示了通过三种不同的detox方法运行语言模型 GPT-2 的结果。所有这三种方法都损害了模型在一个称为 perplexity 的指标上的性能(分数越低越好),对涉及非裔美国人对齐的英语和提及少数群体的文本的性能影响最差。正如专家所说,需要更多的研究。
8. 大学正在与 CS 学生一起爬行
人工智能管道从未如此充实。计算研究协会的年度调查收集了来自北美 200 多所大学的数据,其最新数据显示,2020 年有超过 31,000 名本科生完成了计算机科学学位。这比 2019 年的数字增加了 11.6%。
9. 人工智能需要女性
同一项调查着眼于人工智能领域的新博士,结果令人沮丧。在过去十年中,女性新的 AI 和 CS 博士的百分比仅增加了几个百分点,至少在北美是这样。这一点实际上是去年对 2021 年报告的报道的重复,但每个人都应该继续谈论它,直到事情发生变化。
10. 人工智能需要所有种族背景的人
同上这一点。AI Index 在不同的图表上显示 AI 和 CS 博士的数据,但它们讲述的是同一个故事。早在人们获得博士学位之前,人工智能领域就需要在多样性方面做得更好。
11. 立法者正在关注
2021 年,与人工智能相关的法案比以往任何时候都多。在 AI Index 一直关注的 25 个国家中,西班牙、英国和美国处于领先地位,去年分别通过了三项法案。报告还指出,在美国,通过的这三项法案是提出的高达 130 项法案之一。从报告中不清楚这些法案中的大多数是通过公共资金促进人工智能还是制定法规来管理人工智能可能带来的风险。张说这是一个混合体,并表示 HAI 将在来年发布对全球立法的更详细分析。
12. 气候变化
人工智能指数跟踪美国 55 个公共政策团体发表与人工智能相关的论文,这张图表显示了这些团体去年关注的主题。我用这张图表作为借口来提出人工智能越来越大的能源足迹(训练大型模型需要大量计算)以及它对气候变化的潜在影响的话题。政策小组似乎并不认为这些是 2021 年的重要话题。我还问张,AI Index 是否会在明年的报告中讨论这些问题,他说他的团队正在与各个组织讨论如何衡量和收集有关计算效率和气候影响的数据。所以请继续关注。
https://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf