一、Gartner:AI领域2018-2020年成熟度曲线介绍
近日,全球权威的技术研究和分析公司Gartner发布了2020人工智能技术成熟度曲线报告(Hype Cycle for Artificial Intelligence, 2020)。
人工智能领域到底是越来越强大了?还是依旧比较“智障”呢?
如果对比一下Gartner近三年的报告,就是一个比较有意思的事情了,有些技术逐渐落伍被淘汰了,有些技术依旧止步不前,也有些技术进步的速度非常之快。
东方林语先把2018-2020年的成熟度曲线列出来,考考大家的眼力。
1、2020年的人工智能技术成熟度曲线报告(Hype Cycle for Artificial Intelligence, 2020),如下图:
2、2019年人工智能技术成熟度曲线报告(Hype Cycle for Artificial Intelligence, 2019),如下图:
3、2018年的人工智能技术成熟度曲线报告(Hype Cycle for Artificial Intelligence, 2018),如下图:
二、近年人工智能领域的亮点技术介绍
强化学习、生成对抗网络(GANs),迁移学习,图学习、自监督学习、联邦学习……
近几年,人工智能领域,各种新技术层出不穷,让人目不暇接,疲于应对……
以深度学习领域为例,我们可以梳理一下这几年的重大突破:
2012年:应用AlexNet和Dropout 方法处理ImageNet;
2013年:使用深度强化学习玩转 Atari 游戏;
2014年:采用“注意力”的编码器-解码器网络及Adam优化器;
2014/2015年:生成对抗网络(GAN);
2015年:残差网络(ResNet);
2017年:Transformer模型;
2018年:BERT和微调NLP模型;
2019/2020年及之后:BIG语言模型,GPT-3语言模型、自监督学习……
2020年下半年,就有一项“出道即巅峰”的人工智能领域革命性突破技术——GPT-3语言模型。
这又是什么“黑科技”?
简单解释来说,这是OpenAI 高调推出了的一款具有 1750 亿参数的自回归语言模型。
GPT-3在人工智能领域掀起了又一阵革命。
从参数量上看,它比当时全球最大的深度学习模型 Turing NLP 大上十倍。
从功能上看,它可以答题、翻译、写文章,还带有一些数学计算的能力。
AI大佬们谈到GPT-3,是这么评价的:生命、宇宙和万物的答案,就只是 4.398 万亿个参数而已。——多么潇洒的回答呀。
看看下面这张图,借助GPT模型,最左侧是输入的半张图片,中间的四列是自动补全的图片,最右侧是原始图片。
最令人震惊的是,GPT3的不用接受特定训练,就能够完成这些任务。
结论是:用过的都说好。
科技进步,永无止境。
三、典型介绍之知识图谱技术
对比2018-2020年的人工智能技术成熟度曲线报告,本文重点介绍一下知识图谱技术,这项技术也是进步最快、场景价值得到广泛验证的技术之一。
基于该报告,我们可以先围绕该技术做一下分析。
知识图谱技术之所以被认可,因为其展现了更好地揭示其他非结构化数据中的高阶相关性的能力。
知识图谱分为通用知识图谱与行业知识图谱。
知识图谱的底层,使用了自然语言处理(NLP)和相关的文本分析技术,知识图谱非常适合存储从非结构化资源分析中提取的数据。它们还能够存储结构化数据,包括隐式提供结构和内容的元数据,编码支持各种用例的处理的信息。
按照Gartner的建议,IT领导者应将知识图谱作为数据库,存储有关实体及其关系的数据,当数据有许多不同的来源和形式时,尤其如此。例如,内容服务平台中的文档、数据源中的更新、视频中的音频或数据库中的表格。
负责数据和分析的IT领导者必须将知识图谱纳入其数据和分析治理和管理的范围,为防止数据孤岛的延续,应研究并建立多种知识图谱的互操作方式。
Gartner指出,知识图谱目前已应用于如下领域:
1.数字化工作场所;例如,协作、共享和洞察力;
2.自动化;例如,从内容到RPA的数据抽取;
3.支持机器学习;例如,增强训练数据;
4.数据分析;例如,增强分析,特别是在商业智能背景下的增强分析报告和网络安全;
5.数字商务;例如,产品信息管理和建议;
6.数据管理;例如,元数据管理、数据目录和数据结构。
通用知识图谱,是以百科类知识为主,强调知识的广度,数据来源一般较为单一,比如我们常用的搜索引擎,就是通用知识图谱。
行业知识图谱是面向专业领域的专有应用,基于每个行业的知识来进行构建(比如金融、电力、公安等)知识库,以知识的深度为特性,数据来源则更为丰富。因此,行业知识图谱,对于各垂直领域的细分场景,更能凸显价值。
以金融知识图谱来说,它就是一种用图模型来描述知识和建模实体之间关联关系的技术方法,旨在从金融机构内、金融机构外数据中识别、发现和推断企业、企业自然人、行业、事件、产品等实体与金融机构业务之间的复杂关系,是实体关系的可计算模型。
一方面利用图相关计算和挖掘技术,加强风险管控、稽核审计 ,构建企业、客户及员工的对公、个人图谱,全面记录关系特征,搭建贷前、贷中、贷后等应用场景,名单池分层分类管理,动态风险预警监测,实现基于知识图谱技术的智能风险管控。
另一方面,通过资金转账等关联关系,实现以客找客,加强智能营销线索推荐。有效提高复杂业务关系管理能力,利用大数据知识图谱技术,快速发现营销商机与潜在风险。
下图为Gartner列出的企业AI成熟度模型,可以作为参考,看看你们企业的AI成熟度处在哪个阶段呢?
在行业知识图谱方面,金融行业目前是应用知识图谱最多的行业。
根据爱分析的报告,也列出了金融领域的知识图谱主要厂商及玩家名单,具体如下: