从自动驾驶到机器翻译,从识别欺诈交易到语音识别,从卫星图像识别到帮助视频流服务预测我们想看哪部电影······
机器学习(ML)正在推动人工智能(AI)应用爆炸式增长,帮助软件理解不确定和不可预测的现实世界。
毫无疑问,得益于数据量的增加、算力的丰富、算法的进步,机器学习被认为是目前最成功的人工智能技术,并彻底改变了行业竞争态势和我们的日常生活。
机器学习使计算机能够处理迄今为止仅由人执行的任务。Gartner的相关调查显示,2020年平均每个企业部署ML项目为10个,而到2021年将达到20个。机器学习在全球将产生高达2.6万亿美元的价值。
那么在企业服务领域,当前的机器学习繁荣靠的是什么?未来又将在哪些方面发挥更多的作用?
1 机器学习应用时刻环绕着我们
每个Google搜索都使用了多种机器学习系统,通过您的查询语言作为模型输入项,以便给您输出个性化的结果。因此,搜寻“ bass”的钓鱼爱好者,不会被有关吉他的结果所淹没。
同样,Gmail的垃圾邮件和网络钓鱼识别系统也使用经过大量数据训练的机器学习模型,以使您的收件箱中没有恶意邮件。
虚拟助手是机器学习功能最明显的体现之一,如Apple的Siri、亚马逊的Alexa、Google Assistant和Microsoft Cortana,每一个都严重依赖机器学习,支持其语音识别和理解自然语言的能力。
除了这些明显表现之外,机器学习几乎在每个行业中都找到了一些用途。
如无人驾驶汽车、无人机和送货机器人的计算机视觉,聊天机器人和服务机器人的语言识别与合成;安全系统或者无人商超的人脸识别;为商务会议提供合理准确的转录和语音翻译,帮助放射科医生从X射线中找出肿瘤,帮助研究人员发现与疾病有关的基因序列,并确定在药物中更有效的药物分子;通过分析物联网 传感器数据,对基础设施进行预测性维护等等。
那么,什么是机器学习?
机器学习是教计算机系统如何在馈入数据时进行准确预测的过程。这些预测可能会回答“照片中的水果是香蕉还是苹果”,会发现无人驾驶汽车前过马路的人,判断是电子邮件是垃圾邮件,抖音上语音合成自动生成字幕,等等。
机器学习是基于已有数据、知识或经验自动识别有意义的模式。最基本的机器学习使用算法解析和学习数据,然后在相似的环境里做出决定或预测。
机器学习模型已被教导如何通过对大量数据进行训练,并可靠地区分水果。在这种情况下,可能有大量标记为包含香蕉或苹果的图像数据,用来对模型进行训练。
在机器学习过程中,并没有人为指示机器学习系统如何对未知环境做出决策或预测,这一过程由机器学习中的算法从数据中学习得到的,做出决策的主体是机器学习算法,并且决策或预测是非确定性的结果,一般以概率的形式输出,比如80%的可能性是晴天。
机器学习与传统计算机软件的主要区别在于,人类的开发人员尚未编写代码来指示系统如何分辨香蕉和苹果之间的区别。
与之不同的是,常规的应用程序需要软件工程师一句句地编写代码(特定的指令集),指示程序或软件做出确定的行为,比如输出0和1分别表示注册成功和失败。做出决策的主体实际是人,程序只是执行动作的工具。正因如此,机器学习可归为间接编程,与之对应的是常规编程。
人工智能和机器学习之间有什么区别?
机器学习最近获得了巨大的成功,但它只是实现人工智能的一种方法。
在20世纪50年代诞生之初,AI被定义为能够执行通常需要人类智能的任务的任何机器。
人工智能系统通常会表现出这些特征:计划、学习、推理、问题解决、知识表示、感知、运动和操纵,以及在较小程度上具有社会智能和创造力。
除了机器学习之外,还有多种其他方法可用于构建AI系统,包括进化计算和专家系统。在进化计算中,算法经过随机变异和代际组合,以试图“进化”成最佳解决方案;在专家系统中,计算机模仿了特定领域中人类专家的行为,如自动驾驶系统模仿人驾驶飞机飞行。
现在我们可以看见,机器学习系统在我们周围被广泛使用,今天已成为现代互联网的基石。
更令人震惊的是,2020年,OpenAI的GPT-3以其像人一样的写作能力而成为头条新闻,几乎涵盖了能想到的任何主题。
GPT-3是一个经过培训的神经网络,可对开放式网络上提供的数十亿篇英语文章进行学习,并且可以根据文本提示生成文章。
在企业服务领域,AI实现的热门领域随处可见,如:
用于生产设备的故障预测,制定维护周期/计划,实现7x24全天候运行的目标;
用于银行和保险业贷款和保单自动化承保和决策的人工智能,以及提供反欺诈的早期发现和预测;
AI协助医学诊断,特别是图形、图像的模式识别;
用于安全漏洞和入侵检测的预防,以及数据中心硬件、软件和环境维护;
消费者消费行为、模式预测,市场营销和销售策略的决策等。
2 机器学习为什么那么成功?
机器学习已成为应用最广泛的AI技术。Gartner的调查显示,约有37%的组织在其业务中使用某种类型的机器学习技术,并且预计到2022年,80%的现代技术将基于机器学习和人工智能技术。
德勤发布的《全球人工智能发展白皮书》指出,在人工智能众多的分支领域中,机器学习是人工智能的核心研究领域之一。包括89%的人工智能专利申请和40%人工智能范围内的相关专利均属于机器学习范畴。
尽管机器学习不是一种新技术,但近年企业服务来对该领域的兴趣激增。为什么机器学习如此成功?
使这些成功成为可能的因素主要有两个:一是拥有了可用于训练机器学习系统的大量图像、语音、视频和文本等数据。
更为重要的是,由于现代图形处理单元(GPU)的出现,可以聚集在一起以形成机器学习引擎,具备了大量并行处理能力。
如今,具有互联网连接的任何人都可以通过亚马逊、谷歌和微软,以及阿里云、腾讯云等公司提供的云服务,使用计算集群来训练机器学习模型。
随着机器学习使用的日渐普及,很多半导体或者云服务公司正在创建针对运行和训练机器学习模型而量身定制的专用硬件。
Google的Tensor处理单元(TPU)不仅用于训练Google DeepMind和Google Brain的模型,还用于支持Google翻译和Google Photo中的图像识别的模型,以及允许公众使用Google的TensorFlow Research Cloud构建机器学习模型的服务。
谷歌表示,到2020年,其第四代TPU比MLPerf中的上一代TPU快2.7倍,该基准用于衡量系统使用训练有素的ML模型进行推理的速度。
2019年,阿里巴巴发布了其首款为人工智能(AI)流程提供动力的芯片,名为汉光800。当年,华为也宣布其人工智能芯片"Ascend 910"面向数据中心,可与高通(Qualcomm)和Nvidia(Nvidia)等美国科技公司对抗。
腾讯与中信、中金资本和Primavera等多家投资者向上海的Enflame科技公司投资了18亿元。Enflame技术制造芯片,用于处理大量数据以训练人工智能系统。
随着硬件的日益专业化和机器学习软件框架的不断完善,机器学习任务越来越多地在智能手机和计算机上执行,而不是在云数据中心中执行。
那么在企业服务中,机器学习应用出现的几大发展趋向值得关注。
由IT管理ML项目的比例降低。TechRepublic Premium调查结果显示,由IT和终端业务共同管理AI / ML项目的受访者为23%,由IT管理项目的受访者为19%,由数据科学部门管理的AI / ML项目的受访者为11%。这与2019年33%的AI / ML项目由IT管理相比有所降低。
为确保AL / ML项目成功所采取的策略中,最高的三项是与管理层合作,以更好地确定AI / ML的业务用例(52%),准备/培训IT员工(48%)以及对数据准备,计算和自动化流程进行投资(46 %)。
对AI / ML项目实施的担忧也有所改变。2020年,最大的顾虑是没有收到能够证明投资合理性的业务结果(48%),员工准备/难以找到AI / ML人才(38%)以及实施时间太长(37%)。
ML更多的应用于业务。根据调查的受访者,47%的人将AI / ML应用于业务运营,30%的人将其应用于市场营销/销售,27%的人将技术应用于工程和IT。
3 机器学习已成为云服务新的增长点
事实上,机器学习的快速崛起很大程度上得益于云计算的普及,云计算所展现出的计算能力,能够满足日益普及的机器学习工作负载对计算的需求。
目前已经有超过10万客户在使用AWS的机器学习服务,很多客户已经将机器学习用于其核心业务。
从2016年起,AWS开始在云上提供机器学习服务。经过近几年的持续创新,AWS在机器学习领域已经构建起一个“全家福”工具集,真正做到了让客户可以“开箱即用”。
工具集的底层,AWS提供强大的算力、全面的算力选择和丰富的机器学习框架选择。
工具集的中间层,AWS的Amazon SageMaker可以提供首个全托管的机器学习集成开发环境,最大限度地提高用户开展机器学习的效率,降低开展机器学习的门槛。
工具集的顶层,AWS提供预先训练好的模型,涵盖视觉、语音、对话、文字、业务工具、客服中心、搜索、代码+运维、工业AI等。
腾讯云提供的智能钛机器学习(TI Machine Learning)是一站式机器学习生态服务平台,能够对各种数据源、组件、算法、模型和评估模块进行组合,使得算法工程师和数据科学家在其之上能够方便地进行模型训练、评估和预测。智能钛系列产品支持公有云访问、私有化部署以及专属云部署。
其中智能钛机器学习平台TI-ONE是为AI工程师打造的一站式机器学习服务平台,为用户提供从数据预处理、模型构建、模型训练、模型评估到模型服务的全流程开发支持。智能钛机器学习平台内置丰富的算法组件,支持多种算法框架,满足多种AI应用场景的需求。自动化建模(AutoML)的支持与拖拽式任务流设计让 AI 初学者也能轻松上手。
智能钛弹性模型服务TI-EMS是具备虚拟化异构算力和弹性扩缩容能力的在线推理平台,能够帮助客户解决模型部署复杂、资源浪费、手工扩展资源效率低下的问题。
智能钛工业 AI 平台TI-Insight是基于智能钛基础功能打造的一站式工业AI平台方案,包含 AI训练系统和AI推理系统两个功能组件。
IDC发布的《中国 AI 云服务市场(2020 上半年)跟踪》报告显示,华为云一站式AI开发平台ModelArts位居机器学习公有云服务中国市场份额第一位,高达29%。
华为云一站式AI开发平台ModelArts在行业用户中的主动提及率非常高。
4 机器学习已成为企业数字化转型的重要方向
根据IDC的数据,当前40%的企业数字化转型项目都会运用人工智能技术,目前来看最主要是机器学习技术。
在这个时代,人工智能与各行业融合成为一大发展趋势,可以说人工智能迎来技术落地的最好时期。可以说,善于利用人工智能技术应用的企业将会迎来新一轮发展红利。
越来越多的行业用户会基于业务需求,利用组织内部的人才、数据等资源,把人工智能嵌入到业务流程或用户界面,给客户带来超个性化体验。
一方面,企业的数据量的增长速度比预测得要快。专家报告说,世界上90%的数据是在过去两年内产生的。由社交媒体和流媒体内容、智能家居和可穿戴设备、数码照片和视频、商业信息和网上购物等应用批量生产数据,将产生比过去30年更多的数据。
IDC数据显示,从2010年至2020年,全球产生的数据量增长率接近5000%,过去所谓的"大数据"正在被重新定义。
另一方面,拥有所有这些数据并不意味着用户会自动获得知识。捕获正确的数据,使用复杂的分析平台,并利用数据创造价值,这就是机器学习发展的基础。
IDC表示,超大规模计算、5G通信、工业物联网(IIoT)、人工智能/机器学习(AI/ML)等颠覆性技术,为更好的激活数据价值提供工具。
云计算扫清了广大企业应用人工智能和机器学习的障碍,以此推动企业数字化转型。
目前,最有能力接受数字化转型的行业是那些以数字为先的行业,如互联网公司、电信公司等。
那些以数据驱动决策为核心的传统公司,如制药公司、金融公司、航空公司、制造企业等正利用机器学习等AI技术实现数字化转型,打造更具竞争力的新优势。
看来,在数字化转型方面,AI技术不会缺席,并可能带动数字化升级。