亚马逊网络服务宣布13项新的机器学习服务和功能-51CTO.COM

【51CTO.com快译】亚马逊旗下的亚马逊网络服务公司(AWS)近日在AWS re：Invent大会上宣布了13项新的机器学习功能和服务，涵盖机器学习堆栈的所有层面，旨在帮助将机器学习交到更多开发人员的手里。AWS推出了新的Amazon SageMaker功能，因而开发人员更容易构建、训练和部署机器学习模型，包括低成本的自动数据标记和强化学习(RL)。AWS发布了新的服务、框架改进和定制芯片，以加快机器学习训练和推理，同时降低成本。AWS宣布了新的人工智能(AI)服务，这些服务可从几乎任何文档提取文本、阅读医疗信息，并使用亚马逊所用的同样技术提供定制的个性化、推荐和预测。最后但同样重要的是，AWS将帮助开发人员借助AWS DeepRacer上手机器学习，这种只有真实汽车1/18大小的新型自动模型赛车面向开发人员，由强化学习驾驶。

这些公告延续了AWS致力机器学习创新的步伐，AWS在过去的一年推出了200多项重要的机器学习功能。使用这些新服务和功能的客户包括Adobe、宝马、国泰航空、道琼斯、Expedia、Formula 1、GE Healthcare、HERE、Intuit、强生、起亚汽车、Lionbridge、美国职业棒球大联盟、美国宇航局喷气推进实验室(JPL)、Politico.eu、瑞安航空、壳牌、Tinder、联合国、Vonage、世界银行和Zillow。想了解AWS新的机器学习服务的更多信息，请访问：https://aws.amazon.com/machine-learning。

亚马逊机器学习副总裁斯瓦米•西瓦苏布拉马尼娜(Swami Sivasubramanian)说：“我们希望帮助所有客户拥抱机器学习，无论他们的规模、预算、经验或技能水平如何。今天宣布的公告消除了成功采用机器学习面临的重大障碍，因为它降低了机器学习训练和推理的成本，推出的新SageMaker功能使开发人员更容易在云端和边缘构建、训练和部署机器学习模型，基于我们亚马逊的多年经验，提供新的AI服务。”

新的基础设施、定制的机器学习芯片和框架改进，以加快训练和低成本推理

大多数机器学习模型由可从大量数据中找出模式的算法来进行训练。然后，该模型可以通过名为“推理”的方法对新数据进行预测。开发人员使用机器学习框架来定义这些算法、训练模型和推断预测。TensorFlow、Apache MXNet和PyTorch等框架让开发人员可以设计和训练复杂的模型，常常使用多个GPU来缩短训练时间。大多数开发人员在日常工作中使用多个这样的框架。今天，AWS宣布为使用所有这些流行框架构建模型的开发人员作出大幅改进，针对训练和推理不仅提升性能，还降低成本。

新的亚马逊弹性计算云(EC2)GPU实例(下周发布)：新的P3dn.24xl实例搭载8个英伟达V100 GPU、32GB GPU内存、快速NVMe存储、96个英特尔至强可扩展处理器vCPU和100Gbps网络接口，它是云端功能最强大的机器学习训练处理器，让开发人员可在更短的时间内训练更多的数据。
针对AWS优化的TensorFlow框架(正式版)：选择使用TensorFlow的开发人员用大量数据进行训练时发现，跨众多GPU扩展TensorFlow颇具挑战性，这常常导致这些GPU利用率低，对于庞大的训练任务而言训练时间较长。AWS解决了这个问题，并在如何跨GPU扩展TensorFlow方面实现了创新。通过改进TensorFlow跨这些GPU分配训练任务的方式，新的针对AWS优化的TensorFlow在训练多种类型的神经网络时更接近线性可扩展性(跨256个GPU的效率为90%，之前通常只有65%)。使用新的针对AWS优化的TensorFlow和P3dn实例，开发人员现在可以在仅14分钟内训练流行的ResNet-50模型，这是测得的最短时间，比之前的最短时间快50%。而且，这些优化通常不仅仅适用于计算机视觉模型，还适用于一系列更广泛的深度学习模型。
Amazon Elastic Inference(正式版)：虽然训练备受关注，但推理实际上在生产环境中运行机器学习的成本和复杂性方面占大头(训练上每花费1美元，推理上就要花9美元)。与使用专用GPU实例的成本相比，Amazon Elastic Inference让开发人员可以显著降低推理成本，最多可以省下75%。开发人员可以在较小的通用Amazon EC2实例上运行，通过Amazon Elastic Inference配置数量正好的GPU性能，而不是在利用率较低的整个Amazon EC2 P2或P3实例上运行。从1 TFLOP开始，开发人员可以灵活地增加或减少推理性能，只需为实际使用的资源付费。Elastic Inference支持所有流行的框架，并与Amazon SageMaker和Amazon EC2深度学习亚马逊机器映像(AMI)集成。开发人员无需对现有模型进行任何更改，就可以开始使用Amazon Elastic Inference。
AWS Inferentia(2019年发布)：针对消耗整个GPU或需要较低延迟的更庞大工作负载，AWS宣布推出由AWS定制的高性能机器学习推理芯片。AWS Inferentia提供每个芯片数百teraflops(每秒万亿次浮点运算)以及每个Amazon EC2实例数千teraflops的性能，支持多个框架(包括TensorFlow、Apache MXNet和PyTorch)，支持多种数据类型(包括INT-8、混合精度FP-16和bfloat16)。

Autodesk是3D设计、工程和娱乐软件行业的领导者，这类软件使用深度学习模型支持众多使用场合，从探究成千上万潜在的设计方案、语义搜索设计到简化工程构建流程以优化渲染工作流程，不一而足。Autodesk研究部门的AI工程主管彼得•琼斯(Peter Jones)说：“运行高效的推理是如今机器学习界的最大挑战之一。Amazon Elastic Inference是我们发现的同类中首项功能，可以帮助我们消除如今闲置的GPU容量带来的额外成本。我们估计，与运行GPU相比，它可以为我们省下75%的成本。”

EagleView是一家财产数据分析公司，通过缩短评估损害所需的时间，使房主能够大大加快下一步的决定，从而帮助降低自然灾害造成的财产损失。EagleView使用航拍、无人机和卫星图像，在AWS上运行深度学习模型，以便在自然灾害发生后24小时内更快速更准确地评估财产损失。EagleView的数据科学和机器学习主管谢伊•斯特朗(Shay Strong)解释：“要达到理算员在财产评估方面的准确性，我们需要处理海量数据，即覆盖受灾地区的整个多维空间(时间、光谱和空间)的超高分辨率图像。Amazon Elastic Inference打开了新的大门，让我们能够更经济高效地探究大规模的工作流程。”

新的Amazon SageMaker功能让用户更容易构建、训练和部署机器学习;开发人员可以试用AWS DeepRacer，这种只有真实汽车1/18大小的自动赛车由强化学习驾驶

Amazon SageMaker是一项完全托管的服务，消除了机器学习过程中每一步的繁重任务和猜测工作。Amazon SageMaker让开发人员更容易构建、训练、调整和部署机器学习模型。今天，AWS宣布了Amazon SageMaker的许多新功能。

Amazon SageMaker Ground Truth(正式版)：构建机器学习模型的过程需要开发人员准备好数据集以训练机器学习模型。在开发人员可以选择算法、构建模型并部署模型进行预测之前，标注人员手动审查数千个示例，并添加训练机器学习模型所需要的标记。这个过程费时又费钱。Amazon SageMaker Ground Truth让开发人员极容易通过Mechanical Turk、第三方供应商或自己的员工，利用标注人员来标记数据。Amazon SageMaker Ground Truth可以实时从这些标注中学习，可以自动为剩余的大部分数据集添加标记，减少了对人工审核的需求。Amazon SageMaker Ground Truth可创建高度准确的训练数据集，与人工标注相比节省时间、降低复杂性，并最多将成本缩减70%。
AWS Marketplace for Machine Learning(正式版)：机器学习在迅速发展，来自学术界和工业界的新模型和算法几乎每周都在出现。Amazon SageMaker内置了一些最流行的模型和算法，但为了确保开发人员可以继续访问最广泛的功能，新的AWS Marketplace for Machine Learning包含可直接部署到Amazon SageMaker的150多种算法和模型(与日俱增)。开发人员可以立即从SageMaker开始使用这些算法和模型。对于想通过AWS Marketplace销售的开发人员来说，向Marketplace添加目录信息完全自助式。
Amazon SageMaker RL(正式版)：在机器学习界，强化学习是热门话题，因为它是一项大有潜力且令人兴奋的技术。强化学习训练模型没有大量的训练数据;当所需结果的回报函数已知，但实现结果的路径未知，需要大量迭代才能发现时，它很有用。医疗保健治疗、优化制造供应链和克服游戏挑战是强化学习有助于解决的几个领域。然而，强化学习的学习　曲线陡峭，并牵涉诸多不定因素，因而无法被资金最充裕、技术最强大的企业之外的组织所享用。Amazon SageMaker RL是云计算行业的第一个托管强化学习服务，让任何开发人员可以通过托管强化学习算法，构建、训练和部署强化学习，支持多个框架(包括Intel Reinforcement Learning Coach和Ray RL)、多个模拟环境(包括SimuLink和MatLab)，并与AWS新的机器人服务AWS RoboMaker集成，后者提供了与SageMaker RL紧密集成的模拟平台。
AWS DeepRacer(正式版)：只需几行代码，开发人员就可以开始使用AWS DeepRacer学习强化学习，这是一款只有真实汽车1/18大小的全自动赛车。该车(配备全轮驱动、大脚车轮胎、高清摄像头和车载计算)使用用亚马逊SageMaker训练的强化学习模型来驾驶。开发人员可以试着运用技能，与其他开发人员比拼汽车和模型，以便在DeepRacer联赛杯争夺奖项和荣誉，这是世界上第一项向所有人开放的自动赛车联盟。
Amazon SageMaker Neo(正式版)：新的深度学习模型编译器让客户训练一次模型、即可在任何地方运行，性能可提高2倍。边缘处联网设备上运行的应用程序对机器学习模型的性能特别敏感。它们需要低延迟决策，常常部署在一大堆不同的硬件平台上。Amazon SageMaker Neo针对特定的硬件平台编译模型，自动优化性能，让它们以高达两倍的性能运行，而不降低准确性。因此，开发人员不再需要花时间为每一个硬件平台手动调整训练模型(节省了时间和费用)。SageMaker Neo支持英伟达、英特尔、赛灵思、Cadence和Arm的硬件平台，以及TensorFlow、Apache MXNet和PyTorch等流行模型。AWS还使Neo成为了一个开源项目。

泰森食品(Tyson Foods)是世界上最大的食品公司之一，也是公认的蛋白质领导品牌。泰森食品的新兴技术主管查德•瓦尔奎斯特(Chad Wahlquist)说：“我们正在为鸡肉加工厂建立一套计算机视觉系统，我们需要高度准确的标记训练数据集来训练这些系统。我们首次尝试自行构建标记解决方案时，它需要大量的计算资源和众多开源解决方案，甚至创建数据标记的用户界面之前就需要。借助Amazon SageMaker Ground Truth，我们能够使用现成的模板，只需点击几下即可运行标记作业，快速又轻松。Amazon SageMaker Ground Truth还让我们能够安全地让自己的员工标记数据，这是我们公司的一个基本要求。我们期待在我们的公司中使用Amazon SageMaker Ground Truth。”

T-Mobile号称“美国的非运营商(Un-carrier)”，它是领先的无线服务、产品和服务创新提供商。T-Mobile的IT开发副总裁马修•戴维斯(Matthew Davis)说：“T-Mobile团队的AI将AI和机器学习整合到我们客户服务中心的系统中，让我们的专家团队能够通过自然语言理解模型更快速更准确地为客户提供服务，这些模型为他们实时提供了相关的上下文客户信息。标记数据是创建高性能模型的基础，但对我们的数据科学家和软件工程师来说也是一项单调乏味的任务。Amazon SageMaker Ground Truth使数据标记过程简单、高效、易于访问，从而让他们腾出时间专注于喜欢做的事情――开发为我们的客户和服务代表提供最佳体验的产品。”

福来鸡(Chick-fil-A, Inc.)是一家家族拥有的私有餐馆公司，以独创的鸡肉三明治闻名，在47个州和华盛顿特区的2300多家餐厅供应刚准备的食品。福来鸡的首席团队负责人杰伊•达夫(Jay Duff)说：“食品安全对我们公司来说至关重要。我们在计算机视觉和机器学习方面的早期努力表明有望改善运营。Amazon SageMaker和GroundTruth帮助我们加快了开发新模型和评估的进程，因为更容易标记和验证新的训练集，重新训练模型，然后迭代处理更复杂的数据。此外，劳动力管理功能使我们更快地完成手动任务，同时减少了管理工作。”

Arm技术是正在改变人们生活和企业运营方式的一场计算和连接革命的核心。Arm机器学习部门总经理兼副总裁杰姆•戴维斯(Jem Davies)说：“Arm预计到2035年联网设备多达上万亿件，到时有望从机器学习之类的创新获取额外的消费者价值。Amazon SageMaker Neo和Arm NN SDK这对组合将帮助开发人员优化机器学习模型，以便在众多联网边缘设备上高效运行。”

Cadence使电子系统和半导体公司能够开发出改变人们生活、工作和娱乐方式的创新终端产品。客户使用Cadence的软件、硬件和半导体知识产权(IP)，更快地向市场投放产品。Cadence设计系统IP部门的高级副总裁兼总经理巴布•曼达瓦(Babu Mandava)说：“Cadence Tensilica处理器针对设备端机器学习应用进行了优化，从自动驾驶汽车、语音处理到机器人技术，不一而足。Amazon SageMaker Neo简化了从云到边缘部署优化模型的工作。我们很高兴促进Amazon SageMaker Neo与我们的Tensilica处理器系列和开发环境无缝集成，帮助开发人员为基于Tensilica的边缘设备优化机器学习模型。”

GE Healthcare是一家提供医疗影像、监视、生物制造以及细胞和基因治疗技术的领先供应商，通过智能设备、数据分析、应用软件和服务，实现诊断、治疗和监视等方面的精准健康。GE Healthcare的爱迪生产品组合战略高级副总裁基思•比奇洛(Keith Bigelow)说：“GE Healthcare正帮助医疗服务机构提供更好的医疗结果，彻底改变医疗界。我们使用Amazon SageMaker训练计算机视觉模型，然后将模型部署到我们的MRI和X光设备中。通过运用强化学习技术，我们能够减小训练模型的大小，同时兼顾网络压缩和模型精确度。Amazon SageMaker RL消除了运行强化学习工作负载的复杂性，让我们能够在短短四周内从构思进入到实施。”

亚马逊机器人副总裁兼杰出工程师布拉德•波特(Brad Porter)说：“强化学习带来了机器学习和机器人领域的创新。我们很高兴Amazon SageMaker让用户更容易在实际的应用中试用强化学习技术，我们已经在尝试将其用于机器人应用。比如今年早些时候，我们展示了一种能够使用其中一些技术玩啤酒乒乓游戏的机器人，我们很高兴与AWS合作，继续探索这方面的机会。”

新的AI服务为所有应用程序赋予智能，无需机器学习方面的经验

许多开发人员希望能够在机器学习方面不需要任何经验的情况下为其应用程序添加智能功能。基于现有的计算机视觉、语音、语言和聊天机器人服务，AWS宣布了大大扩展的AI服务。

Amazon Textract(预览版)：今天许多公司通过手动输入数据从文档和表单中提取数据，这个过程缓慢又费钱，或者使用简单的光学字符识别(OCR)软件，这常常不准确，而且生成的输出通常需要繁重的后期处理，以便提取的内容采用开发人员的应用程序所能使用的格式。Amazon Textract使用机器学习立即读取几乎任何类型的文档，准确地提取文本和数据，无需任何手动审查或自定义代码。Amazon Textract让开发人员可迅速使文档工作流程实现自动化，并在几小时内处理数百万个文档页面。
Amazon Comprehend Medical(正式版)：构建下一代医疗应用需要能够解读和分析常常包含在自由形式的非结构化医疗文本中的信息，比如入院记录或患者病史。Comprehend Medical是一种面向医疗文本的高度准确的自然语言处理服务，它使用机器学习从患者记录、临床试验报告及其他电子健康记录中提取疾病、药物和治疗结果等信息。Comprehend Medical无需机器学习专业知识，无需编写复杂的规则，无需训练模型，它还在不断改进。你只需为使用的资源付费，没有最低费用或前期承诺。
Amazon Personalize(预览版)：基于驱动亚马逊的同样技术，Amazon Personalize是一种实时推荐和个性化服务。20多年前，亚马逊率先将机器学习用于推荐和个性化。经验表明，没有适用于个性化的万能算法。从视频、音乐、产品到新闻文章，每个使用场合都有各自的特点，需要结合独特的数据、算法和优化。Amazon Personalize以一种完全托管的服务为客户提供了这种体验，该服务将为几乎任何使用场合构建、训练和部署自定义且私有的个性化和推荐模型。Amazon Personalize可以通过电子邮件或推送通知，进行推荐、实现搜索结果个性化以及细分客户以实现直接的、个性化的营销。
Amazon Forecast(预览版)：就像个性化一样，预测历来是一门模糊艺术，客户基于历史数据，试图预测供应链、库存数量和产品需求方面的未来趋势。就像Amazon Personalize一样，Amazon Forecast基于亚马逊开发的用于众多关键预测的技术。由于常常有众多相互关联的因素(比如价格、事件甚至天气)，预测很难做好。预测不准确会带来重大影响，比如无法满足客户需求或严重超支。Amazon Forecast创建准确的时间序列预测。Amazon Forecast使用历史数据和相关的因果数据，可自动训练、调整和部署自定义且私有的机器学习预测模型，那样客户更确信在优化支出的同时有望提供合适的客户体验。

Cox Automotive是Cox企业的子公司，旗下涵盖Cox的所有全球汽车业务，包括Kelley Blue Book、Xtime、Autotrader.com和Manheim。Cox Automotive的首席技术官布赖恩•兰德曼(Bryan Landerman)说：“我们Cox Automotive着眼于改变全世界买卖和交易汽车的方式。为了进一步更新改造我们的汽车解决方案，我们将利用Amazon Textract加快汽车的交易速度。借助Amazon Textract，我们可以自动捕获和验证文档和表单中的数据，比如贷款申请或车辆所有权凭证，因而更快地做出决策。这将减少客户的工作，为从制造商到买家的所有人简化流程。”

Alfresco是一家提供流程自动化、内容管理和信息治理软件的领先企业开源提供商。Alfresco的首席技术官兼创始人约翰•牛顿(John Newton)说：“我们Alfresco希望为客户尽量简化文档处理和内容管理。由于文档管理系统的效果完全取决于输入内容，我们拥有能够自动准确地从数字化文档提取关键信息的基础工具至关重要。之前，我们在OCR技术的基础上开发了定制解决方案，以便提取感兴趣的数据，这需要大量的人工训练。这个过程消耗了宝贵的时间和资源，但这又是必须完成的工作。有了Amazon Textract，我们现在不仅可以自动提取文档和表格信息中的文本，还可以自动提取真实的宝贵信息，让我们能够实现数据输入自动化，并便于更快地做出业务决策。Amazon Textract使我们能够提供更好的数据完整性、安全合规性以及比以往更快地启动业务流程的能力。而最重要的是，这一切帮助我们更好地协助客户实现数字化转型。”

贝丝•伊斯雷尔女执事医疗中心(BIDMC)是哈佛医学院的一家患者护理、教学和研究附属机构，在美国国立卫生研究所资助的多家独立医院中一向名列全美前茅。BIDMC还是波士顿红袜队的官方医院。贝丝•伊斯雷尔女执事医疗中心的高级企业架构师Venkat Jegadeesan说：“我们BIDMC有490多张总是被占用的手术床。我们竭力快速成功地完成外科手术，以便患者得到及时治疗。但许多手术被取消和推迟了，就因为很难在电子健康记录(EHR)中找到手术前需要患者填写的病史和身体检查(H&P)表格。为了解决这个问题，我们开始使用Amazon Comprehend Medical，很容易使用关键医疗文本就能搜索到我们EHR系统中的数据。我们的团队现在能够借助针对临床人员的正确提示，迅速找到H&P表格。因此，我们可以节省大量宝贵的时间，有助于防止推迟或可能的取消，手术推迟或取消对患者及家属来说很不方便。”

在出过三位诺贝尔奖获得者的弗雷德•哈钦森癌症研究中心，世界知名的科学家组成的跨学科团队寻求新颖创新的方法来预防、诊断和治疗癌症、HIV/艾滋病及其他危及生命的疾病。弗雷德•哈钦森癌症研究中心的首席信息官马修•特鲁内尔(Matthew Trunnell)说：“治愈癌症本质上是个时间问题。对于癌症患者和致力于攻克癌症的研究人员来说，时间是稀缺资源。开发临床试验并将其与合适的患者联系起来的过程需要研究团队筛选和标记大量的非结构化病历数据。Amazon Comprehend Medical将把这个时间从几小时缩减到几秒。这是让研究人员在需要时可以迅速获取所需信息的重要一步，那样他们能找到实用的宝贵信息，为患者拿出救命的疗法。”

普华永道(PwC)旗下公司遍布158个国家，250000多名员工致力于提供高质量的保证、咨询和税务服务。普华永道的医疗保健AI主管马特•里奇(Matt Rich)说：“Amazon Comprehend Medical让我们能够以更少的开销获得更好的结果。通过与客户一起使用Comprehend Medical，我们可以更专注于构建更智能的应用程序，少关注标记、训练和重新训练模型。对于我们的客户来说，能够大规模准确地执行非常手动的任务让我们得以开发出更有影响力的解决方案。比如说，我们的一家制药客户在样本数量有限的环境下使用Comprehend Medical，帮助提取让他们得以识别医学相关事件的信息。初步调查表明，我们发现处理速度明显快于过去。”

达美乐披萨(Domino's Pizza Enterprises Ltd.)是澳大利亚最大的比萨连锁店，其愿景是成为每个社区食品互联网领域的领导者。达美乐披萨的战略和洞察力全球主管马利卡•克里什纳默西(Mallika Krishnamurthy)说：“客户是我们达美乐所做的一切工作的核心，我们在不懈地努力改善和提升他们对品牌的体验。结合使用Amazon Personalize与Amazon Pinpoint，我们能够面对整个客户群大规模实现个性化，这在以前是不可能实现的。Amazon Personalize使我们能够利用每个客户及其环境方面的信息，通过我们的数字化渠道提供定制的沟通方式，比如特别优惠和促销方案。”

Mercado Libre是拉美的一家领先的在线商务和支付平台。Mercado Libre的商业智能主管亚德里安•奎利斯(Adrian Quilis)说：“我们一直使用Amazon Forecast最先进的深度学习算法，预测市场对50000多种不同产品的需求，这些算法可以直接拿来使用。Amazon Forecast负责构建管道、重新训练时间表和重新生成预测的所有繁重工作，因此我们可以非常轻松地试验数百个模型。”

原文标题：Amazon Web Services Announces 13 New Machine Learning Services and Capabilities, Including a Custom Chip for Machine Learning Inference, and a 1/18 Scale Autonomous Race Car for Developers

链接：https://press.aboutamazon.com/news-releases/news-release-details/amazon-web-services-announces-13-new-machine-learning-services

【51CTO译稿，合作站点转载请注明原文译者和出处为51CTO.com】