【51CTO.com快译】
亚马逊网络服务(AWS)宣布了其基于云的机器学习平台SageMaker的九个主要新更新。
SageMaker旨在提供一种机器学习服务,该服务可用于构建,训练和部署几乎所有用例的ML模型。
在今年的re:Invent会议上,AWS发布了几条公告,以进一步提高SageMaker的功能。
AWS亚马逊机器学习副总裁Swami Sivasubramanian说:
“成千上万的日常开发人员和数据科学家已经使用我们行业领先的机器学习服务Amazon SageMaker消除了构建,训练和部署自定义机器学习模型的障碍。拥有像SageMaker这样的被广泛采用的服务
的最好的部分之一就是,我们得到了大量的客户建议,这些建议推动了我们下一批可交付成果的发展。
今天,我们宣布了一套适用于Amazon SageMaker的工具,使开发人员可以更轻松地构建端到端机器学习管道,以准备,构建,训练,解释,检查,监视,调试和运行自定义机器学习模型具有更大
的可见性,可解释性和大规模的自动化。”
第一个公告是Data Wrangler,该功能旨在自动为机器学习准备数据。
Data Wrangler使客户可以从各种数据存储中选择所需的数据,然后单击即可导入。包括300多个内置数据转换器,可帮助客户在无需编写任何代码的情况下对功能进行标准化,转换和组合。
德勤AI生态系统和平台负责人负责人Frank Farrall评论:
“ SageMaker Data Wrangler使我们能够利用丰富的转换工具来开创性地满足我们的数据准备需求,这些转换工具可加速将新产品推向市场所需的机器学习数据准备过程。
反过来,我们的客户可以从我们扩展部署的速度中受益,这使我们能够在几天而不是几个月的时间内提供可衡量的,可持续的结果,以满足客户的需求。”
第二个公告是Feature Store。Amazon SageMaker Feature Store提供了一个新的存储库,可轻松存储,更新,检索和共享机器学习功能以进行培训和推理。
Feature Store旨在克服存储映射到多个模型的要素的问题。专用功能库可帮助开发人员访问和共享功能,从而使开发人员和数据科学家团队之间更容易命名,组织,查找和共享功能集。由于它位于
SageMaker Studio中-靠近运行ML模型的地方-AWS声称它提供了一位数毫秒的推理延迟。
Intuit数据平台工程副总裁Mammad Zadeh说:
“在发布Amazon SageMaker Feature Store之前,我们与AWS紧密合作,我们对完全托管的功能存储的前景感到兴奋,因此我们不再需要在组织内维护多个功能存储库。
我们的数据科学家将能够使用中央存储中的现有功能,并推动团队和模型之间功能的标准化和重复使用。”
接下来,我们有SageMaker Pipelines,它声称是针对机器学习的第一个专门构建的,易于使用的持续集成和持续交付(CI / CD)服务。
开发人员可以定义端到端机器学习工作流程的每个步骤,包括数据加载步骤,Amazon SageMaker Data Wrangler的转换,Amazon SageMaker Feature Store中存储的功能,培训配置和算法设置,
调试步骤以及优化步骤。 。
考虑到正在进行的事件, SageMaker Clarify可能是AWS本周最重要的功能之一。
Clarify旨在在整个机器学习工作流程中提供偏差检测,使开发人员能够在其ML模型中建立更大的公平性和透明度。开发人员可以使用集成的解决方案快速尝试并应对模型中的任何偏差,而不必使用
通常耗时的开源工具。
DFL集团数字创新执行副总裁Andreas Heyden说:
“ Amazon SageMaker Clarify无缝地与德甲Match Facts数字平台的其余部分无缝集成,并且是我们在Amazon SageMaker上标准化机器学习工作流程的长期战略的关键部分。
通过使用AWS的创新技术(例如机器学习)来提供更深入的见解,并为球迷提供对在球场上瞬间做出的决策的更好理解,德甲比赛实况使观众能够深入了解关键决策。每场比赛。”
适用于Amazon SageMaker的Deep Profiling自动监视系统资源利用率,并在任何检测到的培训瓶颈需要的地方提供警报。该功能可跨框架(PyTorch,Apache MXNet和TensorFlow)使用,并自动收
集系统和培训指标,而无需在培训脚本中进行任何代码更改。
下一步,我们对SageMaker进行了分布式培训,AWS声称它使培训大型,复杂的深度学习模型成为可能,其速度比当前方法快两倍。
Turbine的首席技术官KristófSzalay评论:
“我们使用机器学习来训练基于专有网络架构的计算机模拟人体细胞模型,称为模拟细胞。通过在分子水平上准确预测各种干预措施,Simulated Cell可以帮助我们发现新的癌症药物并找到现有疗法的
组合伙伴。
模拟培训是我们不断重复的工作,但是在一台机器上,每次培训都需要几天的时间,因此阻碍了我们快速迭代新思想的能力。
我们对Amazon SageMaker上的分布式培训感到非常兴奋,我们希望将其培训时间减少90%,并帮助我们专注于我们的主要任务:编写用于单元模型培训的同类最佳代码库。
最终,Amazon SageMaker可以使我们在主要任务中变得更加有效:为患者识别和开发新的抗癌药物。”
SageMaker的数据并行引擎通过自动在多个GPU之间分割数据,将培训工作从单个GPU扩展到成百上千个,从而将培训时间缩短了40%。
随着边缘计算的进步迅速增加,AWS与SageMaker Edge Manager保持同步。
Edge Manager帮助开发人员优化,保护,监视和维护部署在边缘设备群上的ML模型。除了帮助优化ML模型和管理边缘设备外,Edge Manager还提供了对模型进行加密签名,将预测数据从设备上
载到SageMaker进行监视和分析的功能,以及查看可跟踪并提供有关运行情况的可视化报告的仪表板的功能。 SageMaker控制台中已部署的模型。
联想个人电脑和智能设备云与软件副总裁Igor Bergman评论:
“ SageMaker Edge Manager将帮助消除部署后优化,监控和持续改进模型所需的手动工作。有了它,我们预计我们的模型将比其他类似的机器学习平台运行得更快,消耗的内存更少。
随着我们将AI扩展到整个Lenovo服务产品组合的新应用程序中,我们将继续需要高性能的管道,该管道在云和数百万个边缘设备上都具有灵活性和可扩展性。这就是为什么我们选择Amazon
SageMaker平台。凭借其丰富的边缘到云和CI / CD工作流功能,我们可以有效地将机器学习模型带入任何设备工作流,以提高生产率。”
最后,SageMaker JumpStart旨在使对机器学习部署经验不足的开发人员更容易上手。
JumpStart为开发人员提供了易于使用的可搜索界面,以查找同类最佳的解决方案,算法和示例笔记本。开发人员可以从几个端到端的机器学习模板(例如欺诈检测,客户流失预测或预测)中进行选
择,并将其直接部署到他们的SageMaker Studio环境中。
AWS一直在进行SageMaker改进,在过去的一年中提供了50多种新功能。保险杠功能下降之后,我们可能不应该再期待2020年了。
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】