- Amazon Lex,支持Amazon Alexa的技术,让任何开发者都能为web、移动和互联设备应用构建丰富的、对话式的用户体验。
- Amazon Polly可将文本转化成生动传神的谈话,让应用能以47种逼真的声音、24种语言对话。
- Amazon Rekognition可轻松添加图像分析至应用,使用强大的、基于深度学习的图像和面部识别。
- Capital One, Motorola Solutions, SmugMug, American Heart Association, NASA, HubSpot, Redfin, Ohio Health, DuoLingo, Royal National Institute of Blind People, LingApps, GoAnimate及Coursera,还有很多客户都在使用这些Amazon AI服务。
美国西雅图,2016年11月30日 ,亚马逊旗下公司Amazon Web Services, Inc.(AWS)发布三项人工智能(AI)服务,让任何开发者都能轻松构建理解自然语言的应用程序,将文本变成生动的言语,使用声音或文本进行对话,分析图像并识别人脸、物体和场景。Amazon Lex、Amazon Polly和Amazon Rekognition都基于同样经验证的、高可扩展的Amazon技术,由全公司数千名深度学习和机器学习专家打造。Amazon AI服务全都提供高质量、高精度的AI能力,可扩展且经济高效。Amazon AI服务是完全托管的服务,因此无需构建深度学习算法,无需训练机器学习模型,无需前期承诺或基础设施投资。这解放了开发者,让他们能专注于定义并构建全新一代的应用,这些程序能看到、听到、说、理解并与周围的世界互动。要了解有关Amazon Lex,Amazon Polly或Amazon Rekognition的更多信息,请访问:https://aws.amazon.com/amazon-ai
到目前为止,很少有开发人员能构建、部署并大规模扩展具备AI能力的应用程序,因为这样做需要访问大量数据,以及机器学习和神经网络方面的专业知识。有效地应用AI涉及大量手动操作,以开发并调整许多不同类型的机器学习和深度学习算法(例如自动语音识别、自然语言理解、图像分类),收集清理训练数据,训练并调整机器学习模型。并且,这一过程必须对应用程序中的每个对象、面部、语音和语言特性重复。Amazon AI服务消除了所有这些繁重的工作,让AI可以为所有应用程序开发人员广泛地访问,提供Amazon强大且可靠的深度学习算法和技术,以任何开发人员可通过API调用或在AWS管理控制台点击几次即可达成的完全托管服务形式呈现。Amazon AI服务完全释放了Amazon的自然语言理解、语音识别、文本到语音和图像分析技术能力,任意规模、任意应用程序、任意设备,在任何地方。
“更好的算法、对大量数据的广泛访问以及由云提供的高效经济的计算能力,三者结合,使得AI成为应用程序开发人员的现实。AWS是目前使用的一些极具创新性和创造性的AI应用程序的家,”AWS数据库、分析和AI副总裁Raju Gulabani说:“多年来,Amazon成千上万的机器学习和深度学习专家一直在开发人工智能技术,以预测顾客可能喜欢阅读什么,通过机器人技术和计算机视觉技术提高我们物流中心的效率,并带给客户我们AI支持的虚拟助理Alexa。现在,我们正将这些创新的基础技术以任何开发人员都可用的形式提供,包括三种易于使用、功能强大且高效经济的完全托管的Amazon AI服务。我们很兴奋看到客户如何使用Amazon Lex、Amazon Polly和Amazon Rekognition,构建新一代的应用程序。这些应用程序具有类似人类的智能,可以看到、听到、说话,并与人和他们的环境进行交互。”
用Amazon Lex实现智能对话
Amazon Lex是一项新服务,使用支持Amazon Alexa的、基于相同的自动语音识别(ASR)技术和自然语言理解(NLU)的语音和文本构建对话界面。Amazon Lex可轻松将复杂的自然语言功能带到几乎任何应用程序。开发人员可以通过输入几个示例短语(例如,“查找航班”或“预订航班”),用于获得完成任务所需参数(例如,旅行日期和目的地)的指令以及相应的澄清问题以询问用户(例如,“你想什么时候旅行?”,“你想去哪里?),直接从AWS管理控制台构建和测试机器人(执行自动化任务的会话应用,如检查天气或预订航班)。 Amazon Lex负责其余部分,构建语言模型并询问完成任务所需的后续问题。由于Amazon Lex是与AWS Lambda集成的,开发人员可以将Amazon Lex配置为通过AWS Lambda函数调用适当的后端服务(例如航班预订服务)。开发人员还可以使用执行AWS Lambda函数的预构建企业连接器,通过从Salesforce、Microsoft Dynamics、Marketo、Zendesk、QuickBooks和HubSpot等企业系统中获取数据来回答诸如“我在Salesforce.com中的前十个帐户是什么”这样的问题。
使用Amazon Lex构建的机器人可以在任何地方使用:从Web应用程序,到Slack和Facebook Messenger等聊天和信使应用程序,或通过移动或连接设备上的应用程序中的语音。 Amazon Lex处理不同平台所需的身份验证,并通过不要求开发人员为每个平台编写自定义代码来简化用户界面设计。 此外,开发人员不必担心扩展其基础架构,因为Amazon Lex会随着流量增加而自动扩展,并且开发人员仅需对Amazon Lex API的调用进行支付。
Capital One通过各种渠道为消费者、小型企业和商业客户提供广泛的金融产品和服务。 Capital One实验室首席技术官Firoze Lafeer表示:“作为AWS的资深用户,Amazon Lex与其他AWS服务(如AWS Lambda和Amazon DynamoDB)的无缝集成非常吸引人。 一个高度可扩展的解决方案,Amazon Lex还带来了加快新一代语音和文本交互上市速度的潜力,例如我们最近为Alexa推出的Capital One技术。”
OhioHealth是一个全国认可的医疗保健组织,在47个县拥有11多家医院的网络。 “我们对利用不断演进的语音识别和自然语言处理技术来改善客户的生活感到很兴奋。Amazon Lex为我们提供了一个很好的机会,带给我们的病人一种新体验。” OhioHealth运营支持高级副总裁兼首席信息官Michael Krouse表示:“我们在OhioHealth所做的一切都是为了在正确的时间和地点为我们的患者提供适当的护理。Amazon Lex的下一代技术和我们正在开发的创新应用程序,将有助于提供增强的客户体验。我们拥有无限可能。”
HubSpot是一个营销和销售软件的领导者。“HubSpot的GrowthBot是一个一体化的聊天机器人,通过使用会话界面提供对相关数据和服务的访问,帮助营销人员和销售人员提高工作效率。使用GrowthBot,营销人员可在创建内容、研究竞争对手并监控其分析方面获得帮助。通过Amazon Lex,我们添加了复杂的自然语言处理能力,帮助GrowthBot为我们的用户提供更直观的UI,“HubSpot创始人和首席技术官Dharmesh Shah表示:“Amazon Lex让我们利用先进的AI和机器学习,不必自己编写算法。”
通过允许将实时通信和身份验证功能直接嵌入软件应用程序,Twilio帮助企业实现通信相关并合乎语境。Twilio消息产品部总监Benjamin Stein表示:“开发者和企业使用Twilio来构建应用程序,可以与世界各地的客户进行沟通。Amazon Lex将为开发人员提供一个易于使用的模块化架构和全面的API,以支持在移动平台上构建和部署对话机器人。我们期待看到我们的客户使用Twilio和Amazon Lex构建的东西。”
用Amazon Polly实现智能语音
Amazon Polly使开发人员能够轻松地向现有应用程序(如新闻阅读器和电子学习平台)添加自然语音功能,或创建全新类别的语音功能产品(从移动应用程序到设备和设备)。 Amazon Polly易于使用,开发人员可以使用SDK或从AWS管理控制台中向Amazon Polly发送文本,Polly会立即返回可以直接播放或以标准音频文件格式存储的音频流。47个逼真的声音和24种语言的支持,开发人员可以选择男性和女性的声音与各种口音,使应用程序面向全球用户。Amazon Polly流畅的文本内容发音意味着,应用程序可跨多种文本格式,提供高质量的语音输出。Amazon Polly是可扩展的,即使在将大量文本转换为语音时,也能够快速返回高质量的语音。使用Amazon Polly,开发人员只需为他们转换的文本支付,并且可以缓存生成的语音,随意重复播放,没有任何次数限制。
华盛顿邮报是一家曾获普利策奖的媒体和技术公司,每天出版超过1200个故事。“华盛顿邮报高级产品经理Joseph Price说:“我们一直对提供我们故事的音频版本感兴趣,但发现,现有的文本到语音解决方案相对于它们提供的语音质量而言,不具备什么成本效益。 随着Amazon Polly的到来和其高品质的声音,我们期待为读者提供更丰富多样的方式体验我们的内容。”
GoAnimate是一个基于云的动画视频创作平台,旨在让没有动画背景的商业人士快速、容易地创建动画视频。“Amazon Polly让GoAnimate用户能够立刻为使用我们平台创建的角色配音。这在现场解说难得或时间不允许的场景中尤其有帮助,例如开发一个多语言的视频,或者是加快审批流程的预生产制作,”GoAnimate创始人兼首席执行官Alvin Hung表示:“Amazon Polly的语音与我们丰富的前动画资产无缝集成,巩固了GoAnimate的易用性,在为我们的客户带来高效率的同时,加速产品上市。”
用Amazon Rekognition实现智能图像分析
Amazon Rekognition可让开发者快速、容易地构建应用程序,分析图像,识别人脸、物体和场景。Amazon Rekognition使用深度学习技术,自动确定物体或场景,例如汽车、宠物或家具,并提供一个置信度得分,让开发者可以给图像打标签,这样应用程序使用者就可使用关键词搜索特定的图像。Amazon Rekognition可在图像内定位面部并探测属性,例如是否在微笑,或眼睛是否是睁开的。Amazon Rekognition还支持先进的面部分析功能,例如面部对比和人脸搜索。使用Rekognition,开发者可构建一个应用,评估两张图像中的面部是来自同一个人的可能性,从而能够近实时地根据参考照片验证用户。类似地,开发者可创建成百上千万面部(在图像中探测到)的集合,根据其参考图像,在集合中搜索相似的面部。通过借助一个简单、高效经济且可靠的AWS服务实现全面的图像分类、探测和管理能力,Amazon Rekognition消除了开发和管理昂贵的图像处理流程所需的复杂性和开销。
Redfin是一个全方位服务的经纪商,使用现代技术帮助人们买卖房子。“Redfin用户喜欢在我们的网站和移动应用程序上浏览房产,我们希望让用户更容易筛选数亿的列表和图像。”Redfin大数据和分析总监Yong Huang表示:“Amazon Rekognition可从图像直接生成一组丰富的标签。这使得构建智能搜索功能相对简单,帮助客户根据他们的特定需求(如壁炉,院子或游泳池)发现房子。由于Rekognition是接受Amazon S3 URL的,因此可在探测物体、场景和人脸上节省大量时间,无需移动图像。
SmugMug是一个每天为成百上千万客户存储数十亿张优美照片的家,安全又美丽。 SmugMug创始人、首席执行官和首席极客Don MacAskill说:“SmugMug的客户希望花时间创造更多的回忆,而不是手动管理他们的照片收藏。Amazon Rekognition允许我们自动识别客户的照片中的内容,解锁一大堆功能,允许他们和其访客将更多时间放在享受生活和庆祝他们的照片上。”
基于AWS的深度学习和AI
Amazon Polly今天在美国东部(N. Virginia)、美国东部(Ohio)、美国西部(Oregon)和欧盟(Dublin)地区可用,并将在未来几个月扩展到更多地区。 Amazon Rekognition在美国东部(N. Virginia)、美国西部(Oregon)和欧盟(Dublin)地区提供,并将在未来几个月扩展到更多地区。客户可以从今天开始注册Amazon Lex预览。
除了这些服务,AWS最近宣布正在大力投资MXNet,一个开源的分布式深度学习框架,最初由卡内基梅隆大学和其他顶尖大学开发,贡献代码并改进开发人员体验。 MXNet将使机器学习科学家能够构建可扩展的深度学习模型,从而大大减少其应用的训练时间。有关AWS支持MXNet的更多信息,请访问:http://www.allthingsdistributed.com/2016/11/mxnet-default-framework-deep-learning-aws.html。
AWS还使开发人员能够轻松运行自己的深度学习和机器学习工作负载,在AWS之上构建自己的AI平台。Amazon Elastic Compute Cloud(Amazon EC2)具有广泛的实例类型,并拥有包含大量内存的GPU,是深度学习训练的理想选择。P2实例在2016年9月推出,旨在面向大规模机器学习和深度学习,具备高达8个NVIDIA Tesla K80加速器,每个都运行一对NVIDIDA GK210 GPU,有12 GiB的内存和2,496个并行处理核心。并且,客户可以使用AWS的深度学习AMI,其中包含六个预配置和预测试的深度学习框架,包括所有依赖项、Nvidia驱动程序和数据科学工具,如Jupyter和Anaconda。 此外,AWS CloudFormation模板可用于规模化的深度神经网络训练,几次点击便可实现。