机器学习代表着计算新领域,而公共云正使这项原本高大上的技术变得比以往更亲民、更实惠和更可用。但是,这并不意味着随便什么人都应该趋之若鹜。
机器学习是基于传统人工智能概念的。在1959年,它被定义为能够让系统学习且不必由外部经常更新的能力。它派生出了模式识别和计算学习两个分支,并在近期由几家主要公共云供应商提供他们自己的机器学习服务而进入了业界大部分人士的视野。
今天,我们都知道所谓机器学习是一种学习算法,它能够让计算机通过在数据中寻找某种模式而拥有学习的能力。很多人都将机器学习视为一种卓越的静态编程方法。它能够模拟人类通过经验进行学习的方法,随学习时间的增长而有所提高,而无需人工干预添加新代码或其他配置信息。
云让机器学习服务变得在实现上更易用,在价格上更亲民,在实效上更有用。我们现在可以通过租用的方式而非购买来使用计算和存储资源。用户可以使用PB量级的数据用于机器学习应用程序的学习,其费用支出只相当于原来内部部署硬件成本的一小部分。对于机器学习的新兴趣更多的是来源于这项技术的新功能和低成本,而不是机器学习技术本身的原有功能。
常见的机器学习用例包括欺诈检测、库存管理、以及甚至是物联网应用中控制机器的能力——几乎是任何能够从数据模式知识中获益的所有应用。
当然,还有其他机器学习更为复杂的应用。例如,在美国麻省理工学院Sloan管理评论中有一篇销售通过机器学习获得提升的文章,Accenture卓越绩效研究院共享了在众多销售额超过五亿美元企业中的一项调研结果。调研受访者被问及他们是否计划通过技术实现更高的销售增长,其中76%的人回答“是”。如果要做到这一点,他们计划使用机器学习技术用于实现更高程度的预测精度,并相应地调整销售资源。
公共云中的机器学习服务
谷歌云平台上的谷歌云机器学习和亚马逊网络服务(AWS)上的亚马逊机器学习都是公共云机器学习服务中的领先范例。这两家巨头都通过在他们各自环境中提供机器学习技术来提高用户在他们云平台上进行应用程序开发的兴趣。他们两家都为用户提供了以较低成本使用机器学习服务的功能,以及作为数据源的大数据管理系统。
当用户在选择一家供应商时,应当考虑其机器学习需求以及公共云供应商如何满足其需求的方方面面。除了实际的机器学习服务,用户还应考虑云平台中的数据、中间件和分析将如何共同协作以解决业务问题的方式。
公共云供应商所提供的机器学习系统囊括了软件开发工具包和应用程序编程接口,这些工具能够帮助开发人员将机器学习功能与他们的应用程序整合在一起。这将有助于填补机器学习功能与该项技术实际应用之间的空白。例如,一家金融企业可以根据其贷款申请系统中过去与当前的数据模式来确定某个贷款申请是否是欺诈行为。
当然,公共云中的机器学习服务也是有其短板的。首先,它要求所使用的机器学习服务对于公共云供应商来说是原产的,这就意味着用户必须将数据导入其他云或本地,这可能是有问题的。
其次,很多企业都有一种过度使用机器学习的倾向,即将其用到实际上可能并不需要这项功能的应用;对那些本质上更多只是程序的简单业务流程使用机器学习就显得杀鸡用牛刀了。通常来说,那些执行简单结构化和序列化处理的应用程序并不适于使用机器学习。例如,预定销售、跟踪出货以及处理其他已有良好定义的应用实际上并不真正地能够从机器学习中获益。