就像微软把Excel表单处理引进到商务领域一样,微软希望其推出的新的Windows Azure HDInsight服务能够利用大数据分析带来同样的影响力。
微软数据平台事业部总经理Eron Kelly表示:“我认为,我们一直做的很好的事情是解决困难的技术问题并且简化这些问题。因此,我们正在使Hadoop更简单并且把它提供给每一个人。”
Windows Azure HDInsight是作为Windows Azure平台服务提供的。这项服务提供一个Apache Hadoop数据处理平台和相关的工具。HDInsight将使用Hortonworks提供的Hadoop旗舰发布版Hortonworks数据平台(HDP)。
微软不是唯一的提供Hadoop云服务的公司。亚马逊Web服务提供Hadoop和Rackspace计划,并且将很快推出HDP服务。IBM的SoftLayer主机服务本周也宣布,它将很快提供在多台裸机服务器上快速处理Cloudera的Hadoop发布版的能力。
但是,微软希望通过简化这个部署流程然后再使用Hadoop获得日益增长大数据分析领域的竞争优势。
例如,这项服务兼容微软数据分析工具。Excel表单用户能够应用这个表单的一个名为“Power BI”的商务智能功能吸收、分析和可视化由Hadoop MapReduce提供的数据。
微软第一次宣布这项服务的计划是在2011年。微软原来打算与Hortonworks合作开发自己版本的Hadoop。微软计划让自己版本的Hadoop经过设置之后能够在Windows服务器上运行。
微软已经向开源软件项目Apache Hadoop和相关的软件贡献了1.6万行代码。
Windows Azure HDInsight将在一个stock version HDP上运行,允许用户在Azure和其它非Azure HDP部署之间迁移工作量。在Hortonworks发布其下一个版本的HDO之后,2.0版将在下个月推出。Azure的HDP版将自动升级。
微软实际上已经为一些选择的客户以全生产模式运行了两个月的Windows Azure HDInsight服务。
巴塞罗纳市已经使用这项服务分析交通模式、垃圾收集和有关其它城市任务的数据,希望这种数据用于做出更明智的开支决策。
弗吉尼亚理工学院和州立大学的一群研究人员正在使用这个服务运行基因测序工具。
微软负责数据平台事业部的副总裁Quentin Clark本周将在纽约举行的“O'Reilly's Strata and Hadoop World”大会上更多地介绍Windows Azure HDInsight服务的情况。