近日,微软正式发布Windows Azure HDInsight,这是微软Azure云端的Apache Hadoop版本,针对海量数据应用。
Hadoop为开源的软件架构平台,可用来存储与处理集群服务器上的大量数据,并已成为管理海量数据的***平台。包括Google、Yahoo、Facebook、Amazon、IBM及英特尔等业者都使用Hadoop架构来执行大量的分布式计算。
微软表示,HDInsight是以Hadoop开源为基础提供Azure的云端服务,已公开预览多时,获得客户的支持并成为微软企业服务的一部份。
Windows Azure HDInsight平台
Windows Azure HDInsight采用了Hadoop的数据处理平台与相关的工具,以及知名的Hadoop版本─Hortonworks Data Platform(HDP),同时兼容微软的各种分析工具,包括Excel与Power BI等,并支持.NET或Java等编程语言,以更好的面对使用Hadoop的客户。
微软指出,HDInsight为海量数据的端对端解决方案,针对用户可从各种方面获取的数据以供Excel使用,涵盖SQL Server、HDInsight、Hadoop的外部丛集或是公开的数据集等,并利用Power BI中的工具来萃取数据文件。
据了解,微软准备在下个月正式发表HDP 2.0 for Windows Server版本,未来准备将HDInsight更新至HDP 2.0。