Pivotal推出大数据软件组合-软件大数据

由EMC和VMware共同出资创办的Pivotal公司已经做好了发布其BI(商业智能) PaaS(平台即服务)的准备。与此同时，这家新公司正在致力于创建自己的数据挖掘与分析软件产品组合。目前，Pivotal已经公布了两个可以帮助进行数据分析的项目。其中一个是可与Hadoop数据处理平台协作，用于实时分析的内存数据存储;另一个是用于商业分析的数据发现工具。

作为Hadoop发行版升级的一部分，Pivotal将在新的Pivotal HD 1.1产品中纳入GemFire HD。GemFire HD是一款VMware在2010年收购的内存交易存储。由于将GemFire作为其Hadoop套装软件包中的一部分，Pivota希望企业以该软件为基础，创建使用Hadoop作为长期存储的OLTP(联机事务处理)系统。

Pivotal 首席产品经理Abhishek Kashyap称，这一解决方案将使得企业能够分析由GemFire所采集到的当前数据，以及被转移至Hadoop的旧有交易数据。GemFire实例将被完全存储在服务器的工作内存当中，并且能够迅速地通过SQL查询实时操作数据，这对于态势感知和其他类型的实时分析都非常有用。

此外，Pivotal还发布了Pivotal Data Dispatch。该工具可以帮助数据分析工作者找到和准备用于分析的数据集。Data Dispatch工具最早由纽约证券交易所开发。数据分析师从2007年开始使用该软件，以便更好地理解相关的法规要求所产生的影响。该软件允许分析师挑选、过滤和综合他们需要进行分析的来自不同来源的数据集。

Pivotal产品营销副总裁Todd Paoletti表示，由分析师生成的数据集将被存储在甲骨文、IBM和SAP等公司的BI工具可以使用的“沙盒”中。以往在使用传统BI工具时，数据分析师通常必须要请求IT员工将数据集综合起来，并将它们部署到数据仓库中。Paoletti称，Pivotal Data Dispatch消除了数据分析师在生成每一个新数据集时需与IT部门协商的必要。

作为一款自助式BI工具，Pivotal Data Dispatch能够提供易于使用的图形数据库，方便数据分析师的使用。数据分析师还可以获得由系统管理员首先定义和标记的数据来源。源数据文件可以是数据库文件、直接文件、Hadoop文件、微软项目文件或是其他常用的格式。生成的综合性数据集可以被存储在Hadoop或是Pivotal的Greenplum之中。