由EMC和VMware共同出资创办的Pivotal公司已经做好了发布其BI(商业智能) PaaS(平台即服务)的准备。与此同时,这家新公司正在致力于创建自己的数据挖掘与分析软件产品组合。目前,Pivotal已经公布了两个可以帮助进行数据分析的项目。其中一个是可与Hadoop数据处理平台协作,用于实时分析的内存数据存储;另一个是用于商业分析的数据发现工具。
作为Hadoop发行版升级的一部分,Pivotal将在新的Pivotal HD 1.1产品中纳入GemFire HD。GemFire HD是一款VMware在2010年收购的内存交易存储。由于将GemFire作为其Hadoop套装软件包中的一部分,Pivota希望企业以该软件为基础,创建使用Hadoop作为长期存储的OLTP(联机事务处理)系统。
Pivotal 首席产品经理Abhishek Kashyap称,这一解决方案将使得企业能够分析由GemFire所采集到的当前数据,以及被转移至Hadoop的旧有交易数据。GemFire实例将被完全存储在服务器的工作内存当中,并且能够迅速地通过SQL查询实时操作数据,这对于态势感知和其他类型的实时分析都非常有用。
此外,Pivotal还发布了Pivotal Data Dispatch。该工具可以帮助数据分析工作者找到和准备用于分析的数据集。Data Dispatch工具最早由纽约证券交易所开发。数据分析师从2007年开始使用该软件,以便更好地理解相关的法规要求所产生的影响。该软件允许分析师挑选、过滤和综合他们需要进行分析的来自不同来源的数据集。
Pivotal产品营销副总裁Todd Paoletti表示,由分析师生成的数据集将被存储在甲骨文、IBM和SAP等公司的BI工具可以使用的“沙盒”中。以往在使用传统BI工具时,数据分析师通常必须要请求IT员工将数据集综合起来,并将它们部署到数据仓库中。Paoletti称,Pivotal Data Dispatch消除了数据分析师在生成每一个新数据集时需与IT部门协商的必要。
作为一款自助式BI工具,Pivotal Data Dispatch能够提供易于使用的图形数据库,方便数据分析师的使用。数据分析师还可以获得由系统管理员首先定义和标记的数据来源。源数据文件可以是数据库文件、直接文件、Hadoop文件、微软项目文件或是其他常用的格式。生成的综合性数据集可以被存储在Hadoop或是Pivotal的Greenplum之中。