如今,数据已成为企业的货币,但管理数据不当可能会很快失去控制。麻省理工学院最近的一项研究发现,对于一些企业来说,大数据正在变成糟糕的数据,并可能导致企业损失高达25%的收入,因为这些企业不得不修复不良数据,消耗了运营费用。
处理大量混乱的数据对于企业来说可能是一个挑战,而且随着更多数据的创建和收集,这将变得越来越困难。这就是数据管理或数据治理非常重要的原因。
调研机构Gartner公司将主数据管理定义为“数据治理”,这是“一种技术支持的学科,其中业务和IT协同工作,以确保企业共享的主数据资产的一致性、准确性、管理性、语义一致性和问责制。”
主数据是描述企业核心实体(包括客户、潜在客户、公民、供应商、站点、层次结构和账户科目表)的一致和统一的标识符和扩展属性。
数据治理主要是企业内部部署的解决方案,该领域的大多数***都是一些传统的软件公司,其中大部分的企业已经在某种程度上向云端过渡。而Gartner公司认为,未来几年,数据治理也将转向云计算。
在这个领域中,很多企业都在激烈竞争,因此在此这个领域缩小一下范围,列举了全球10个主要的市场参与者。如上所述,大部分公司都是传统厂商,而其他是市场的新成员。
全球十大数据治理解决方案服务商
(1)亚马逊网络服务公司(AWS)
AWS公司从其简单存储服务(S3)开始构建数据治理解决方案,其中包括Elastic MapReduce Athena,这是一种用于存储在S3中的数据的计量查询引擎。为了配置企业的云环境,AWS CloudFormation允许企业使用简单的文本文件为其应用程序建模和配置所需的全部资源。Amazon CloudWatch监控并收集所有资源的指标。AWS Systems Manager允许企业监控所有资源,并自动执行常见操作任务。此外,还有用于配置管理的AWS OpsWorks,特别是如果企业使用Chef或Puppet的话。
(2)IBM公司
由于是生产大型机的传统厂商,IBM公司在数据治理方面经验丰富。它提供独立DBMS,包括各种版本的DB2、IBM PureData System for Analytics、DB2 Analytics Accelerator、Hadoop,以及IBM BigInsights、DataFirst Method和IBM Watson Data Platform。其主要数据治理系统是IBM Information Server,它提供了对数据的统一管理。它可以帮助用户查找和搜索资产,探索资产之间的关系,搜索非结构化数据源以及结构化数据库,并允许自动发现新数据。
(3)微软公司
微软公司的数据管理始于其旗舰产品套件Office 365,它允许客户管理整个内容生命周期,从创建或导入数据到存储数据,并创建策略以保留和***删除内容。它运行在一系列用于云计算的微软产品之上,无论是内部部署还是微软Azure。它提供了一个称为Azure SQL数据仓库的数据仓库设备,一个基于Hortonworks的Hadoop发行版(称为Azure HDInsight),一个Azure Data Lake数据收集器。Azure SQL数据仓库也是对云计算数据存储的兴趣日益增长。
(4)Oracle公司
Oracle公司从旗舰产品Oracle Database 12c、Oracle大数据管理系统、Oracle大数据SQL和大数据连接器开始入手。对于特定的数据管理,它具有Oracle企业元数据管理器(OEMM)和Oracle企业数据质量(EDQ)。它还通过Oracle数据库云服务器和Oracle大数据设备为其软件堆栈提供了整套硬件系统,并且具有Oracle数据库即服务,Exadata云服务和大数据云服务等云服务。
(5)SAP公司
SAP公司是Oracle公司的竞争对手,SAP公司提供了IQ DBMS和Hana,用于内存数据库管理系统和分析。Hana已更新为包含备份、灾难恢复、分析,与Apache Spark和多租户集成等功能。SAP Hana是SAP平台的一个组件。然后是SAP主数据治理,它整合和管理来自一个地点的数据,以确保数据质量和一致性。
(6)Teradata公司
Teradata公司以其分析平台而闻名,包括DBMS、数据仓库设备、云计算数据仓库。它通过Hadoop Aster Analytics进行连接,并通过Teradata Listener流式传输数据,所有这些功能都旨在通过统一的界面呈现信息。其主数据管理是一个完整的数据治理生命周期框架。
(7)Cloudera公司
Cloudera公司是三大Hadoop发行公司之一,在这方面非常成功。它提供了Cloudera Enterprise,这是一款Hadoop发行版,其中包含用于批量分析的Hadoop和用于实时分析的Spark,以及用于治理的Cloudera Navigator,用于内部部署和云中的集群管理的Cloudera Manager和Cloudera Director,并支持AWS、微软Azure和谷歌云等云平台。
(8)Dell Boomi公司
Boomi是Dell公司于2010年收购的一家业务部门,专门从事内部部署和云端的主数据管理。 Boomi公司通过其Boomi过程库提供很少甚至没有编码开发,该库提供了构建治理应用程序的示例。它还支持微软Azure、AWS和谷歌的PaaS供应商和连接器,提供用于与合作伙伴连接的EDI连接器,并支持用于DevOps开发方法的Docker容器。
(9)SAS公司
SAS公司的整个业务都基于分析。它提供了称为SAS Data Governance的主数据管理解决方案,可帮助企业准备和管理传统数据源和大数据源。它允许企业通过通用数据模型维护和管理数据属性,标记元数据中的更改,创建快照、存储和管理列表和层次结构,并创建关于数据运行状况和所需补救的报告。
(10)TIBCO软件公司
TIBCO MDM专门提供存储在不同孤岛中的企业数据的统一视图,使企业能够清楚地查看其业务数据并快速采取行动。TIBCO MDM可在企业内提供数据工作流的可视化,使企业可以根据需要观察流程并进行改进。它可以通过TIBCO Clarity Cloud Edition在内部部署和云中使用。