数据治理是创建内部数据标准的过程,以及控制谁可以访问数据以及如何在业务运营和分析应用程序中使用数据的策略,它通常包含数据质量改进计划以及主数据管理(MDM)计划。一个成功的数据治理计划可确保数据一致、值得信赖和可用,并确保其使用符合数据隐私法和其他法规。
数据治理工具可以帮助公司自动化管理治理计划的各个方面,这类软件提供了帮助创建数据目录和业务术语表、数据映射和分类、工作流管理、协作、流程文档和开发数据治理策略的功能。数据治理软件还可以与数据质量、MDM和元数据管理工具结合使用。
以下是16个重要的数据治理工具,按字母顺序列出,并总结了它们的主要特性和功能。
1.Alation数据治理App
Alation成立于2012年,最初提供了一个数据目录平台,以帮助公司清点和提供对其数据的访问。Alation Data Catalog仍然是其旗舰产品,但该公司在2021年9月发布了一个配套的数据治理工具。Alation数据治理应用软件旨在简化提供对IT系统中可靠数据的安全访问的流程,包括混合云和多云计算环境中的数据。
Alation数据治理App的策略中心功能可用于创建治理策略并查看它们如何映射到特定的数据资产,该治理工具还包括一个数据管理工作台,该工作台提供自动数据管理功能,并使用人工智能和机器学习来根据数据使用情况识别潜在的数据管理人员。
此外,数据治理工具还包括以下功能:
·支持创建和配置数据治理工作流,无需任何编码。
·一个数据治理项目的领导者可以用来跟踪项目进展的仪表盘。
·通过Alation的专业服务部门提供相关的数据治理服务。
2.Ataccama One
顾名思义,Ataccama One的目标是通过在单一平台中统一数据治理、质量、MDM和其他功能,成为满足公司所有数据管理和治理需求的一站式商店,这款人工智能驱动的软件在内部、云和混合环境中运行,专为数据专业人士设计,包括数据治理团队、数据管家、数据科学家、其他数据分析师和数据工程师。
Ataccama One使公司能够将其数据质量和MDM工作与数据目录、数据集成功能、参考数据管理和数据可观察性功能以及数据故事讲述模块结合在一起,该工具专为在企业范围内部署和在高度监管的行业中使用而构建,其功能包括完整的审核历史和基于角色的安全性。
它还包括以下功能:
·支持管理各种大数据平台和数据湖环境中的数据。
·通过自动化和嵌入式智能实现“自动驾驶数据管理和治理”。
·平台即服务部署选项,由供应商Ataccama管理基础设施、管理和安全。
3. Apache Atlas
Apache Atlas是一个开源工具,它为具有数据密集型平台的公司提供了一套基本的元数据管理和数据治理功能,它主要是为在Hadoop集群中使用而设计的,但它也可以与Hadoop生态系统之外的工具和进程交换元数据,以实现与其他分析应用系统的集成。
Hortonworks是一家大数据平台供应商,于2019年被竞争对手Cloudera收购,最初在几个用户公司的帮助下开发了Atlas,该软件于2015年移交给Apache软件基金会进行进一步开发。通过使用Atlas,各公司可以对数据资产进行编目、分类和管理,并提供与数据有关的协作能力,供数据科学家、其他分析师及其数据治理团队使用。
Atlas还提供以下功能:
·定义和管理用于元数据对象的模型的灵活类型系统。
·自动支持对数据资产和数据沿袭信息进行编目。
·与Apache Ranger数据安全框架集成,实现访问控制和数据屏蔽。
4.Axon数据治理
Informatica吹捧Axon数据治理是一种工具,可以帮助公司在企业范围内向最终用户和数据管理员交付可信数据。Informatica在2017年收购原始开发商Diaku时收购了这项技术,它使用人工智能驱动的自动化来协助管家进行数据发现、数据质量评估和沟通,它还使治理团队能够创建经过管理的数据市场,以帮助业务和分析用户查找、访问和了解数据。
数据治理团队还可以使用Axon工具开发通用数据字典、定义数据元素之间的连接、识别数据集中的差距并将治理策略链接到它们所影响的数据,此外,还可以创建端到端业务流,以提供数据沿袭的可视化视图。
Axon数据治理中的其他功能包括:
·能够根据业务定义生成数据质量指标,然后自动测量和监控质量水平。
·数据隐私保护能力,确保用户了解潜在的隐私风险,并分析数据变更的合规影响。
·与其他Informatica产品整合,包括其数据目录、数据质量和数据准备工具。
5.ColLibra数据治理
人们经常说,数据科学家把大部分时间花在寻找、清理和公司数据上。ColLibra旨在改变这一点,并通过ColLibra数据治理帮助公司向他们和其他最终用户提供受信任的数据,这是其数据智能云平台的一部分。根据ColLibra的说法,数据治理工具可以用来操作治理工作流程和流程,创建关于数据资产的共享语言,并使查找和理解相关数据变得更容易。
该工具包括用于定义和管理业务术语的业务术语表,以及用于文档元数据的数据字典,它还提供参考数据管理功能、用于报告和解决数据问题的“数据服务台”功能,以及用于分析在业务流程中使用个人数据带来的潜在隐私风险的ColLibra评估模块。
此外,ColLibra数据治理还提供以下功能:
·数据管家管理职能,包括为数据管家分配角色和职责的能力。
·策略管理器应用程序,支持数据策略和标准的集中管理,以及对采用和合规性的监控。
·与ColLibra的数据目录、数据沿袭和数据质量工具集成,作为数据智能云平台的一部分。
6. Data360 Govern
所有成功的关系都建立在信任的基础上,而这正是软件供应商Data360 Govern将帮助培育数据资产的承诺。2021年收购Infogix时,精准收购了数据治理工具,以及数据质量和分析产品,这些产品也是Data360投资组合的一部分。Data360 Govern是精准的数据完整性套件的一部分——七项可互操作的服务,以提供准确的数据,包括数据集成、可观察性、治理、质量、丰富、地理寻址和空间分析,它使公司能够创建企业数据治理框架,该框架还包括数据目录和元数据管理功能。
该工具实时跟踪数据如何支持各种业务流程和结果,以帮助公司实现其业务目标,并提供可定制的仪表板和报告,以呈现个性化的洞察,它还可以自动执行数据管理工作流程、元数据采集以及从配套的Data360 DQ+软件和来自Precision或竞争对手供应商的其他数据质量工具导入数据质量分数。
Data360治理中内置的其他关键功能包括:
·公司中业务术语表的自动管理和数据流的可视化。
·3D数据沿袭功能,还包含流程图和影响分析功能。
·灵活的元模型,可配置为反映公司的业务模型,以帮助简化数据治理流程。
7. Erwin Data Intelligence
伟大的文学侦探夏洛克·福尔摩斯的粉丝们都知道,他具有非凡的洞察力和观察力。Quest Software承诺与其企业数据治理工具Erwin Data Intelligence提供类似的功能,该公司声称,该工具“提供数据意识、能力和知识,以推动公司中的数据治理和业务支持”。
Quest的正式名称为Erwin Data Intelligence,该软件将独立的Erwin数据目录、数据素养和数据质量产品组合在一个集成套件中,它旨在帮助IT和数据治理团队使可用数据资产对最终用户更可见,并提供有关其使用的指导,并提供治理控制以确保用户遵循内部数据策略和最佳实践。可以创建基于角色的视图,以便为不同的用户组添加有关相关数据的上下文。
Erwin Data Intelligence还包括以下功能:
·用于收集和编目元数据、生成数据沿袭细节以及进行数据分析和数据质量评估的自动化功能。
·元数据驱动的数据流映射,以帮助数据集成和数据谱系记录。
·数据管理功能,以及指派数据所有者和主题专家帮助管理数据资产的能力。
8.IBM Cloud Pak for Data
IBM Cloud Pak for Data是一个云原生平台,支持数据治理、质量和隐私计划以及数据集成、客户数据管理和AI治理,该软件建立在数据结构技术基础上,包括人工智能驱动的数据发现、分析和编目功能,它还提供元数据丰富、数据质量管理和数据沿袭功能,以及用于管理数据策略的工具,作为数据保护和法规遵从性工作的一部分。
此外,IBM工具可用于创建自动拒绝数据访问或向未经授权的用户屏蔽数据的规则,另一方面,它包括旨在简化授权用户对可信数据集的访问并帮助他们理解和使用数据的功能,例如,可以创建数据可视化来显示不同数据元素之间的关系。
IBM Cloud Pak为数据提供的其他功能包括:
·自动评估数据隐私风险,并针对已确定的风险提出缓解建议。
·支持云、内部部署和混合云部署。
·计划与IBM子公司Databand的数据可观察性工具集成。
9.OneTrust数据治理
OneTrust数据治理将人工智能驱动的数据发现和分类功能与集成的数据目录和一组数据治理策略管理功能相结合,它是OneTrust提供的广泛产品组合的一部分,OneTrust还支持公司中的数据隐私、风险管理和相关计划。与该公司的其他产品一样,数据治理工具由人工智能、机器学习和机器人流程自动化引擎提供支持。
该引擎可以自动查找应用程序和数据存储并清点其数据资产,然后应用人工智能和机器学习模型对数据集进行分类、分类、丰富和标记。完成后,可以使用OneTrust数据治理来填充数据目录和详细的数据字典,将目录链接到业务术语表,并根据数据的分类方式自动应用治理策略和控制。
OneTrust数据治理还包括以下功能:
·500多个预置连接器,以及使用拖放式工作流构建器创建自定义连接器的能力。
·建立数据所有权和管理责任的协作工作流程。
·用于创建数据谱系图和生成法规遵从性报告的功能。
10.Oracle Enterprise元数据管理
Oracle企业元数据管理(OEMM)使公司能够从Oracle和非Oracle系统中的关系数据库、数据仓库、Hadoop群集、BI平台和其他数据源获取、编目和管控元数据,该工具还包括交互式搜索和浏览器功能,可用于探索元数据和访问模型图,以及元数据报告功能,此外,它还提供数据沿袭跟踪和影响分析功能。
OEMM提供了一套协作式数据治理和管理功能,包括注释元数据和标记元数据、添加有关数据的注释以及创建内部数据审查委员会的能力,该软件还可以从Oracle和第三方系统导入现有的元数据标准,并使治理团队能够构建支持语义谱系分析的业务术语表。
OEMM提供的其他功能包括:
·可以将来自不同来源的元数据拼接在一起的算法,以显示数据通过系统的完整路径。
·对元数据模型进行版本控制,以进行合规和性能优化方面的比较。
·与Oracle Enterprise Data Quality集成,以支持全面的数据治理管理方法。
11. Rocket Data Intelligence
Rocket Software将Rocket Data Intelligence描述为解决“数据不信任”的方法。正如该公司指出的那样,创建和收集的大量数据往往没有得到利用,因为业务经理、数据科学家和其他最终用户要么找不到它,要么不理解和信任它。Rocket DI,简称为Rocket DI,旨在通过一系列元数据管理、数据沿袭和数据治理功能来帮助公司解决这些问题。
元数据驱动的软件在数据通过IT系统时生成端到端的数据视图,可用于提供有关数据的业务意义的信息,并对其使用进行保护,例如,内置的数据治理工作流和数据管理功能使治理团队能够管理与数据相关的问题、批准业务术语表条目以及处理其他任务。Rocket DI还支持基于角色的访问控制,用于设置用户对特定数据集的权限。
Rocket在2021年收购ASG Technologies时收购了该工具,该工具提供的其他关键功能包括:
·企业元数据存储库,以及对从260多个数据源获取元数据的自动支持。
·自动化数据沿袭文档,将可视化数据流映射到业务环境。
·跟踪数据收集、存储、访问和使用情况,以遵守数据隐私法。
12.SAP主数据治理
与其名称一致,SAP主数据治理专为帮助公司治理和管理主数据而设计,作为MDM计划的一部分,该工具可用于整合来自不同源系统的主数据,并对其进行集中管理,同时还包括内置的数据质量管理功能,它是SAP业务技术平台的一部分,该平台涵盖了广泛的数据管理、分析、人工智能和相关技术。
SAP提供了两个版本的治理工具——一个运行在其旗舰产品S/4HANA ERP系统之上,另一个云版本可以使用中心辐射式方法支持主数据治理环境的联合网络。在这种设置中,一个中央系统管理核心主数据属性,而特定于应用程序的属性由业务单位和部门中的单独治理系统管理。
SAP主数据治理还包括以下功能:
·预置数据模型、业务规则、治理工作流程和用户界面,以帮助简化部署。
·协作工作流路由和通知功能,帮助实施经过验证的数据值。
·与配套的SAP主数据集成工具集成,将集成和治理功能结合在一起。
13.SAS信息治理
通过其SAS信息治理工具,软件供应商SAS Institute旨在帮助业务和分析用户减少查找和评估数据的时间,而将更多时间用于分析工作,同时使数据管理员和数据治理团队能够确保数据资产得到保护和正确使用。治理软件作为单独的产品出售,也作为标准组件或可选的附加组件捆绑到几个SAS分析工具中。
该工具包括一个数据目录,可以自动爬行数据源、对数据进行分类和识别敏感信息。最终用户可以搜索目录中的元数据以查找相关数据以及报告和其他分析资产,搜索结果提供有关数据质量、使用指标等的信息,以帮助用户确定识别的数据是否适合其分析需求。
SAS信息治理还提供以下功能:
·内置数据质量、集成和沿袭工具,以及提供所需数据准备步骤视图的自助式用户界面。
·从数据目录中的数据资产一键访问SAS Viya分析应用程序。
·将SAS Viya连接器连接到Egeria开源元数据管理器,以实现不同工具之间的元数据共享。
14.Semarchy XDM
Semarchy XDM是Semarchy United数据平台的数据管理和治理组件,它将其与用于数据集成的配套XDi工具结合在一起。XDM软件通过内置的工作流程和数据丰富功能,在单一环境中支持数据治理、MDM、参考数据管理和数据质量计划。
该工具使公司能够为特定领域或业务用例构建具有嵌入式规则、策略和工作流的数据模型它还可以,促进协作治理流程和仪表板的开发,以可视化数据指标,其中包括一个元数据存储库,以及用于不同数据模型的各个数据存储,后者还捕获有关数据沿袭的信息,并且可以将多个数据存储附加到单个元数据存储库。
Semarchy XDM中提供的其他功能包括:
·支持在本地、云中或作为托管服务进行部署。
·基于角色的用户权限,以及合规报告功能。
·批量和实时API,实现应用和业务流程的双向集成。
15. Syniti知识平台
Syniti Knowledge Platform提供全套数据管理功能,包括以嵌入式数据目录为基础的数据治理功能。Syniti软件可以从数百个源系统获取数据并自动生成元数据,然后使用由机器学习算法驱动的额外自动化来帮助构建将元数据与公司的业务流程和术语相关联的语义模型。
该软件还使公司能够将版本控制应用于数据质量和治理规则,跟踪数据沿袭和审计数据集及其使用情况,以实现法规遵从性目的。Syniti于2019年更名为BackOffice Associates,它还提供相关的Data JumpStart服务,包括预构建的报告和仪表板,以加快数据质量、MDM和数据治理计划,并帮助构建扩展这些计划的业务案例。
Syniti Knowledge Platform还包括以下治理相关功能:
·协作功能,包括可用于众包数据洞察和最佳实践的自动化工作流。
·一套标准的数据智能仪表盘,并支持创建自定义仪表盘。
·自动收集有关数据迁移的详细信息,以确保它们与公司的数据治理战略保持一致。
16.Talend数据交换矩阵
Talend Data Fabric将数据集成、数据质量和数据治理技术与应用程序和API集成模块结合到一个平台中。正如Talend所说,该平台的数据完整性和治理工具结合了自动质量检查和其他数据质量功能,以帮助公司确保数据干净和值得信赖。然后,他们可以使用该工具来管理治理和数据管理流程。
该软件包括一个数据目录,可以自动爬行、公司和丰富元数据。数据库存功能支持元数据管理并可以识别数据孤岛,它还通过Talend Trust Score提供有关数据可信度的信息,Talend Trust Score是一个基础平台功能,可计算数据集可靠性的一目了然的分数。数据管理功能包括用于设置优先级和跟踪项目的基于团队的工作流,以及管理监控功能。
Talend Data Fabric的治理工具还具有以下功能:
·自助式数据准备和管理,包括能够与其他用户共享准备和管理的数据集。
·数据沿袭跟踪和合规跟踪,以支持数据隐私和合规工作。
·基于角色的访问控制和基于工作流的数据管理,帮助保护数据免受未经授权的使用。