全球独立企业数据集成软件提供商Informatica公司近日推出了Informatica PowerCenter大数据版(Informatica PowerCenter Big Data Edition)。这是一项重要的革新,使企业能够高速、大量、多种类地将社交、移动设备、云以及机器中的数据增加到传统交易数据中。使用Hadoop等新型分析平台,PowerCenter大数据版是唯一将新兴技术与传统数据管理基础设施相结合,在充分释放大数据价值的同时降低大数据成本和风险的产品。
PowerCenter大数据版提供了一个创新且无需编码的环境,确保企业围绕诸如Hadoop等新型技术,通过以下方面降低大数据项目的成本:
· 高速数据存入和提取——跨异构环境进行大数据加载、处理和提取,以优化Hadoop和传统数据管理基础设施间的端到端的数据流。
· 无编码开发环境——使用Informatica可视化开发环境去除Hadoop中的手工编码。开发和测量数据流而无需专门的手工编码,以***限度提高重用率。
· 虚拟数据机——允许用户一次建立转换逻辑,在Hadoop、传统ETL网格基础设施甚至数据联合应用上任意部署。开发者可在虚拟数据机上只创建一个单一的图形映射集,且将他们运行在多种数据平台和部署模型上。
· 在Hadoop上近乎通用的数据访问和全面地提取、转换和加载(ETL)——使用一个丰富的、预建的ETL库可靠地访问多种类型和来源的数据,对运行在Hadoop或传统网格基础设施上的交易和交互数据进行转换。
Informatica公司执行副总裁兼***技术官James Markarian说:“PowerCenter大数据版为用户提供了一种业经验证的创新方法,这种方法是建立在Informatica基于GUI(图形用户界面)的开发环境和Informatica在数据集成领域长期领导地位的基础之上的。早期的Hadoop使用者开始意识到,由于缺乏与传统计算和数据管理基础设施的互操作性而遇到的困难,以及效率低下、在其他编程语言技能方面欠缺的问题。PowerCenter大数据版可以解决所有这些问题:近乎通用的连通性和无编码开发。简而言之,我们对大数据和Hadoop的价值主张是:安全采用Hadoop等新技术,使用已有技能和基础设施,实现更多功能。”
Gartner 2011年9月题为《21世纪的信息管理》的报告中称:“到2015年,那些将高价值、多种新信息类型和来源整合到统一信息管理架构中的企业,将实现比业内同行优于20%以上的财务表现。”
***限度减少新技术风险
实施所有新技术,例如Hadoop,会引起一定的实施风险。PowerCenter大数据版通过提供以下特点帮助企业将这些风险最小化:
· 将新兴技术与传统数据管理基础设施相结合的投资,从而对未来执行大数据策略提供防护。
· 采用经数十万集成项目验证的Informatica数据集成平台,创建可扩展的Hadoop任务。
· 直接对Hadoop进行数据探查,提高大数据分析结果的可信度,以便尽早发现数据质量问题并对大数据分析进行验证。
· 通过无缝转移、灵活还原、连接恢复实现关键任务的高可用性。
· 数千名训练有素的Informatica系统集成商合作伙伴专家,随时待命。
减少大数据成本
数据量持续不断地成倍增长,且复杂性也不断增加,这一趋势永远不会停止。PowerCenter大数据版能够帮助企业减少大数据管理成本,用户可以:
· 基于数据量、数据类型和潜在需求将大数据集成处理部署在***成本效益、***性能表现的处理资源上。
· 通过向一个无代码的开发环境迁移,可以将数据集成开发效率提高多达三倍。
· 在Hadoop上采用预构建数据转换库以减轻开发工作量并提高开发质量。
· 使用已有的PowerCenter技能进行大数据开发。
上市时间
PowerCenter大数据版约在2012年12月发布。