PureData for Hadoop:开源+专家能力=优化
IBM正式推出面向Hadoop的全新IBM PureData系统PureData for Hadoop,旨在提高企业部署Hadoop的速度,同时降低部署难度。Hadoop作为颠覆性的开源软件,可用于组织和分析海量的结构化和非结构化数据,例如社交媒体网站的微博与评论、图片和视频、网上交易记录和记录手机定位数据等。
全新PureData for Hadoop让企业在使用企业级Hadoop技术时的加载时间从数周减少到数分钟,而且还为商业分析师和数据科学家提供易用、功能强大的分析工具,并为其呈现可视化效果。此外,新系统还提供了功能更强大的大数据工具,可用于监测和研发,同时加强版的大数据工具可以与更多企业系统相兼容。
IBM PureData for Hadoop标志着IBM在其总体战略中迈出了新的一步,该举措旨在提供一系列具备嵌入式专业功能的系统,充分彰显了IBM在降低信息技术成本和复杂性方面的数十年经验。该系统集成了IBM的InfoSphere BigInsights,该软件帮助各种规模企业实现数据低成本、高效率的管理和分析,并且增加了便捷管理、流程化、资源配置和安全性特征,上述特性与IBM研究院***的分析功能有效结合在一起。
客户例证:
凯利蓝皮书(Kelley Blue Book:www.kbb.com)是业内领先的新车和二手车信息供应商。其将采用PureData for Hadoop分析网站用户带来的点击流数据。该公司能够有效分析信息,包括社交媒体数据,以便了解网站访客最关心的内容,例如二手车和新车价格、事故报告、安全召回事件、保修情况以及汽车买家评论。
凯利蓝皮书技术与数据智能部门副总裁Steve Chow如是说道:“凯利蓝皮书从不同来源收集海量数据,有效的数据管理和分析对我们业务的增长十分关键。我们发现PureData for Hadoop具有广泛用途,可将其作为战略平台去扩大公司的分析生态系统,充分挖掘社会化媒体、文本和机器数据的价值,从而更加深入地了解我们的消费者和客户,改善他们在KBB.com上的综合用户体验。”
BLU Acceleration:为数据库注入全新力量,加速分析
BLU Acceleration整合了大幅改善分析能力和简化管理的一系列技术,能够将报告生成和数据分析速度提高25倍。借助BLU Acceleration,用户可以更快速地抓取关键信息,从而做出更好的决策。该技术延续了传统的内存管理系统的功能——通过内存效能,甚至当数据量超出内存容量时——也使数据更快捷地下载到随机存取存储器上,而不是硬盘上。在测试过程中,结合使用BLU Acceleration的创新功能,很多查询功能在单项分析负载中运行速度比以往要快到1000倍以上。
BLU Acceleration的革新技术包括了“数据忽略(data skipping)”,即略过那些分析中不需要的数据,比如重复性的信息。它还可以分析跨处理器的并联数据,并且不通过开发数据建模的隔离层,便可更直接地对应用程序进行数据分析。BLU Acceleration另外一个显著优势叫做“可行性压缩(actionable compression)”,可以让数据在整个分析过程中保持压缩状态。
客户例证:
BNSF铁路公司是北美地区***的货运铁路运输公司之一。该公司正在采用IBM BLU Acceleration,以更快地了解该公司1700台服务器产生的海量数据,这些服务器追踪记录维护、气象、调度,库存、安全、交付等信息。BNSF的业务分布于美国的28个州和加拿大的两个省,每天运营超过1,400辆列车,运营总里程为32500英里。
“美国当地以及世界各地的人们每天都在使用BNSF运送的众多产品和材料,所以如何追踪这些货品对于公司而言起着至关重要的作用。”BNSF铁路公司数据库解决方案架构师Kent Collins先生表示,“凭借与IBM开展的合作,我们现在可以轻松分析公司的大数据信息。得益于这项新技术,公司执行任务的速度比以前更快,例如查询速度提高了100倍以上,存储消耗却减少到原来的十分之一。BLU Acceleration的便捷操作让我们尤其欣赏,操作时只需要加载数据和运行查询即可。”
IBM创新大数据解决方案:让大数据处理变得简易方便,更适合企业应用
IBM针对大数据发布的新产品进一步扩展了业内***大的大数据技术和解决方案组合,涵盖了软件、服务、科研和硬件。IBM大数据平台整合了传统的数据仓库技术和全新的大数据技术,例如Hadoop、流计算、数据探索、分析和企业集成,以期创建综合性解决方案来满足用户的关键需求。除BLU Acceleration和PureData for Hadoop之外,IBM***发布还包括多个大数据解决方案版本更新:
新版InfoSphere BigInsights,这款企业级Hadoop产品可以利用现有的SQL技术,更便捷地开发应用组件。同时,它还具有安全性强和高可用性特点,这两点对企业应用来说至关重要。BigInsights提供了三个接入点:免费下载、企业软件和目前的专家级集成系统,即IBM PureData for Hadoop。
新版InfoSphere Streams,这款独特的流计算软件可以实时分析海量的动态数据,不仅功能更加强大,其应用程序的开发和部署也更加简单。
新版Informix,含TimeSeries Acceleration,适用于智能仪表和传感器数据的运行报告和分析。