【51CTO专访报道】企业客户正在越来越看中供应商的整体解决方案交付能力,大数据也不例外。企业需要的是涉及数据的获取、存储、分析等众多技术与应用的集合。只能提供某一单一技术方案的IT公司,会在大数据需求不断爆发的过程中,接受挑战。在技术门槛较高的大数据领域,有着传统优势的厂商是否能够依然占据主流,加速推动资源的整合、优化,提出端到端的一体化解决方案正变的尤为重要。
微软全球卓越中心PDW组总监Russ Cavan近日接受51CTO记者专访时特别提到,微软也在接受大数据所带来的挑战,不过微软有备而来。2010年微软***推出了基于SQL Server 2008 R2的数据库一体机,目前已经发布了四个更新版本,并且微软即将在2013年初正式推出基于SQL Server 2012的并行数据仓库一体机PDW。
微软全球卓越中心PDW组总监Russ Cavan
PDW是针对企业数据仓库、高度可扩展而设计的软硬一体机设备,采用“大规模并行处理”(MPP)体系结构。在数据处理方面基于SQL Server 2012的并行数据仓库提供了全新的PolyBase数据处理技术,实现了用SQL语句对传统关系型数据库表与非关系型Hadoop数据表的统一查询,并能够在前端使用常用的Office工具比如Excel进行BI分析的操作和展示。
PDW采用了 xVelocity 列存储技术,查询速度提升近10~50倍、满足实时数据仓库的需求,高密度 Direct Attached Storage,存储容量提升7倍,横向扩展可以实现从几个TB到6PB的线性扩展。“由于是软硬件一体机,内部经过了深度的优化整合,提升性能的同时,架构设计使得总体成本降低,PDW能够实现业界每TB更低的成本。”微软中国高级产品市场经理郝雪莹谈到:“我们用1PB的数据仓库测试,SQL语句只需要1.5秒就完成了查询。”
目前PDW的硬件合作伙伴为惠普和戴尔,由于软硬件一体,并行数据仓库一体机只需要很少的调整和优化,实现了开箱即用,安装速度和加载数据的速度较快,在服务器调整和优化上也仅需很少时间,缩短部署时间、减少工作量和降低成本。此外,还能够运行大规模查询,企业可以运行更多报表、完成更复杂的分析、处理更大的数据集以及分析更详细的数据。国家审计总署已经选择成为PDW在国内的***家部署用户
微软高级数据仓库架构师乔怡与51CTO记者交流中介绍:“现在的审计业务,面临的数据总量已经上升为TB级、甚至PB级,并且数据查询分析的复杂性也在不断提高。同时,审计需求本身为具有随机性和突发性,审计人员需要根据判断进行海量数据的查询、汇总和关联分析,这就需要针对大数据的统一高度和并行访问,并需要多种计算模式和分析方法,同时满足宏观或特定审计目标。与此同时,更加无法忽视“时效性”的要求,审计署的处理效率受到更为严苛的挑战。”
微软高级数据仓库架构师乔怡
来自微软全球卓越中心PDW组的架构师Brian Walker分享说,他曾负责给大型美国连锁超市HyVee实施过PDW项目,仅用了1天时间就完成了设备的部署和数据导入,并且与原有的数据库平台保持兼容,进入生产使用。PDW并行数据仓库一体机以更为容易部署的方式搭建分布式存储和计算集群,在统一的架构下实现对各种类型和各种规模数据的管理和并行处理,根据需求实现灵活扩展,支持TB/PB级数据的高效加载,满足多源异构数据的即席查询、联合查询和复杂关系处理,对大规模审计数据进行快速、深入的分析和挖掘,将成为微软在大数据战略上重要的战略布局。