分析数据库是为报表、仪表板和即席查询等提供业务数据从而驱动商业智能运作的主要引擎。
虽然分析数据库不可或缺,但在商业智能产业最近几年掀起的一体化狂潮中,很大程度上已经忽视了分析数据库的重要性。在以比比皆是的数据仓库为核心的世界里,这些数据存储器仅仅被看作是输送导管,而不是区分不同平台的组件。最近在供应商意愿的带动下,绝大多数商业智能的一体化都以增强商业分析应用,或向商业智能平台添加更先进的可视化、搜索和其他面向数据访问等特性为目标。
不过,分析数据库在未来的几年里肯定会成为评定一个商业智能解决方案优劣的关键区分指标。随着核心商业智能特性商品化的趋势,越来越多的供应商会将速度、可扩展性、高通量和对混合负载的支持这些只有调试良好的高级分析数据库才能提供的特性作为自己的软件产品与别不同的卖点。
每一个商业智能软件供应商都会夸耀自己的分析数据库能够比其竞争对手的产品处理更多并发用户,能够执行更多复杂多维查询,能够更迅速地加载批量数据,能够进行更复杂的计算密集型转化,能够管理更大规模的数据集。同样,他们还会展开价格战,鼓吹自己产品比对手的产品性能更加全面且更加物美价廉。
在越来越商品化的商业智能市场里,分析的性价比成为了主要的购买指标。这种趋势带动业界日益重视分析设备的发展,也就是商业智能设备或数据仓库设备的发展。
事实上,大多数领先的商业智能供应商,如SAP(包括Business Objects)、IBM(包括Cognos)、甲骨文、微软和SAS等,都有向市场提供自己的分析设备,也有的正在自行研发或和合作伙伴一起开发基于这类分析设备的产品。
虽然这些供应商会继续提供商业智能和数据仓库解决方案作为软件包产品,不过他们都已经看准了客户需求的方向——将分析设备作为总体解决方案具有很大的吸引力。特别是中型市场客户,对这类设备的兴趣非常浓厚,他们认为这些设备能够为他们提供快速部署预先优化的解决方案,并解除了技术人员匮乏的负担。
随着分析设备成为企业商业智能战略的核心,数据仓库设备将依靠自己的技术特性进化成为完全成熟的商业智能平台。Teradata、惠普、Netezza、Greenplum、DATAllegro、Dataupia和ParAccel等设备供应商都将扩展其执行“数据库内分析”的能力,并自行研发、或与合作伙伴和客户一起开发其他的应用。
设备供应商们会在数据库特性优化技术上一决雌雄,如索引技术、分区技术、内存缓存技术、压缩技术、立方体技术、断词(tokenization)技术和查询计划优化技术等等用来管理各种分析任务的技术。而且,所有的设备供应商都会通过大规模并行处理、集群技术、任务管理以及其他的特性来强化其硬件的可扩展性。
此外,面向列数据库(一种非常适合于数据密集查询处理的存储机制)的供应商,如果不能重新围绕应用设备调整其市场准入战略,就会完全被分析市场所淘汰。
具备优化过的硬件的面向列数据库比只有软件的竞争对手具备非常明显的性能优势,以致于后者恐怕不得不将原有的市场份额拱手相让。此外,虽然大多数设备供应商避免使用面向列的存储方式,而更倾向于将传统的面向行的关系数据库管理系统用来进行多维联机分析处理,但他们会将这种存储技术作为备用技术为将来进一步提升性能所用。
市场对价格低廉而功效显著的分析技术日益增长的需求也将促进基于订阅模式的数据仓库服务的发展,这种模式也称为DW 2.0、数据库2.0、云数据库(cloud database)或按需数据库(on-demand database)。微软虽然不是第一个登上这个新技术舞台的角色,但在这个舞台上却是表现最为突出的一个,已经在近期推出了SQL Server数据服务(SSDS)的有限测试版,并预计在2009年全面投放市场。在SQL Server数据服务中,微软将SQL Server关系数据库管理系统功能的一个子集用来支持分析和事务应用。虽然微软还没有特别地为分析而优化SSDS,不过微软已经表示将会向这个方向发展这项服务。
随着越来越多的服务供应商开展DW2.0服务,DW2.0时代将不断的出现价格更低廉,分析能力更强劲的服务。在未来十年内,软件即服务供应商将开始为高性能、高容量的复杂分析提供功能完善的基于订阅的商业智能或数据仓库服务。这些“云服务”将充分利用微软、Google和其他“软件即服务”供应商所带来的完全虚拟化、分布式、可扩展网格计算工具,用于数据挖掘、性能优化和其他计算密集型和数据密集型任务。
相信在不久的将来,利用DW2.0进行分析就像利用互联网一样普遍。不管是在生意场还是在我们的日常生活中,只要有需要,我们就可以用它来处理任何决策支持的任务,不管是大任务还是小任务。
【编辑推荐】