数据仓库是一个面向主题的、集成的、随时间变化的,但信息本身相对稳定的数据组合,它为管理决策过程提供信息支持。这些特点决定了数据仓库的系统规划与设计不能采用同开发传统的OLTP数据库一样的规划和设计方法。
数据仓库的规划主要产生建设数据仓库的策略规划,确定建立数据仓库的长期计划,并为每一建设阶段设定目标、范围和验证标准。
数据仓库的策略规划包括:
·明确用户的战略远景、业务目标。
·确定建设数据仓库的目的和目标。
·定义清楚数据仓库的范围、优先顺序、主题和针对的业务。
·定义衡量数据仓库成功的要素。
·定义精简的体系结构、使用技术、配置、容量要求等。
·定义操作数据和外部数据源。
·确定建设所需要的工具。
·概要性地定义数据获取和质量控制的策略。
·数据仓库管理、元数据管理、数据访问、测试和培训策略。
其中非常重要的一条就是业务目标,前面谈到,建设数据仓库的目的就是通过集成不同的系统信息为企业提供统一的决策分析平台,帮助企业解决实际的业务问题(例如,如何提高客户满意度和忠诚度,降低成本、提高利润,合理分配资源,有效进行全面绩效管理等)。因此在规划数据仓库是要以应用驱动,充分考虑如何满足业务目标。
数据仓库体系的建设将是一个系统工程。它的规划、设计、开发、投产、改造将是一个循环往复、长时期的工作,数据仓库的建设过程中应该遵循:在大中心的模式下,实现信息集中管理、统筹规划、整体设计、分布实施的原则。同时,在系统实施过程中要体现“统一规划、统一标准、统一选型、统一开发”的“四统一原则”。建成的数据仓库体系应满足以下4点:
(1)全面的:必须满足企业个管理职能部门的业务需求,提供全套产品,提供服务与支持,以及拥有能提供补充产品的合作伙伴。所有这些,才能确保数据仓库能满足现在及将来的特殊要求。一个全面的解决方案是在技术基础上延伸,包括分析应用,从而使业务人员能真正从数据仓库系统中获益,提高企业运作效率,扩大市场以及平衡两者间的关系。
(2)完整的:必须适合现存的环境,它必须提供一个符合工业标准的完整的技术框架,以保证系统的各个部分能协调一致地工作。
(3)不受限制的:必须适应变化,必须能迅速、简单地处理更多的数据及服务更多的用户,以满足不断增长的需求。
(4)最优的:必须在企业受益、技术及低风险方面经过验证,必须在市场上保持领先地位,具有明显的竞争优势和拥有大量的合作伙伴产品。