Star Schema的设计思路与总结

数据库
本文我们主要介绍一下Star Schema的设计思路,并对其进行了总结,介绍了其中的两种方法:简单方法和bridge方法,希望能够对您有所帮助。

Star Schema设计思路是本文我们主要要介绍的内容,在实际工作中,遇到的数据通常是很不规则的,类似于xml,有很多一对多的关系。例如一个商品,可以有很多种税,有几个累加的折扣,每个折扣又有一些信息,例如折扣的原因,折扣率之类。在《Star Schema The Complete Reference》中提到了两种经典的做法来解决一对多的关系。

1.简单方法

用税来举例子,如果税的类型数是固定的,例如一个商品最多6种税。就把这六种税在fact table中放置6个外键,指向税的dimension table。其实如果是column database,加属性应是很快的,所以即使税的种类不定,应该也可以处理。这种方法的问题很明显,就是导致fact table的属性过多。

2. bridge方法

做一个中间表,即bridge表,只有两个属性:groupid和taxid, 一个groupid对应fact table中的一个item, 一个 taxid对应一个group中一种税。taxid对应到tax dimension table的表中的一行。如果需要加税的种类,直接在 tax dimension table里加就可以了。这样就可以应用到tax 种类数量不清楚的情况。

但bridge方法在join fact table和 tax dimension table时可能会出多次计算的错误。

现实中的情况和书本中总是有区别的,早上和老板讨论,对于海量数据而言,bridge table可能非常大,使得join 性能很低,所以bridge对于海量数据而言可用性不大。

对于实际应用中raw data 转化为数据仓库中的Star Schema,可能遇到很多书本中没有的问题。其实Peter提出的flatten table方法可以最直观,最完整,最方便的展现数据的信息。但是对数据库的NULL值优化处理要求很高。一着是对NULL的存储压缩,二者是对数据的索引优化时对NULL的处理,三者是查询性能。

而当面对很多一对N的多层关系时,N是否是定值或者是有最大值尤其重要,在行式数据库中,只有N有限制或为定值才能使用上述简单方法,而对于bridge,性能和查询的正确性又是问题。这是一个取舍的难题。

关于Star Schema设计思路与总结就介绍到这里了,希望本次的介绍能够对您有所收获!

【编辑推荐】

  1. Oracle 10g正则表达式REGEXP_LIKE简介
  2. Oracle 10g监听listener不能启动的解决方案总结
  3. Oracle 10g Shrink Table和Shrink Space使用详解
  4. Oracle 10g利用utlsampl.sql创建scott用户及样本数据
  5. Oracle 10g透明网关访问SQL Server 2000之配置监听

 

责任编辑:赵鹏 来源: CSDN博客
相关推荐

2012-02-01 14:28:03

Java线程

2019-12-20 14:21:26

JVM调优垃圾回收

2014-06-11 10:29:03

2011-11-18 15:18:41

Junit单元测试Java

2012-08-09 09:42:23

HadoopNoSQL实施

2009-09-01 15:08:07

C#命名规范

2021-09-13 07:58:52

考试算法PAT

2009-08-28 17:00:50

C# for

2012-05-07 10:40:57

阿里巴巴去IOE

2015-09-02 10:26:22

梦幻西游社交

2018-11-26 08:49:42

CPU排查负载

2012-11-28 14:09:41

2023-06-19 07:27:50

网易严选全链路

2021-05-31 16:09:31

MySQLSchema设计

2020-11-05 09:04:52

MySQL随机恢复

2013-05-14 10:05:10

Android开发游戏设计

2013-07-05 16:37:50

数据丢失故障排查

2018-05-21 08:07:35

聚合MongoDBSchema

2022-07-29 09:35:25

WAF溯源识别

2017-12-27 14:09:47

云计算数据中心混合云
点赞
收藏

51CTO技术栈公众号