SSAS中不同维度不同聚合的解决

运维 数据库运维 SQL Server
统计的需求总是很莫名其妙甚至看上去不合逻辑,但实际联系需求却又很合理。就算任何一家BI产品提供商恐怕也很难顾及到所有的需求,不过都会给我们留下变通解决的接口或者方法。

SSAS中的聚合方式设定:

SSAS一个Cube中的一个度量的聚合方式设置方法:

 

也就是说,Cube中的聚合方式是针对度量来指定的。

问题:

针对一种特殊的需求,要求先按照时间做平均聚合运算,再根据空间做求和运算。

其实这种说法字面上看起来本身就很矛盾,所以得套到一个具体的场景中。

比如:我有一个数据仓库统计某几个小区的某一时间粒度(这里定义成季度)的住户数量,里面的数据格式大致如下:

2011年1季度,1100,A小区

2011年2季度,1000,A小区

2011年3季度,1100,A小区

2011年4季度,1000,A小区

2011年1季度,1200,B小区

2011年2季度,1200,B小区

2011年3季度,1100,B小区

2011年4季度,1100,B小区

先从时间这个角度来分析数据,A小区在2011年的住户数,很明显应该是取平均值(当然也有取第四季度的值的统计方法,这里只考虑平均值的统计方法),应该是1050,B小区的就应该是1150。

然后再从空间的角度来分析数据,所有小区(这里假定只有A和B)的在2011年的住户数,应该是1050+1150=2200。很明显这是一个汇总算法。

这就是典型的先根据时间做平均运算,再根据空间做汇总运算,而且这里很明显,SSAS默认的聚合方式的指定是无法实现这种统计需求的。

解决方法:

通过计算公式,或者新建命名成员。

首先,建立测试表。

 

然后,根据这个DW结构建立测试Cube。

其中指标的聚合方式按照默认的Sum.

 

其中时间维度有如下的层次结构:

 

建立命名成员,表达式关键的部分是那个求叶级节点总和,从而求平均数的公式。

 

处理浏览

 

如图:纵向的时间聚合运算是用的平均值运算,而横向的区域聚合运算用的是求和运算。

需要注意的地方:

要留意维度中的null成员。默认是带null成员的,所以需要手动把null处理掉,否则会导致函数算出的数值不准确,因为Count出的数把null也算上了所以分母会加1。

总结:

统计的需求总是很莫名其妙甚至看上去不合逻辑,但实际联系需求却又很合理。就算任何一家BI产品提供商恐怕也很难顾及到所有的需求,不过都会给我们留下变通解决的接口或者方法。

原文链接:http://www.cnblogs.com/aspnetx/archive/2011/04/18/2020210.html

【编辑推荐】

  1. SSIS中的容器和数据流—数据转换
  2. MySQL数据库的优化(上)单机MySQL数据库的优化
  3. MySQL数据库的优化(下)MySQL数据库的高可用架构方案
  4. 利用keepalived构建高可用MySQL-HA
  5. 给数据减肥 让MySQL数据库跑的更快
责任编辑:艾婧 来源: 博客园
相关推荐

2011-08-15 10:51:25

SSAS父子维度

2010-12-23 13:56:55

SharePointIntranet

2009-07-02 13:40:45

面试

2021-11-16 07:52:24

前端技术编程

2013-08-27 12:42:42

浏览器

2010-11-30 11:00:10

数据中心指标

2017-05-02 08:09:26

Python重启机制

2021-05-07 10:45:37

网络安全网络犯罪黑客

2015-07-28 10:43:38

js\height\

2011-06-20 14:00:26

Qt qmake

2010-03-30 15:54:27

Oracle date

2024-08-06 16:28:57

2024-08-16 09:06:03

2011-03-30 08:27:48

C#

2010-07-06 16:08:51

HART协议

2010-09-08 15:07:24

SQL Server用户操作权限

2023-04-14 14:54:29

2010-08-17 15:21:17

IEFirefoxHTML

2010-10-29 11:05:44

职场

2010-01-20 11:15:38

CC++编译器
点赞
收藏

51CTO技术栈公众号