巧用SQL进行数据累加

数据库
对数据进行累加的方法有很多种。经常用的就是Excel的的累加功能。本文中笔者巧妙的利用SQL对数据进行累加。

比如有这样一个需求,一张表格(User_Salary)包含每个人(UserName)每个月份(Month)发的薪水(Salary)

求这样一个结果集:每个人每月所发薪水及累计所得薪水和,如下表

UserName Month Salary
AAA 2010/12 1000
AAA 2011/01 2000
AAA 2011/02 3000
BBB 2010/12 2000
BBB 2011/01 2500
BBB 2011/02 2500

结果

UserName Month Salary Cumulation
AAA 2010/12 1000 1000
AAA 2011/01 2000 3000
AAA 2011/02 3000 6000
BBB 2010/12 2000 2000
BBB 2011/01 2500 4500
BBB 2011/02 2500 7000

当然这个结果在Excel中十分好实现,只需要一个公式就好:

注意G2的公式一定要保持***个列不动所以就是$F$2:F2,然后向下拖一下就可以,但是,这只适用于数据固定的情况下,试想,如果有100个员工的数据,岂不是要拖100下。当然也可能有其他办法,这个我就不知道了。

下面,如果用sql实现能有什么办法呢?首先想到的是游标。

对游标的确可以实现,写程序也可以实现,因为他们的思想是一样的:判断一下名字是不是已经遍历过了,如果遍历过了,就累加一下,如果没有就从0加起。这样很好理解,但是写的很费时,其实一条sql语句就可以实现的,那就是子查询。

 

  1. create table User_Salary (UserName nvarchar(200), Month nvarchar(20), Salary int)     
  2.       
  3. go     
  4.       
  5. insert into User_Salary (UserName,Month,Salary ) values('AAA','2010/12',1000)     
  6. insert into User_Salary (UserName,Month,Salary ) values('AAA','2011/01',2000)     
  7. insert into User_Salary (UserName,Month,Salary ) values('AAA','2011/02',3000)     
  8. insert into User_Salary (UserName,Month,Salary ) values('BBB','2010/12',2000)     
  9. insert into User_Salary (UserName,Month,Salary ) values('BBB','2011/01',2500)    
  10. insert into User_Salary (UserName,Month,Salary ) values('BBB','2011/02',2500)    
  11.      
  12. go    
  13.      
  14. select UserName,Month,Salary,    
  15.     Cummulation=(    
  16.         select SUM(Salary)     
  17.         from     
  18.             User_Salary i    
  19.         where     
  20.             i.UserName=o.UserName and i.Month<=o.Month    
  21.         )    
  22. from User_Salary o    
  23. order by 1,2    
  24.      
  25. go    
  26.      
  27. drop table User_Salary 

大家知道SQL查询的结果是面向集合,而这种嵌套的子查询恰恰就是在整个结果集返回之前做的对于每一行的运算。也许这样的写法不是很容易理解,那么下面这个写法应该容易理解多了。

  1. create table User_Salary (UserName nvarchar(200), Month nvarchar(20), Salary int)    
  2.       
  3. go    
  4.    
  5. insert into User_Salary (UserName,Month,Salary ) values('AAA','2010/12',1000)    
  6. insert into User_Salary (UserName,Month,Salary ) values('AAA','2011/01',2000)    
  7. insert into User_Salary (UserName,Month,Salary ) values('AAA','2011/02',3000)    
  8. insert into User_Salary (UserName,Month,Salary ) values('BBB','2010/12',2000)    
  9. insert into User_Salary (UserName,Month,Salary ) values('BBB','2011/01',2500)   
  10. insert into User_Salary (UserName,Month,Salary ) values('BBB','2011/02',2500)   
  11.     
  12. go    
  13.      
  14. select    
  15.      A.UserName,A.Month,MAX(A.Salary) as Salary,SUM (B.Salary) as Accumulation    
  16. from   
  17.      User_Salary A inner join User_Salary B   
  18.  ON    
  19.      A.UserName = B.UserName   
  20.  where    
  21.      B.Month <= A.Month   
  22.  group by   
  23.      A.UserName,A.Month   
  24. order by       
  25.      A.UserName,A.Month   
  26.      
  27. go   
  28.      
  29. drop table User_Salary 

这样用联合的方式就好理解一些,其实这样就是把每一行对应比他月份小的值分成一组,然后进行运算,如果这样不明白,那么下面的sql会使这个查询更加好理解:

  1. select     
  2.    A.*,B.*    
  3. from     
  4.    User_Salary A inner join User_Salary B    
  5. ON     
  6.    A.UserName = B.UserName     
  7. where     
  8.    B.Month <= A.Month     
  9. order by 1,2 

这样的结果就显而易见了

 

这就是子查询相关的递归(可以这么说?)算法。

 子查询执行计划

join执行计划

通过上述2个执行计划,虽然执行计划不同,但大体一致,这其中的区别我就不太明白了(不知道是先排序再join好 还是先join在排序好,但是我个人觉得第二种比较容易理解.).

原文出处:http://www.cnblogs.com/mylhei/archive/2011/03/09/1978184.html

【编辑推荐】

  1. MySQL技巧:结合相关参数 做好Limit优化
  2. SQL Server数据库六种数据移动方法
  3. MySQL数据库的优化(上)单机MySQL数据库的优化
  4. MySQL数据库的优化(下)MySQL数据库的高可用架构方案
  5. MySQL数据库安全解决方案
责任编辑:艾婧 来源: 博客园
相关推荐

2016-08-21 15:02:47

APP推广数据分析数据统计工具

2011-08-02 15:39:30

SQL Server iSql

2020-12-14 13:24:17

PandasSQL数据集

2023-05-05 19:16:22

Python数据清洗

2017-10-31 11:55:46

sklearn数据挖掘自动化

2024-07-26 21:36:43

2021-12-28 11:23:36

SQLServerExcel数据分析

2010-09-26 10:35:47

sql替换语句

2023-05-05 19:29:41

2019-09-30 10:12:21

机器学习数据映射

2019-09-27 12:44:03

数据建模企业数据存储

2013-06-08 14:50:10

rman数据恢复

2022-06-02 13:59:57

数据迁移数据

2022-11-02 14:45:24

Python数据分析工具

2009-09-08 16:50:12

使用LINQ进行数据转

2009-03-16 10:29:45

数据挖掘过滤器Access

2011-03-17 13:23:08

数据导入导出

2010-09-16 17:56:31

SQL server临

2022-04-15 10:36:11

数据治理企业

2019-01-15 14:21:13

Python数据分析数据
点赞
收藏

51CTO技术栈公众号