最近出的每日一题里面,有一道是关于合并同类型数据为一行的题,使用SQL Server 2017版本及以上的直接使用STRING_AGG()函数即可,但是2016版本以下是没有这个功能的,那该如何求解?
今天就给大家介绍一下FOR XML PATH,它就是用来处理低版本数据库中数据合并的,是一个比较古老的功能了,新版本中也依然还能使用。
FOR XML PATH是什么
FOR XML PATH 是将查询结果集以XML形式展现,将多行的结果,展示在同一行。
我们用实例来给大家介绍它的神奇之处。
创建测试数据
我们创建一个统计学生爱好的表
- CREATE TABLE Stu_Hobby(
- Stu_Name NVARCHAR(20),--姓名
- Age INT,--年龄
- Hobby NVARCHAR(20) --爱好
- )
- INSERT INTO Stu_Hobby
- VALUES ( N'张三',19,N'踢足球'),
- ( N'张三',19,N'打篮球'),
- ( N'张三',19,N'游泳'),
- ( N'李四',21,N'看电影'),
- ( N'李四',21,N'阅读'),
- ( N'王五',22,N'唱歌'),
- ( N'王五',22,N'玩游戏'),
- ( N'马六',19,N'踢足球'),
- ( N'赵七',20,N'爬山'),
- ( N'赵七',20,N'跑步')
查询学生爱好表Stu_Hobby里面的数据:
使用方法介绍
测试数据建立好后,我们开始对这个表里面的数据进行查询,并使用上FOR XML PATH。
- SELECT *
- FROM dbo.Stu_Hobby FOR XML PATH;
结果如下:
它会生成一段XML代码,我们点击这行代码会弹出一整个XML的页面,由于篇幅较长,我们只截取一部分,具体如下:
此外我们还可以在FOR XML PATH的后面写参数,如果后面接参数,会将节点换成参数名称,例如:
- SELECT *
- FROM dbo.Stu_Hobby FOR XML PATH(hobby)
结果如下图:
已经变成了我们添加的参数了。
跟我们实际需求相接近的是下面这个功能
我们可以单独输出某个字段的值,例如我们想看看学生爱好表中Hobby这一列具体有一些什么值,可以这样写:
- SELECT Hobby+'、'
- FROM dbo.Stu_Hobby FOR XML PATH('')
注意:上面的+是字段拼接,就是将两个字符串用+连成一个字符串。然后我们把XML中的给去掉。
结果如下:
可以看到我们写的所有爱好都给列出来了,没有去掉重复的,可以理解成把列里的值都显示出来了。
具体实际应用
我们现在想把上面的学生表里每个学生的爱好单独显示一行,爱好用"、"隔开。
- SELECT
- A.Stu_Name,
- A.Age,
- (SELECT Hobby+'、'
- FROM [dbo].Stu_Hobby
- WHERE
- --必须加的匹配条件
- Stu_Name=A.Stu_Name AND Age=A.Age
- FOR XML PATH('')) AS Hobby
- FROM [dbo].Stu_Hobby A
- GROUP BY A.Stu_Name,A.Age
见证奇迹的时刻到了!!!
对比我们先前建的表,这里已经将Hobby列的数据按每个学生变成了一行。
上面的WHERE条件是必须要的,如果去掉会怎么样呢?我们把WHERE条件注释掉看看会怎么样?
- SELECT
- A.Stu_Name,
- A.Age,
- (SELECT Hobby+'、'
- FROM [dbo].Stu_Hobby
- --WHERE
- --必须加的匹配条件
- --Stu_Name=A.Stu_Name AND Age=A.Age
- FOR XML PATH('')) AS Hobby
- FROM [dbo].Stu_Hobby A
- GROUP BY A.Stu_Name,A.Age
结果如下:
就会将Hobby列所有值都显示出来,很显然这不是我们要的结果
代码优化
不知道小伙伴们有没有发现Hobby列的结果尾部多了一个"、",看着好别扭,有没有什么办法将它去掉呢?答案是肯定的。
先用一个LEFT()和LEN()函数来处理一下Hobby列
- SELECT
- T.Stu_Name,
- T.Age,
- LEFT(T.Hobby,LEN(T.Hobby)-1) AS Hobby
- FROM
- (SELECT
- A.Stu_Name,
- A.Age,
- (SELECT Hobby+'、'
- FROM [dbo].Stu_Hobby
- WHERE
- --必须加的匹配条件
- Stu_Name=A.Stu_Name AND Age=A.Age
- FOR XML PATH('')) AS Hobby
- FROM [dbo].Stu_Hobby A
- GROUP BY A.Stu_Name,A.Age
- ) T
结果如下:
这样我们的需求就得到了完美解决,但是这个代码有点长额,能不能简短一点呀?答案也是肯定滴!在将代码精简之前,我们需要先给大家介绍一个配合使用的函数:
STUFF()
STUFF()函数的作用
STUFF()函数用于删除指定长度的字符,并可以在指定的起点处插入另一组字符。STUFF()函数中如果开始位置或长度值是负数,或者如果开始位置大于第一个字符串的长度,将返回空字符串。如果要删除的长度大于第一个字符串的长度,将删除到第一个字符串中的第一个字符。
STUFF()函数的语法
- STUFF ( character_expression , start , length ,character_expression )
参数解释
character_expression:一个字符数据表达式。character_expression 可以是常量、变量,也可以是字符列或二进制数据列。
start :一个整数值,指定删除和插入的开始位置。如果 start 或 length 为负,则返回空字符串。如果 start 比第一个 character_expression 长,则返回空字符串。start 可以是 bigint 类型。
length:一个整数,指定要删除的字符数。如果 length 比第一个 character_expression 长,则最多删除到最后一个 character_expression 中的最后一个字符。length 可以是 bigint 类型。
返回类型
如果 character_expression 是受支持的字符数据类型,则返回字符数据。如果 character_expression 是一个受支持的 binary 数据类型,则返回二进制数据。
注意事项
1、如果开始位置或长度值是负数,或者如果开始位置大于第一个字符串的长度,将返回空字符串。如果要删除的长度大于第一个字符串的长度,将删除到第一个字符串中的第一个字符。
2、如果结果值大于返回类型支持的最大值,则产生错误。
--以上信息来源微软官方文档
这定义看的头晕,我们还是来看看怎么使用吧
实例:
- SELECT STUFF('abcdefg',1,0,'1234') --结果为'1234abcdefg'
- SELECT STUFF('abcdefg',1,1,'1234') --结果为'1234bcdefg'
- SELECT STUFF('abcdefg',2,1,'1234') --结果为'a1234cdefg'
- SELECT STUFF('abcdefg',2,2,'1234') --结果为'a1234defg'
说了这么多,我们看看STUFF怎么解决我们上面的问题吧,上代码:
- SELECT
- A.Stu_Name,
- A.Age,
- STUFF(
- (SELECT '、'+Hobby
- FROM [dbo].Stu_Hobby
- WHERE
- --必须加的匹配条件
- Stu_Name=A.Stu_Name AND Age=A.Age
- FOR XML PATH('')
- ),1,1,'') AS Hobby
- FROM [dbo].Stu_Hobby A
- GROUP BY A.Stu_Name,A.Age
是不是比LEFT简短一些啦?我们看一下结果是不是我们想要的。
完美!
好了,FOR XML PATH就介绍到这里了,小伙伴可以对比以上两种优化的方法,自行比较哪种方式更加简单易懂。