详解如何删除SQL Server表中的重复行

数据库 SQL Server 数据库运维
Microsoft SQL Server 表不应该包含重复行和非唯一主键。为简洁起见,在本文中我们有时称主键为“键”或“PK”,但这始终表示“主键”。重复的 PK 违反了实体完整性,在关系系统中是不允许的。SQL Server 有各种强制执行实体完整性的机制,包括索引、唯一约束、主键约束和触发器。

如果表中有多组完全不同的重复的 PK 值,则逐个删除它们会很费时间。在这种情况下,可使用下面的方法:

 1.首先,运行上面的 GROUP BY 查询来确定有多少组重复的 PK 值及每组的重复数。

2.选择重复的键值放入临时表中。例如:

SELECT col1, col2, col3=count(*) 
INTO holdkey
FROM t1
GROUP BY col1, col2
HAVING count(*) > 1

3.选择重复的行放入临时表中,以清除进程中的重复值。例如:

SELECT DISTINCT t1.* 
INTO holddups
FROM t1, holdkey
WHERE t1.col1 = holdkey.col1
AND t1.col2 = holdkey.col2

4.此时,holddups 表应有唯一的 PK;但是,如果 t1 有重复的 PK 而行唯一(如上面的 SSN 示例),情况就不是这样了。请验证 holddups 中的各个键是否唯一,是否没有键重复而行唯一的情况。如果是这样,您必须停在该处,确定对于给定重复的键值,您希望保留哪些行。例如,以下查询:

SELECT col1, col2, count(*) 
FROM holddups
GROUP BY col1, col2

应为各行返回计数 1。如果结果是 1,请继续执行下面的步骤 5。如果不是 1,则存在键重复而行唯一的情况,且需要您决定要保存哪些行。通常,这将需要舍弃行或为此行创建新的唯一的键值。为 holddups 表中每个此种重复 PK 执行这两个步骤之一。

5.从原始表中删除重复的行。例如:

DELETE t1 
FROM t1, holdkey
WHERE t1.col1 = holdkey.col1
AND t1.col2 = holdkey.col2

6.将唯一行放回原始表中。例如:

INSERT t1 SELECT * FROM holddups 

【编辑推荐】

  1. 使用检查约束验证SQL Server中的数据
  2. 浅谈SQL Server数据库并发测试方法
  3. 浅谈如何优化SQL Server服务器
责任编辑:彭凡 来源: 51CTO
相关推荐

2010-06-28 12:46:09

SQL Server

2010-09-01 16:47:18

SQL删除

2010-07-12 09:52:24

删除 SQL Serv

2010-10-22 16:29:11

SQL Server删

2010-11-10 11:27:40

SQL Server重

2010-07-07 16:53:54

SQL Server重

2010-09-02 11:34:51

SQL删除

2009-09-14 13:17:51

LINQ to SQLLINQ to SQL

2010-11-11 09:20:46

SQL Server创

2010-09-02 10:36:51

SQL删除

2010-07-02 13:50:11

SQL Server数

2010-09-02 11:14:39

SQL删除日志

2010-11-10 11:37:29

SQL Server删

2010-09-02 16:28:03

SQL删除

2010-09-01 15:30:24

SQL删除

2010-07-26 09:55:55

SQL Server重

2010-09-08 09:41:37

SQL删除注册表

2010-07-21 11:38:59

SQL Server重

2010-07-08 13:06:05

SQL Server删

2010-07-26 14:58:26

SQL Server删
点赞
收藏

51CTO技术栈公众号