SQL删除表中重复数据的两种方法

数据库 SQL Server
SQL有自增的ID列,表中有一些记录内容重复,如何删除这些重复的数据呢?下面将为您介绍两种删除的方法,供您参考。

SQL表中如果出现重复的记录,就需要进行删除,下面将为您介绍其中的两个版本方法,供您参考,希望对您有所帮助。

版本一:由于记录有自增列,所以自增列可以做为记录的唯一标识,由此可见,重复的记录的自增ID是一个递增关系,这里我们可以只保留ID最小的那条记录,其它的全部删除。利用一个嵌套语句就非常容易写出下面的SQL。其中的sname,saddress是记录除了ID外的所有列。

DELETE  FROM a
WHERE   id NOT IN ( SELECT  MIN(id)
                    FROM    a
                    GROUP BY sname,
                            saddress )

 版本二:充分利用SQL05的几个比较实用的特性。这里先简单说说要用到的几个特性。详细用法可到网上搜索下。

 1:ROW_NUMBER,它的作用就是用来生成行号,默认是从1开始。

2:公用表表达式(CTE),我这里并不会利用它的递归,而是用它来简化嵌套查询及对表自身引用功能。CTE的语法如下:

[ WITH [ ,n ] ]
::=
        expression_name [ ( column_name [ ,n ] ) ]
    AS
        ( CTE_query_definition )

说明:1>CTE在某种程序上相当表变量或者临时表的功能。但比起表变量来说它***的优势是对自身的引用,CTE语句后面紧跟的select ,update,delete等,操作的结果都会直接反应的实际物理表中。相比临时表,***优势无非是性能,临时表实际是一张物理存在的表,在对它进行操作时,会产生额外的IO开销以及管理上的开销。

2>CTE语法后面需要直接跟上使用CTE的相关语句select ,update,delete等,否则CTE会失效,下面的语句是错误的:

WITH   b AS ( SELECT   ROW_NUMBER() OVER ( PARTITION BY sname, saddress ORDER BY sname, saddress ) AS rn,
                        *
               FROM     a
             )
    DELETE  FROM b
    WHERE   rn > 1
 SELECT * from a
 SELECT * FROM b WHERE rn>1
3:PARTITION BY,分区函数。和聚合函数不同的地方在于它能返回一个分组中的多条记录,聚合函数一般只有一条反映统计值的记录,partition  by用于给结果集分组,如果没有指定那么它把整个结果集作为一个分组 。

经过上面的三个关键字的介绍后,下面给出三者相结合后的结果。

WITH   b AS ( SELECT   ROW_NUMBER() OVER ( PARTITION BY sname, saddress ORDER BY sname, saddress ) AS rn,
                        *
               FROM     a
             )
    DELETE  FROM b
    WHERE   rn > 1
版本一和版本二比较:

1:版本二更加容易阅读。

2:版本二性能较版本一强。我们可以通过以以信息来看。可以看到版本一会发生两次表扫描。

Table 'a'. Scan count 2, logical reads 4, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.
Table 'Worktable'. Scan count 1, logical reads 0, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

(0 row(s) affected)
Table 'a'. Scan count 1, logical reads 2, physical reads 0, read-ahead reads 0, lob logical reads 0, lob physical reads 0, lob read-ahead reads 0.

(0 row(s) affected)



 

责任编辑:段燃 来源: 互联网
相关推荐

2010-07-01 12:29:27

SQL Server重

2010-11-12 11:44:37

SQL Server删

2021-11-30 10:00:01

SQL数据重复

2024-10-16 18:09:54

2010-09-01 16:47:18

SQL删除

2024-06-17 07:41:43

2010-11-24 14:36:25

修复mysql表

2011-05-24 10:54:15

数据库重复数据删除

2010-11-10 13:22:41

SQL Server备

2010-11-09 13:09:58

SQL Server分

2010-09-13 13:05:03

sql server分

2011-03-14 15:47:33

Oracle数据库

2010-07-07 16:53:54

SQL Server重

2010-09-28 15:46:22

SQL删除重复记录

2009-08-17 08:29:00

c#删除指定文件

2010-07-26 09:55:55

SQL Server重

2010-07-21 11:38:59

SQL Server重

2010-07-08 13:06:05

SQL Server删

2010-07-26 14:58:26

SQL Server删

2010-11-16 16:36:40

Oracle删除用户
点赞
收藏

51CTO技术栈公众号