MySQL 查询重复数据,删除重复数据保留id最小的一条作为唯一数据

数据库 MySQL
很多东西都是需要自己一步一步的去探究的,当然网上的建议也是非常宝贵的借鉴和资源,无论做什么开发我们都需要理解它的工作原理才能够更好的掌握它。

开发背景:

最近在做一个批量数据导入到MySQL数据库的功能,从批量导入就可以知道,这样的数据在插入数据库之前是不会进行重复判断的,因此只有在全部数据导入进去以后在执行一条语句进行删除,保证数据唯一性。

实战:

表结构如下图所示:

表明:brand

图片

操作:

使用SQL语句查询重复的数据有哪些:

SELECT * from brand WHERE brandName IN(
select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1 #条件是数量大于1的重复数据
)

使用SQL删除多余的重复数据,并保留Id最小的一条唯一数据:

注意点:

错误SQL:DELETE FROM brand WHERE brandName IN (select brandName from brand GROUP BY brandName HAVING COUNT(brandName)>1) 
AND Id NOT IN (select MIN(Id) from brand GROUP BY brandName HAVING COUNT(brandName)>1)

提示:You can't specify target table 'brand' for update in FROM clause   不能为FROM子句中的更新指定目标表“brand”

原因是:不能将直接查处来的数据当做删除数据的条件,我们应该先把查出来的数据新建一个临时表,然后再把临时表作为条件进行删除功能

正确SQL写法:

DELETE FROM brand WHERE brandName IN (SELECT brandName FROM (SELECT brandName FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) e)
AND Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName HAVING COUNT(brandName)>1) t)

#查询显示重复的数据都是显示最前面的几条,因此不需要查询是否最小值

更加简单快捷的方式:

这是老飞飞的前辈给了一个更加方便,简洁的写法(非常感谢大佬的方法):

DELETE FROM brand WHERE Id NOT IN (SELECT Id FROM (SELECT MIN(Id) AS Id FROM brand GROUP BY brandName) t)

这句的意思其实就是,通过分组统计出数据库中不重复的最小数据id编号,让后通过 not in 去删除其他重复多余的数据。

结果如下图:

图片

总结:

很多东西都是需要自己一步一步的去探究的,当然网上的建议也是非常宝贵的借鉴和资源,无论做什么开发我们都需要理解它的工作原理才能够更好的掌握它。

责任编辑:武晓燕 来源: 追逐时光者
相关推荐

2023-02-26 23:31:01

SQL数据库

2011-04-13 13:05:14

重复数据删除

2024-08-19 09:43:00

2021-11-30 10:00:01

SQL数据重复

2016-08-05 14:33:19

MySQL索引数据库

2011-04-13 13:13:09

重复数据删除

2022-08-04 08:22:49

MySQL索引

2010-11-03 13:50:49

DB2删除重复数据

2015-10-23 16:40:21

DB2删除数据

2010-07-07 16:53:54

SQL Server重

2011-03-10 15:06:02

重复数据删除技术

2009-02-27 10:18:41

重复数据删除In-linePost-Proces

2013-10-18 10:59:30

大数据Sepaton

2011-04-13 10:36:24

重复数据删除

2010-07-26 09:55:55

SQL Server重

2011-03-14 15:47:33

Oracle数据库

2010-07-21 11:38:59

SQL Server重

2010-07-08 13:06:05

SQL Server删

2010-07-26 14:58:26

SQL Server删

2010-04-28 10:13:37

Oracle删除重复数
点赞
收藏

51CTO技术栈公众号