MySQL批量插入,如何不插入重复数据?

数据库 MySQL
业务很简单:需要批量插入一些数据,数据来源可能是其他数据库的表,也可能是一个外部excel的导入。

[[391866]]

 温故而知新

知识这个东西,看来真的要温故而知新,一直不用,都要忘记了。

业务很简单:需要批量插入一些数据,数据来源可能是其他数据库的表,也可能是一个外部excel的导入。

那么问题来了,是不是每次插入之前都要查一遍,看看重不重复,在代码里筛选一下数据,重复的就过滤掉呢?

向大数据数据库中插入值时,还要判断插入是否重复,然后插入。如何提高效率?

看来这个问题不止我一个人苦恼过。

解决的办法有很多种,不同的场景解决方案也不一样,数据量很小的情况下,怎么搞都行,但是数据量很大的时候,这就不是一个简单的问题了。

几百万的数据,不可能查出来去重处理!

说一下我Google到的解决方案。

1、insert ignore into

当插入数据时,如出现错误时,如重复数据,将不返回错误,只以警告形式返回。所以使用ignore请确保语句本身没有问题,否则也会被忽略掉。例如:

  1. INSERT IGNORE INTO user (name) VALUES ('telami')  

    这种方法很简便,但是有一种可能,就是插入不是因为重复数据报错,而是因为其他原因报错的,也同样被忽略了~

2、on duplicate key update

当primary或者unique重复时,则执行update语句,如update后为无用语句,如id=id,则同1功能相同,但错误不会被忽略掉。

例如,为了实现name重复的数据插入不报错,可使用一下语句: 

  1. INSERT INTO user (name) VALUES ('telami') ON duplicate KEY UPDATE idid = id  

这种方法有个前提条件,就是,需要插入的约束,需要是主键或者唯一约束(在你的业务中那个要作为唯一的判断就将那个字段设置为唯一约束也就是unique key)。

3、insert … select … where not exist

根据select的条件判断是否插入,可以不光通过primary 和unique来判断,也可通过其它条件。例如: 

  1. INSERT INTO user (name) SELECT 'telami' FROM dual WHERE NOT EXISTS (SELECT id FROM user WHERE id = 1)  

这种方法其实就是使用了mysql的一个临时表的方式,但是里面使用到了子查询,效率也会有一点点影响,如果能使用上面的就不使用这个。

4、replace into

如果存在primary or unique相同的记录,则先删除掉。再插入新记录。

REPLACE INTO user SELECT 1, 'telami' FROM books 

这种方法就是不管原来有没有相同的记录,都会先删除掉然后再插入。另外,关注公众号Java技术栈,在后台回复:面试,可以获取我整理的 MySQL 面试题和答案。

实践

选择的是第二种方式 

  1. <insert id="batchSaveUser" parameterType="list">  
  2.     insert into user (id,username,mobile_number)  
  3.     values  
  4.     <foreach collection="list" item="item" index="index" separator=",">  
  5.         ( 
  6.             #{item.id},  
  7.             #{item.username},  
  8.             #{item.mobileNumber}  
  9.         )  
  10.     </foreach>  
  11.     ON duplicate KEY UPDATE idid = id  
  12. </insert> 

这里用的是Mybatis,批量插入的一个操作,mobile_number已经加了唯一约束。这样在批量插入时,如果存在手机号相同的话,是不会再插入了的。

最后,关注公众号Java技术栈,在后台回复:面试,可以获取我整理的 Java、MySQL 系列面试题和答案,非常齐全。 

 

责任编辑:庞桂玉 来源: Java技术栈
相关推荐

2021-06-28 10:25:47

MySQL数据库重复数据

2021-09-14 13:15:43

MySQL数据库脚本

2013-04-01 15:03:58

Android开发Android批量插入

2011-08-04 18:00:47

SQLite数据库批量数据

2020-04-24 21:41:45

MySQL数据库插入数据

2022-09-29 10:06:56

SQLMySQL服务端

2013-09-22 10:25:23

MySQLSQL性能优化

2020-11-23 10:50:27

MySQLSQL数据库

2020-09-18 10:18:08

MySQL数据插入数据库

2010-06-07 13:20:39

MySQL插入处理重复

2010-09-01 16:26:11

SQL删除批量

2010-09-09 15:32:48

SQL插入数据

2010-09-03 11:47:38

SQL删除

2021-09-27 07:56:41

MyBatis Plu数据库批量插入

2024-10-22 08:47:03

2021-02-01 00:04:13

Dictionary数据批量

2010-06-12 10:22:15

MySQL插入数据

2024-07-04 13:42:12

2024-10-16 17:04:13

2011-04-13 13:13:09

重复数据删除
点赞
收藏

51CTO技术栈公众号