记一次线上重大事故:二狗子竟然把线上数据库删了!!

运维 数据库运维
作者个人研发的在高并发场景下,提供的简单、稳定、可扩展的延迟消息队列框架,具有精准的定时任务和延迟队列处理功能。

 

[[338587]]

图片来自 Pexels

作者个人研发的在高并发场景下,提供的简单、稳定、可扩展的延迟消息队列框架,具有精准的定时任务和延迟队列处理功能。自开源半年多以来,已成功为十几家中小型企业提供了精准定时调度方案,经受住了生产环境的考验。为使更多童鞋受益,现给出开源框架地址:

https://github.com/sunshinelyz/mykit-delay

写在前面

估计二狗子这几天是大姨夫来了,心情很郁闷,情绪也很低落,工作的时候也有点心不在焉。让他发个版本,结果,一行命令下去把线上的数据库删了!你没听错:是删掉了线上的数据库!运营那边顿时炸了锅:怎么回事?系统不能访问了!什么情况啊?!很多客户都在投诉了!!

尽管运营那边慌慌张张的不知所措,但是,我们作为技术人员还是要淡定,不就是删了数据库吗?没事,哥帮你搞定!

事件背景

  • MySQL数据库每日零点自动全备
  • 某天上午9点,二狗子不小心drop了一个数据库
  • 我们需要通过全备的数据文件,以及增量的binlog文件进行数据恢复

主要思想与原理

  • 利用全备的sql文件中记录的CHANGE MASTER语句,binlog文件及其位置点信息,找出binlog文件增量的部分
  • 用mysqlbinlog命令将上述的binlog文件导出为sql文件,并剔除其中的drop语句
  • 通过全备文件和增量binlog文件的导出sql文件,就可以恢复到完整的数据

过程示意图

操作过程

模拟数据

  1. CREATE TABLE `student` ( 
  2.   `id` int(11) NOT NULL AUTO_INCREMENT, 
  3.   `namechar(20) NOT NULL
  4.   `age` tinyint(2) NOT NULL DEFAULT '0'
  5.   PRIMARY KEY (`id`), 
  6.   KEY `index_name` (`name`) 
  7. ) ENGINE=InnoDB AUTO_INCREMENT=8 DEFAULT CHARSET=utf8  
  8.   
  9. mysql> insert student values(1,'zhangsan',20);  
  10. mysql> insert student values(2,'lisi',21);  
  11. mysql> insert student values(3,'wangwu',22); 

全备命令

  1. # mysqldump -uroot -p -B -F -R -x --master-data=2 test|gzip >/server/backup/test_$(date +%F).sql.gz 

参数说明:

  • -B 指定数据库
  • -F 刷新日志
  • -R 备份存储过程等
  • -x 锁表
  • --master-data 在备份语句里添加CHANGE MASTER语句以及binlog文件及位置点信息

继续插入数据并删库

  1. mysql> insert student values(4,'xiaoming',20); 
  2. mysql> insert student values(5,'xiaohong',20);  

在插入数据的时候我们模拟误操作,删除test数据库。

  1. mysql> drop database test; 

此时,全备之后到误操作时刻之间,用户写入的数据在binlog中,需要恢复出来。

查看全备之后新增的binlog文件

  1. # cd /server/backup/ 
  2. # ls 
  3. test_2020-08-19.sql.gz 
  4. # gzip -d test_2020-08-19.sql.gz  
  5. # grep CHANGE test_2020-08-19.sql  
  6. -- CHANGE MASTER TO MASTER_LOG_FILE='mysql-bin.000003', MASTER_LOG_POS=107; 

这是全备时刻的binlog文件位置,即mysql-bin.000003的107行,因此在该文件之前的binlog文件中的数据都已经包含在这个全备的sql文件中了

移动binlog文件,并读取sql,剔除其中的drop语句

  1. # cp /data/3306/mysql-bin.000003 /server/backup/ 
  2. # mysqlbinlog -d test mysql-bin.000003 >mysql-bin.000003.sql 

接下来,使用vim编辑mysql-bin.000003.sql文件,剔除drop语句

注意:在恢复全备数据之前必须将该binlog文件移出,否则恢复过程中,会继续写入语句到binlog,最终导致增量恢复数据部分变得比较混乱

恢复数据

  1. # mysql -uroot -p < test_2020-08-19.sql  
  2. # mysql -uroot -p -e "select * from test.student;" 
  3. +----+----------+-----+ 
  4. | id | name     | age | 
  5. +----+----------+-----+ 
  6. |  1 | zhangsan |  20 | 
  7. |  2 | lisi     |  21 | 
  8. |  3 | wangwu   |  22 | 
  9. +----+----------+-----+ 

此时恢复了全备时刻的数据,然后使用mysql-bin.000003.sql文件恢复全备时刻到删除数据库之间,新增的数据。

  1. # mysql -uroot -p test < mysql-bin.000003.sql  
  2. # mysql -uroot -p -e "select * from test.student;" 
  3. +----+----------+-----+ 
  4. | id | name     | age | 
  5. +----+----------+-----+ 
  6. |  1 | zhangsan |  20 | 
  7. |  2 | lisi     |  20 | 
  8. |  3 | wangwu   |  20 | 
  9. |  4 | xiaoming |  20 |  
  10. |  5 | xiaohong |  20 | 
  11. +----+----------+-----+ 

此时,整个恢复过程结束,是不是很简单呢?没错,就是这么简单!!

总结

  • 适合人为SQL语句造成的误操作或者没有主从复制等的热备情况宕机时的修复。
  • 恢复条件要全备和增量的所有数据。
  • 恢复时建议对外停止更新,即禁止更新数据库。
  • 先恢复全量,然后把全备时刻点以后的增量日志,按顺序恢复成SQL文件,然后把文件中有问题的SQL语句删除(也可通过时间和位置点),再恢复到数据库。
  • 本文转载自微信公众号「 冰河技术」,可以通过以下二维码关注。转载本文请联系 冰河技术公众号。

 

责任编辑:武晓燕 来源: 冰河技术
相关推荐

2020-04-21 08:24:09

IO机器代码

2020-11-16 12:35:25

线程池Java代码

2023-01-16 14:49:00

MongoDB数据库

2022-07-11 13:58:14

数据库业务流程系统

2022-06-06 11:31:31

MySQL数据查询

2023-01-04 18:32:31

线上服务代码

2015-12-01 15:19:02

2010-01-05 10:57:30

2021-11-23 21:21:07

线上排查服务

2020-11-16 07:19:17

线上函数性能

2022-09-07 09:09:13

高并发架构

2019-04-15 13:15:12

数据库MySQL死锁

2020-01-18 14:11:13

数据库线程技术

2022-12-17 19:49:37

GCJVM故障

2020-04-02 07:31:53

RPC超时服务端

2021-05-31 10:08:44

工具脚本主机

2019-09-10 10:31:10

JVM排查解决

2020-12-07 10:29:27

5G工业互联网网络安全

2020-08-24 07:34:39

网络超时请求

2021-03-05 22:41:55

CDH集群CDH集群
点赞
收藏

51CTO技术栈公众号