TB级mysql数据之xtrabackup压缩备份迁移方案

数据库 MySQL
开始迁移数据了,因为历史遗留的问题,又因为部门的数据统一性,多个不同的库表都在一个节点上,然后后面好多个从…..

   开始迁移数据了,因为历史遗留的问题,又因为部门的数据统一性,多个不同的库表都在一个节点上,然后后面好多个从…..

  首先看下我们数据库的大小… , 再加上一个binlog日志,会更大的…. 当然对于咱们数据迁移来说,只需要把数据就可以了. 既然是迁移,

  那么大家一定想做到无缝的迁移… 首先在mysql master做备份,我们在上海机房搭建一个从服务节点,把文件pull下来,然后跟master做同步… 当数据校验ok后,修改所有配置的ip地址。

  老规矩,最近爬虫太狠,经常爬了我的页面,然后作者换成他们自己的….. http://xiaorui.cc/?p=1755

  3.4T,可以说是我见过的最大的数据量了,我们公司本身就是大数据相关的,但大数据基本是在hbase和Elasticsearch、solr中。 可能有人问了,为毛分库分表,因为以前的应用实在太多,不可能把每个select的逻辑都做分库分表的逻辑查询 …. 其实最好的方法是中间件来承担语句的时间range切分,但是这同样需要开发的成本,一些开源的mysql proxy,也是无法做到这样语句切分,是需要一定程度的二次开发的…. 话说开源的各种mysql 中间件,貌似还没有给力到完美支持语句分库分表…..

  废话不多说,这是我们数据库的大小….

 

  1. [root@bj-buzz-db01 ssd]# du -sh mysql/ 
  2. .4T mysql/ 

 

  mysql的备份肯定不会用mysqldump这种锁表的渣渣,必须用Percona的备份工具.

  XtraBackup 有两个工具:xtrabackup 和 innobackupex:

  xtrabackup 本身只能备份 InnoDB 和 XtraDB ,不能备份 MyISAM;

  innobackupex 本身是 Hot Backup 脚本修改而来,同时可以备份 MyISAM 和 InnoDB,但是备份 MyISAM 需要加读锁。

  官网:http://www.percona.com/software/percona-xtrabackup

  文档:http://www.percona.com/doc/percona-xtrabackup/2.2/index.html

  因为考虑到文件是在太大,必须要做好压缩,不然 不管scp和rsync都是很痛苦的一件事情。

  首先用的是gzip进行压缩,但是发现速度有些慢,linux 管道的速度没啥好质疑的…. 那瓶颈应该是处在gzip压缩上…

  innobackupex –defaults-file=/etc/mysql/my.cnf –stream=tar /data/7_15 | gzip > /data/7_15.tar.gz

  查了下percona关于压缩的话题,官方是推荐用上面的方法的。 但是问题我刚才也说明白了,gzip只是个单进程的应用,如何跑满cpu… 其实xtrabackup本身也有压缩的功能参数.

  # 压缩

  –compress # 开启压缩,目前只支持quicklz算法 压缩级别在0-9.1快速压缩,9最佳压缩,0不压缩。默认为1.

  –compress-threads=5 # 并发压缩线程,默认为1

  –compress-chunk-size=64K # 每个压缩线程使用的buffer,默认64K

  percona也是有加密的功能….

  # 加密

  –encrypt=AES256 # 开启加密,目前支持的算法有AES128, AES192 和 AES256

  –encrypt-key=3c0efcea569021b49245e47b5d6a0e28 # 32位密钥,不过不推荐这么使用,最好将密钥存放在文件中,用encrypt-key-file参数引用

  –encrypt-threads=5 # 加密线程数,默认为1

  使用tar模式

  innobackupex –defaults-file=/etc/mysql/my.cnf –stream=tar –compress ./ > 7_15

  使用xbstream

  innobackupex –defaults-file=/etc/mysql/my.cnf –stream=xbstream /tmp >/backup/bak.xbstream

  用了压缩,也用了多线程,速度貌似不是很给力…

  紧接着,在xtrabackup help里面看到了 –parallel这个参数,他是用来控制并发的… 但是经过我的测试,效果一点都不明显,说白了就是没啥效果…. 当然也有可能我的场景不对付? 或者是使用方法不对?

  默认情况下 xtrabackup 备份时只会开启一个进程进行数据文件的备份,若配置参数 –parallel=N 可以让 xtrabackup 开启 N 个子进程对多个数据文件进行并发备份,这样可以加快备份的速度。当然服务器的 IO 处理能力以及对服务器的影响也是要考虑的,所以另一个参数 –throttle=IOS 会与它同时使用,这个参数用来限制备份过程中每秒读写的 IO 次数,对服务器的 IO 是一个保护。

  innobackupex –defaults-file=/etc/mysql/my.cnf –parallel=10 –stream=tar /data/7_15 | gzip > /data/7_15.tar.gz

  这是最后的方式…. 既然是gzip速度慢,那么就用pigz这种gzip的多线程加强版来改造他,加强他…. 个人觉得 –parallel –compress-threads 看起来不错,但是性能提升不是很满意..

  innobackupex –defaults-file=/etc/mysql/my.cnf –stream=tar /data/7_15 | pigz -9 -p 32 > /data/7_15.tar.gz

  这是pigz的安装方式.

  1. wget http://zlib.net/pigz/pigz-2.3.3.tar.gz 
  2. tar zxvf pigz-2.3.3.tar.gz 
  3. cd pigz-2.3.3/ 
  4. make 

 

  遇到一个make问题。

  [root@bj-buzz-db01 pigz-2.3.3]# make

  cc -O3 -Wall -Wextra -c -o pigz.o pigz.c

  pigz.c:365:73: error: zlib.h: No such file or directory

  pigz.c:372:4: error: #error Need zlib version 1.2.3 or later

  pigz.c: In function ‘put_header’:

  pigz.c:1000: error: ‘Z_DEFAULT_COMPRESSION’ undeclared (first use in this function)

  pigz.c:1000: error: (Each undeclared identifier is reported only once

  pigz.c:1000: error: for each function it appears in.)

  pigz.c: At top level:

  pigz.c:1459: error: expected ‘)’ before ‘*’ token

  pigz.c: In function ‘compress_thread’:

  pigz.c:1495: error: ‘z_stream’ undeclared (first use in this function)

  pigz.c:1495: error: expected ‘;’ before ‘strm’

  pigz.c:1502: error: ‘strm’ undeclared (first use in this function)

  pigz.c:1502: error: ‘Z_NULL’ undeclared (first use in this function)

  pigz.c:1505: warning: implicit declaration of function ‘deflateInit2’

  pigz.c:1505: error: ‘Z_DEFLATED’ undeclared (first use in this function)

  pigz.c:1505: error: ‘Z_DEFAULT_STRATEGY’ undeclared (first use in this function)

  pigz.c:1506: error: ‘Z_MEM_ERROR’ undeclared (first use in this function)

  pigz.c:1508: error: ‘Z_OK’ undeclared (first use in this function)

  pigz.c:1530: warning: implicit declaration of function ‘deflateReset’

  pigz.c:1531: warning: implicit declaration of function ‘deflateParams’

  pigz.c:1546: warning: implicit declaration of function ‘deflateSetDictionary’

  pigz.c:1595: warning: implicit declaration of function ‘deflate_engine’

  pigz.c:1595: error: ‘Z_NO_FLUSH’ undeclared (first use in this function)

  pigz.c:1620: error: ‘Z_SYNC_FLUSH’ undeclared (first use in this function)

  pigz.c:1624: error: ‘Z_FINISH’ undeclared (first use in this function)

  pigz.c:1687: warning: implicit declaration of function ‘adler32’

  pigz.c:1687: warning: implicit declaration of function ‘crc32’

  pigz.c:1706: warning: implicit declaration of function ‘deflateEnd’

  pigz.c: In function ‘write_thread’:

  pigz.c:1737: error: ‘Z_NULL’ undeclared (first use in this function)

  pigz.c: In function ‘single_compress’:

  pigz.c:2039: error: expected ‘=’, ‘,’, ‘;’, ‘asm’ or ‘__attribute__’ before ‘*’ token

  pigz.c:2039: error: ‘strm’ undeclared (first use in this function)

  pigz.c:2062: error: ‘z_stream’ undeclared (first use in this function)

  pigz.c:2063: error: ‘Z_NULL’ undeclared (first use in this function)

  pigz.c:2066: error: ‘Z_DEFLATED’ undeclared (first use in this function)

  pigz.c:2066: error: ‘Z_DEFAULT_STRATEGY’ undeclared (first use in this function)

  pigz.c:2067: error: ‘Z_MEM_ERROR’ undeclared (first use in this function)

  pigz.c:2069: error: ‘Z_OK’ undeclared (first use in this function)

  pigz.c:2173: warning: implicit declaration of function ‘deflate’

  pigz.c:2173: error: ‘Z_NO_FLUSH’ undeclared (first use in this function)

  pigz.c:2198: error: ‘Z_SYNC_FLUSH’ undeclared (first use in this function)

  pigz.c:2202: error: ‘Z_FINISH’ undeclared (first use in this function)

  pigz.c: In function ‘infchk’:

  pigz.c:3044: error: ‘z_stream’ undeclared (first use in this function)

  pigz.c:3044: error: expected ‘;’ before ‘strm’

  pigz.c:3054: error: ‘Z_NULL’ undeclared (first use in this function)

  pigz.c:3055: error: ‘strm’ undeclared (first use in this function)

  pigz.c:3058: warning: implicit declaration of function ‘inflateBackInit’

  pigz.c:3059: error: ‘Z_MEM_ERROR’ undeclared (first use in this function)

  pigz.c:3061: error: ‘Z_OK’ undeclared (first use in this function)

  pigz.c:3067: warning: implicit declaration of function ‘inflateBack’

  pigz.c:3068: warning: implicit declaration of function ‘inflateBackEnd’

  pigz.c:3069: error: ‘Z_DATA_ERROR’ undeclared (first use in this function)

  pigz.c:3072: error: ‘Z_BUF_ERROR’ undeclared (first use in this function)

  pigz.c:3074: error: ‘Z_STREAM_END’ undeclared (first use in this function)

  pigz.c: In function ‘defaults’:

  pigz.c:3828: error: ‘Z_DEFAULT_COMPRESSION’ undeclared (first use in this function)

  make: *** [pigz.o] Error 1

  提示错误,是因为没有zlib开发包原因….

  yum -y install zlib-devel

  然后我们再次用pigz进行压缩,下面是cpu的使用率。

  Tasks: 446 total, 1 running, 444 sleeping, 0 stopped, 1 zombie

  Cpu0 : 69.2%us, 2.6%sy, 0.0%ni, 23.5%id, 4.6%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu1 : 45.4%us, 1.0%sy, 0.0%ni, 53.6%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu2 : 51.0%us, 5.0%sy, 0.0%ni, 29.1%id, 14.6%wa, 0.0%hi, 0.3%si, 0.0%st

  Cpu3 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu4 : 34.0%us, 3.0%sy, 0.0%ni, 60.4%id, 2.6%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu5 : 69.3%us, 0.7%sy, 0.0%ni, 30.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu6 : 33.4%us, 15.4%sy, 0.0%ni, 27.4%id, 17.4%wa, 0.0%hi, 6.4%si, 0.0%st

  Cpu7 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu8 : 55.6%us, 1.3%sy, 0.0%ni, 36.8%id, 6.3%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu9 : 87.8%us, 0.3%sy, 0.0%ni, 11.9%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu10 : 99.3%us, 0.0%sy, 0.0%ni, 0.7%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu11 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu12 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu13 : 99.7%us, 0.0%sy, 0.0%ni, 0.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu14 : 99.7%us, 0.0%sy, 0.0%ni, 0.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu15 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu16 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu17 : 99.7%us, 0.0%sy, 0.0%ni, 0.3%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu18 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu19 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu20 : 99.7%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.3%si, 0.0%st

  Cpu21 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  Cpu22 : 98.7%us, 0.0%sy, 0.0%ni, 0.3%id, 0.0%wa, 0.0%hi, 1.0%si, 0.0%st

  Cpu23 :100.0%us, 0.0%sy, 0.0%ni, 0.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st

  我们再来看看磁盘,毫无压力…. 我这边就不贴图了,刚要想起把iostat -x 1的结果贴出来,发现备份已经完成。。。 在下午xtrabackup备份压缩的过程中,其他的访问没感受到有性能的影响…..

  

 

  我们再来看看大小…. 965G…… 压缩的效果还是比较的满意…. 消耗的时间是,7:38 – 1:18 ,将近6个半小时。。。。。

  

 

  那么我又在读取mysql数据文件的时候,增加了并发,使用了–parallel参数让 xtrabackup 开启 N 个子进程对多个数据文件进行并发备份。

  innobackupex –defaults-file=/etc/mysql/my.cnf –user=root –password=xxx –parallel=5 –stream=tar /data/7_15_p | pigz -8 -p 15 > /data/7_15_p.tar.gz

  首先看下他的io情况. 我们会发现,数据盘无压力,但是备份的存储盘io已经是报了…. 这说明啥? 说明xtrabackup在增加了并发读取文件的时候,不仅考虑mysql数据盘的io,也要考虑目标存储盘的io是否能抗住。。。。

  1. Device:         rrqm/s   wrqm/s     r/s     w/s   rsec/s   wsec/s avgrq-sz avgqu-sz   await  svctm  %util 
  2. sda               0.00    35.00    0.00    7.00     0.00   328.00    46.86     0.01    1.43   1.43   1.00 
  3. sdb               0.00    31.00  460.00   15.00 172944.00   368.00   364.87     1.51    3.16   2.08  98.90 
  4. dm-0              0.00     0.00    0.00   41.00     0.00   328.00     8.00     0.23    5.51   0.24   1.00 
  5. dm-1              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00 
  6. dm-2              0.00     0.00    0.00    0.00     0.00     0.00     0.00     0.00    0.00   0.00   0.00 
  7. memdiska          0.00     0.00   63.00   37.00  2672.00   296.00    29.68     0.01    0.07   0.06   0.60 

 

责任编辑:honglu 来源: 内存溢出
相关推荐

2023-01-11 08:05:23

XtraBackupMySQL备份

2024-08-22 14:16:08

2023-05-31 08:54:14

MySQL逻辑备份

2015-11-25 11:16:45

2015-10-29 13:44:06

MySQLinnodb引擎备份

2015-10-29 13:52:53

MySQLinnodb引擎备份

2018-08-24 13:58:13

数据库MySQL备份

2015-05-15 14:51:11

TB 级数据云备份

2011-03-31 12:17:07

Cacti备份

2019-08-08 15:05:26

HBase数据迁移命令

2010-05-31 16:10:30

MySQL备份

2011-08-15 09:19:22

2013-09-09 17:17:18

MYSQL自动备份

2009-07-03 09:44:30

Oracle Data

2017-04-24 15:12:53

西部数据硬盘

2021-04-07 10:20:31

MySQL数据库命令

2024-08-23 11:50:45

2020-07-23 19:42:12

MySQL备份恢复数据库

2014-05-21 13:26:28

公有云存储云计算

2023-11-14 08:44:55

数倍数据
点赞
收藏

51CTO技术栈公众号