掌握 MySQL 数据复制:从 Binlog 到主从同步的最佳实践

数据库 MySQL
MySQL 的 binlog 和主从同步技术为我们提供了强大的数据复制和恢复能力,是构建高可用数据库架构的基石。在日常使用中,掌握这些技术不仅能帮助我们实现高效的数据同步,还能为系统的扩展性和容错能力提供保障。​

1. 前言

在现代分布式数据库架构中,数据的高可用性和一致性是至关重要的。MySQL 作为最流行的关系型数据库之一,提供了多种机制来确保数据的高可用性和容错性。其中,binlog(二进制日志)和主从复制是实现高可用性和灾难恢复的重要技术。

在本篇文章中,我们将深入探讨 MySQL binlog 的原理、配置以及如何通过 binlog 实现主从同步。无论你是 MySQL 新手,还是希望进一步了解数据库高可用性的开发人员,都可以从本文中获得宝贵的实践经验和理论知识。

2. Binlog

Binlog(Binary Log,二进制日志) 是 MySQL 用来记录所有数据库修改操作的日志文件,是Mysql server层去记录,所以,不管是什么存储引擎进行的数据存储,如果BinLog开启,都会进行记录。

Binlog用途

  1. 数据同步与主从复制:

在 MySQL 主从复制架构中,主服务器将所有的数据库变更操作记录到 binlog 中,从服务器会读取主服务器的 binlog 文件并将其应用到本地数据库,从而实现数据的实时同步。

binlog 是主从复制的核心,通过它,MySQL 可以确保从服务器与主服务器保持数据一致性。

  1. 数据恢复:
  • binlog 提供了基于时间点的数据恢复功能。当发生数据库崩溃或误操作时,管理员可以从最后的备份恢复数据,并通过 replay binlog 文件将其恢复到最新状态。
  • 这种方式比传统的全备份方式更高效,可以更精确地恢复到某个特定时刻的数据。

Binlog配置

查询Binlog配置命令

show variables like '%log_bin%';
show variables like '%binlog%';

比较重要的配置含义

log_bin -- 默认on 开启 可以对binlog进行关闭
log_bin_basename -- bin文件前缀 默认/var/lib/mysql/mysql-bin
log_bin_index -- bin文件索引 /var/lib/mysql/mysql-bin.index

binlog_cache_size -- binlog日志 事务缓存大小
binlog_encryption -- 内容是否加密 我们的内容为了安全性可能需要加密
binlog_format -- binlog格式
binlog_expire_logs_seconds -- 多久后binlog删除 默认2592000s也就是30天

BinLog格式

STATEMENT: 基于sql语句记录,记录的是语句,后续去执行binLog的执行语句。优点是存储空间小,但在某些情况下可能会出现与主库不一致的情况,比如:

update order set pay_time = now() where id = 1;

大家想想,如果这条语句是11月1号执行的,但是11月3号数据库宕机需要恢复数据,那么pay_time就会有问题。

ROW: 基于行格式记录,binLog记录的是单个行是如何更改的,虽然这种方式会占用更多的存储空间,但能确保主从数据的一致性。比如上面那个语句:

update order set pay_time = 168535465 where @1 = 1;  -- 168535465随便写的,不要纠结这个

MIXED: 混合模式,默认是STATEMENT,在个别场景会切换成ROW模式

BinLog同步机制

BinLog也是先放到内存再同步到磁盘的,这里可以联想下redolog内存与磁盘的方式

show variables like '%binlog_cache_size%'; -- 事务期间用于保存二进制日志更改的内存缓冲区的大小
show variables like '%sync_binlog%'; -- 同步方式

sync_binlog=0,不同步刷新到磁盘,交给操作系统去操作,断电或者操作系统异常,可能导致数据丢失

sync_binlog=1,能保证数据的一致性,每次提交都必须同步到磁盘,但是对性能有影响,默认

sync_binlog=N, N默认是1,最大4294967295,代表我达到N条binLog后,再同步到磁盘,能够灵活的来设置数据的一致性与性能之间的平衡

3. 主从同步

流程图:

图片图片

必要条件:

  • 确保有唯一的server_id在配置文件中配置
server-id=xx

或者使用sql语句配置

SET GLOBAL server_id=xx; -- 更改server_id
  • 数据源(master)必须开启bin_log

从库创建流程

  • master创建用户
  • 建立主从关系
CHANGE REPLICATION SOURCE TO
->  SOURCE_HOST='source_host_name', 
->  SOURCE_USER='replication_user_name',
->  SOURCE_PASSWORD='replication_password',
->  SOURCE_LOG_FILE='recorded_log_file_name',
->  SOURCE_LOG_POS=recorded_log_position; --我要从binlog的哪个位置开始同步
  • 开启主从同步
start replica; --开启主从同步
  • 更改从库只读
SHOW VARIABLES LIKE'%read_only%';
SET GLOBAL super_read_notallow=1; -- super账号也只读
SET GLOBAL read_notallow=1; -- 只读

同步方式

  • 异步同步:默认方式,性能比较高,但是数据一致性低,会有数据丢失可能。
  • 半同步:由于异步同步会存在一定的数据丢失,所以Mysql的主从复制有一个半同步的概念,所谓半同步,就是我的主必须等待数据至少有一个副本(具体数量可以进行配置)接收并记录了,才会允许提交事务。

4. 总结

MySQL 的 binlog(二进制日志) 和 主从同步 是确保数据库高可用性、可扩展性和灾难恢复的关键技术。通过 binlog,MySQL 记录了所有数据修改操作,为主从复制提供了数据同步的基础。主服务器的变更通过 binlog 被传递到从服务器,实现了数据的实时同步,从而保证了数据的一致性和容错能力。

在配置 MySQL 主从复制时,理解和正确配置 binlog 是至关重要的。binlog 不仅是数据同步的核心,也是数据库恢复和数据审计的重要工具。通过合适的配置(如设置 log_bin、server-id、read_only 等参数),可以确保主从同步的高效性和可靠性。

此外,虽然 binlog 和主从复制为 MySQL 提供了高可用性和灾难恢复的基础,但在实际使用过程中,仍然需要关注复制延迟、网络带宽、负载均衡等因素的影响。对于复杂的生产环境,建议结合 GTID(全局事务标识符) 和 semi-sync replication(半同步复制) 等技术来进一步增强主从复制的健壮性和一致性。

总的来说,MySQL 的 binlog 和主从同步技术为我们提供了强大的数据复制和恢复能力,是构建高可用数据库架构的基石。在日常使用中,掌握这些技术不仅能帮助我们实现高效的数据同步,还能为系统的扩展性和容错能力提供保障。

责任编辑:武晓燕 来源: Java极客技术
相关推荐

2017-06-29 09:28:37

OracleMariaDB复制

2024-07-15 09:14:03

MySQL主从复制

2017-06-21 08:30:20

MySQL原因解决办法

2017-04-20 21:00:06

MySQLbinlog主从复制

2024-03-29 08:08:25

2023-08-29 07:22:06

MySQL数据工具故障恢复

2023-04-06 13:15:48

MySQL复制原理应用实践

2012-11-26 10:17:44

InnoDB

2018-05-16 15:26:43

数据库MySQL主从复制

2020-02-28 16:02:21

MySQL异构同步

2022-08-18 08:24:19

Mysql数据库

2021-07-15 09:00:00

MySQL数据库数据分析

2017-09-12 08:03:29

数据库MySQL主库

2019-05-07 09:31:41

TiDBMySQL数据

2023-03-16 08:01:56

TypeScript开源编程语言

2022-08-12 08:34:32

携程数据库上云

2019-11-24 19:17:06

MySQL异步复制全同步复制

2024-07-19 09:10:37

2010-11-03 08:41:55

MySQL

2020-09-24 06:39:58

MySQL数据库
点赞
收藏

51CTO技术栈公众号