MySQL的可重复读隔离级别和MVCC机制是什么关系,又是如何解决“幻读”问题的?

数据库 MySQL
产生幻读的原因是,行锁只能锁住行,但是新插入记录这个动作,要更新的是记录之间的“间隙”。因此,为了解决幻读问题,InnoDB 只好引入新的锁,也就是间隙锁 (Gap Lock),间隙锁是在可重复读隔离级别下才会生效的。

今天来讨论MySQL中的事物隔离级别

一、事物概念

事务是由一组SQL语句组成的逻辑处理单元。

事务具有以下4个属性,通常简称为事务的ACID属性:

  • 原子性:事务是一个原子操作单元,其对数据的修改,要么全都执行,要么全都不执行。
  • 一致性:在事务开始和完成时,数据都必须保持一致状态。这意味着所有相关的数据规则都必须应用于事务的修改,以保持数据的完整性。
  • 隔离性:数据库系统提供一定的隔离机制,保证事务在不受外部并发操作影响的“独立”环境执行。这意味着事务处理过程中的中间状态对外部是不可见的,反之亦然。
  • 持久性:事务完成之后,它对于数据的修改是永久性的,即使出现系统故障也能够保持。

事务的启动方式

  • 显式启动 set autocommit=1 begin 或 start transaction。配套的提交语句是 commit,回滚语句是 rollback。
  • set autocommit=0 自动提交关掉,意味着如果你只执行一个 select 语句,这个事务就启动了,而且并不会自动提交。这个事务持续存在直到你主动执行 commit 或 rollback 语句,或者断开连接。
  • 用commit work and chain代替 commit可以提交一个事务,并且开启另一个新的事务。

二、事物带来的问题

我们的数据库一般都会并发执行多个事务,多个事务可能会并发的对相同的一批数据进行增删改查操作,可能就会导致我们说的脏写、脏读、不可重复读、幻读这些问题。

这些问题的本质都是数据库的多事务并发问题,为了解决多事务并发问题,数据库设计了事务隔离机制、锁机制、MVCC多版本并发控制隔离机制,用一整套机制来解决多事务并发问题。接下来,我们会深入讲解这些机制,让大家彻底理解数据库内部的执行原理。

脏写

当两个或多个事务选择同一行,然后基于最初选定的值更新该行时,由于每个事务都不知道其他事务的存在,就会发生丢失更新问题,最后的更新覆盖了由其他事务所做的更新。

脏读

一个事务正在对一条记录做修改,在这个事务完成并提交前,这条记录的数据就处于不一致的状态;这时,另一个事务也来读取同一条记录,如果不加控制,第二个事务读取了这些“脏”数据,并据此作进一步的处理,就会产生未提交的数据依赖关系。这种现象被形象的叫做“脏读”。

例:事务A读取到了事务B已经修改但尚未提交的数据,还在这个数据基础上做了操作。此时,如果B事务回滚,A读取的数据无效,不符合一致性要求。

不可重读

一个事务在读取某些数据后的某个时间,再次读取以前读过的数据,却发现其读出的数据已经发生了改变、或某些记录已经被删除了!这种现象就叫做“不可重复读”。

例:事务A内部的相同查询语句在不同时刻读出的结果不一致,不符合隔离性

幻读

一个事务按相同的查询条件重新读取以前检索过的数据,却发现其他事务插入了满足其查询条件的新数据,这种现象就称为“幻读”。

例:事务A读取到了事务B提交的新增数据,不符合隔离性

不可重复读与幻读有什么区别?

不可重复读的重点是修改:在同一事务中,同样的条件,第一次读的数据和第二次读的「数据不一样」。(因为中间有其他事务提交了修改)

幻读的重点在于新增或者删除:在同一事务中,同样的条件,第一次和第二次读出来的「记录数不一样」。(因为中间有其他事务提交了插入/删除)

三、事物的隔离级别

在 MySQL 中,事务支持是在引擎层实现的。你现在知道,MySQL 是一个支持多引擎的系统,但并不是所有的引擎都支持事务。比如 MySQL 原生的 MyISAM 引擎就不支持事务,这也是 MyISAM 被 InnoDB 取代的重要原因之一

InnoDB实现了四个标准的隔离级别,每一种级别都规定了一个事务中所做的修改,哪些在事务内和事务间是可见的,哪些是不可见的。低级别的隔离级一般支持更高的并发处理,并拥有更低的系统开销。

查看当前数据库的事务隔离级别:

show variables like 'tx_isolation';

设置事务隔离级别:

set tx_isolation='REPEATABLE-READ';

查询mysql的长事务(大于60秒的事务): select * from information_schema.innodb_trx where TIME_TO_SEC(timediff(now(),trx_started))>60

Mysql默认的事务隔离级别是可重复读.

事务隔离级别

在谈隔离级别之前,你首先要知道,你隔离得越严实,效率就会越低。因此很多时候,我们都要在二者之间寻找一个平衡点。

标准的事务隔离级别包括:

  • 读未提交:一个事务还没提交时,它做的变更就能被别的事务看到
  • 读提交:一个事务提交之后,它做的变更才会被其他事务看到
  • 可重复读:一个事务执行过程中看到的数据,总是跟这个事务在启动时看到的数据是一致的。当然在可重复读 隔离级别下,未提交变更对其他事务也是不可见的
  • 串行化:顾名思义是对于同一行记录,“写”会加“写锁”,“读”会加“读锁”。当出现读写锁冲突的时候,后访问的事务必须等前一个事务执行完成,才能继续执行

隔离级别是如何实现的呢?

在实现上,数据库里面会创建一个视图,访问的时候以视图的逻辑结果为准;

在“可重复读”隔离级别下,这个视图是在事务启动时创建的,整个事务存在期间都用这个视图;

在“读提交”隔离级别下,这个视图是在每个 SQL 语句开始执行的时候创建的;

在“读未提交”隔离级别下直接返回记录上的最新值,没有视图概念;

在“串行化”隔离级别下直接用加锁的方式来避免并行访问。

图片

在 MySQL 中,不同时刻启动的事务会有不同的一致性视图read-view,并且每条记录在更新的时候都会同时记录一条回滚操作。记录上的最新值,通过回滚操作,都可以得到前一个状态的值,这就意味着同一条数据在数据库中维护了多个版本,就是数据库的多版本并发控制(MVCC),我们后续详细讨论MVCC机制。

从图中可以看到每种隔离级别可以解决的问题,我们可以看出可重复隔离级别下幻读是没有解决的,而且即便是加行锁也解决不了问题,我们上面说了幻读问题说的是新增删除造成的问题,而无论是可重复读隔离级别还是行锁操作的对象都是当前行,所以幻读问题需要其他的方式解决。

注意:长事务会造成回滚日志不断增大,会有空间占用剧增的风险,尽量不要使用长事务。

幻读的解决

产生幻读的原因是,行锁只能锁住行,但是新插入记录这个动作,要更新的是记录之间的“间隙”。因此,为了解决幻读问题,InnoDB 只好引入新的锁,也就是间隙锁 (Gap Lock),间隙锁是在可重复读隔离级别下才会生效的。所以,你如果把隔离级别设置为读提交的话,就没有间隙锁了,间隙锁是开区间。间隙锁和行锁合称 next-key lock,每个 next-key lock 是前开后闭区间。也就是说,我们的表 t 初始化以后,如果用 select * from t for update 要把整个表所有记录锁起来,就形成了 7 个 next-key lock,分别是 (-∞,0]、(0,5]、(5,10]、(10,15]、(15,20]、(20, 25]、(25, +supremum]。间隙锁和 next-key lock 的引入,帮我们解决了幻读的问题,但同时也带来了一些“困扰”,间隙锁的引入,可能会导致同样的语句锁住更大的范围,这其实是影响了并发度的。

简单总结

解决上述问题其实就是依赖于mysql的MVCC机制和锁机制,我们后续分别讨论。

责任编辑:武晓燕 来源: 码农本农
相关推荐

2024-05-13 11:46:33

MySQL数据库

2019-12-24 14:50:01

MySQL可重复读数据库

2023-11-01 14:13:00

MySQL事务隔离级别

2024-04-24 08:26:35

事务数据InnoDB

2024-04-19 08:18:47

MySQLSQL隔离

2022-06-29 11:01:05

MySQL事务隔离级别

2024-07-16 08:19:46

MySQL数据InnoDB

2023-02-02 07:06:10

2022-01-03 07:18:05

脏读幻读 MySQL

2010-09-30 16:21:40

DB2隔离级别

2023-12-26 08:08:02

Spring事务MySQL

2023-08-09 17:22:30

MVCCMySQL数据

2023-10-16 10:29:51

mysqlMVCC

2022-09-21 09:00:10

MySQL幻读隔离级别

2021-06-11 16:59:41

MySQLRepeatableRead

2020-10-13 10:32:24

MySQL事务MVCC

2023-10-26 00:41:46

脏读数据幻读

2022-04-27 07:32:02

脏读幻读不可重复读

2021-07-26 10:28:13

MySQL事务隔离

2018-01-03 09:02:13

不可重复读幻读MySQL
点赞
收藏

51CTO技术栈公众号