本文主要讨论数据库事务隔离级别与原理,接下来将会从以下四点展开讨论:
- 事务隔离的概念
- 采用葫芦娃例子帮助理解在没有事务隔离时引发的脏读、不可重复读和幻读
- 数据库常见四种隔离级别
- “快照读”概念
事务隔离的概念
任何支持事务的数据库,都必须具备四个特性,分别是:
- 原子性(Atomicity)
- 一致性(Consistency)
- 隔离性(Isolation)
- 持久性(Durability)
以上四点也就是常说的事务ACID,数据库具备以上特性才能保证事务(Transaction)中数据的正确性。而其中事务的隔离性指:事务间是相互独立的,不会互相影响,既一个事务内部的操作及使用的数据对并发的其他事务是隔离的。
没有事务隔离会引发什么问题?
如果没有事务隔离那么可能会出现脏读、不可重复读、幻读等情况。
为了帮助及加深理解,我们采用熟悉的“葫芦娃”作为例子。最先藤上有七个葫芦,每当有一个葫芦娃诞生时,老爷爷就会将他的信息录入数据库表中,如下:
某一天,四娃诞生了。事务A(爷爷)访问了数据库,目的是往数据库里添加新诞生葫芦娃的信息,但是还没有提交事务。
- insert into T values (4, '四娃','喷水');
这时,来了另一个事务B(蛇精),她进行了查询操作,想查询所有已诞生的葫芦娃信息
- select * from T; //结果中出现了四娃的信息
这时,如果事务之间没有有效隔离,那么 蛇精 查询数据库返回的结果中就会出现 四娃 的信息,这就是脏读。
(1) 脏读:指在自己的事务中读到了别人未提交的数据
第二天,事务A(蛇精)一大早就查询了数据库中关于四娃的信息
- select * from T where ID = 4; //名称:四娃 能力:喷水
这时,事务B(爷爷)来了,因为爷爷发现四娃其实是会喷火而不是喷水,所以更新一下将改了四娃的能力为喷火,然后提交了事务。
- update T set Ability= '喷火' where ID = 4;
接着,蛇精(事务A)还想再查看一次用于确认四娃的信息,于是又执行了
- select * from T where ID = 4;//名称:四娃 能力:喷火
这时候她惊讶地发现两次读出来四娃的信息,能力竟然不相同!这就是不可重复读。
(2) 不可重复读:指在自己的事务中读取两次,前后的数据不一样
第三天
事务A(蛇精)访问了数据库,她想要看看到底已经诞生的葫芦娃有哪些,于是她执行了
- select * from T; //查出一共有四条葫芦娃信息
这时候因为五娃诞生了,所以事务B(爷爷)打开了数据库并将五娃的信息录入
- insert into T values (5, '五','喷水');
这时候,事务A(蛇精)想要再查询一次所有已诞生的葫芦娃信息进行确认,于是又执行了查询
- select * from T; //查出一共有五条葫芦娃信息
这个时候事务A(蛇精)可能就会蒙了,以为自己产生了幻觉。这种情况就叫“幻读。
(3) 幻读:指在自己的事务中两个连续的查找之间一个并发的修改事务修改了查询的数据集,导致这两个查询返回了不同的结果(注:不可重复读与幻读很相似,不可重复读的重点是修改,而幻读的重点在于新增或者删除)
数据库的隔离级别
想要避免以上的情况,我们可以通过设置数据库的隔离级别(结合实际场景选择最适合的级别)。一般数据库都包括以下四种隔离级别:
- 读未提交(Read Uncommitted)
- 读提交(Read Committed)
- 可重复读(Repeated Read)
- 串行化(Serializable)
这里以MySQL为例,在MySQL中事务隔离级别分为以下四级:
- 0级:TRANSACTION_READ_UNCOMMITTED 一切都可发生
- 1级:TRANSACTION_READ_COMMITTED--不可以发生脏读,不可重复读和幻读可以发生
- 2级:TRANSACTION_REPEATABLE_READ--不可以发生脏读和重复读,可以发生幻读
- 3级:TRANSACTION_SERIALIZABLE --都不可发生
(1) 读未提交(TRANSACTION_READ_UNCOMMITTED)
读未提交,指可以读到未提交的内容。因为这种隔离级别下查询是不会加锁的,所以可能会产生“脏读”、“不可重复读”、“幻读”。在实际开发中如无特殊情况基本是不会使用该隔离级别的。
(2) 读提交(TRANSACTION_READ_COMMITTED)
读提交,指只能读到已经提交了的内容。这是最常用的一种隔离级别也是Oracle和SQLServer的默认级别,该级别可以有效地避免脏读。(注意:除非显示加锁如共享锁、排他锁,否则查询是默认不加锁的。而区别于“读未提交”,“读提交”可避免脏读的原因是采用了 “快照读”)
(3) 可重复读(TRANSACTION_REPEATABLE_READ)
可重复读,该级别可以有效的避免“不可重复读”,也是MySQL数据库innodb默认的级别。在这个级别下,普通的查询同样是使用的“快照读”,但是,和“读提交”不同的是,当事务启动时就不允许进行Update操作,而“不可重复读”是因为两次读取之间进行了数据的修改所导致的。因此“可重复读”能够有效的避免“不可重复读”,但却避免不了“幻读”,因为幻读是由于“插入或者删除操作”而产生的。
(4) 串行化(TRANSACTION_SERIALIZABLE)
串行化是数据库最高的隔离级别,这种级别下事务串行化一个一个排队顺序执行,可避免脏读、不可重复读、幻读。安全性高相应的执行效率低,性能开销也最大,在实际开发中比较少用。
快照读
数据库读分为:一致非锁定读、锁定读,上面提到“快照读”也就是非锁定读。可简单理解为执行SELECT语句的时候会生成一个快照。
注意:不同事务隔离级别下,快照读是存在区别的:
- READ COMMITTED 隔离级别下,事务中每次读取都会重新生成一个快照,所以每次快照都是最新的。因此事务中每次执行SELECT也可以看到其它已commit事务所作的更改,因为读取的是快照所以有效地避免了脏读的情况。而假设如果没有“快照读(一致非锁定读)”使用的是“锁定读”,那么当一个更新的事务没有提交时,另一个对更新数据进行查询的事务会因为无法查询而被阻塞,这种情况下并发能力及效率相对比较差。
- REPEATED READ 隔离级别下,快照会在事务中第一次SELECT语句执行时生成,只有在本事务中对数据进行更改Update才会更新快照,因此,只有第一次SELECT之前其它已提交事务所作的更改可以看到。
总结
事务的隔离性指:事务间是相互独立的,不会互相影响,既一个事务内部的操作及使用的数据对并发的其他事务是隔离的。当没有进行事务隔离时可能会出现脏读、幻读、不可重复读等情况。通过结合实际情况设置合理的隔离级别可以有效地避免以上问题。
数据库中常见的四个隔离级别:读未提交、读提交、可重复读和串行化,其中读提交在实际开发中是比较常用的。而在其中引出了一个“读快照”的概念,要注意的是不同隔离级别下“读快照”是存在区别的,通过使用“读快照”使得在发生并发操作时效率有所提升。