由浅到深让你明白 MySQL 的事务
九江浔兴贸易有限公司
九江浔兴贸易有限公司

今日概况

由浅到深让你明白 MySQL 的事务

发布日期:2022-08-07 22:31    点击次数:195

什么是事务

事务(Transaction)是并发控制的基本单位。所谓的事务呢,它是一个操作序列,这些操作要么都执行,要么都不执行,它是一个不可分割的工作单位。为什么?因为事务是数据库维护数据一致性的单位,在每一个事务结束的时候都能保持数据的一致性,如像积分表和积分详情表一起更新要么就成功,要么就失败。

事务的四大特性ACID

「原子性(Atomicity):」 原子性是指整个数据库的事务是一个不可分割的工作单位,在每一个都应该是原子操作。当我们执行一个事务的时候,如果在一系列的操作中,有一个操作失败了,那么需要将这一个事务中的所有操作恢复到执行事务之前的状态,这就是事务的原子性。

「一致性(Consistency):」 一致性呢是指事务将数据库从一种状态转变成为下一种一致性的状态,也就是说是在事务的执行前后,这两种状态应该是一样的,也就是在数据库的完整性约束不会被破坏。另外的话,还需要注意的是一致性不关注中间的过程是发生了什么。

「隔离性(lsolation):」 Mysql数据库可以同时的话启动很多的事务,但是呢,事务跟事务之间他们是相互分离的,也就是互不影响的,这就是事务的隔离性。

「持久性(Durability):」 事务的持久性是指事务一旦提交,就是永久的了。说白了就是发生了问题,数据库也是可以恢复的。因此持久性保证事务的高可靠性。

Mysql事务隔离级别

「Read uncommitted(读取未提交的数据):」 即便是事务没有commit,但是其他连接任然能读到未提交的数据,这个事务隔离级别是等级最低的。

「Read committed(可以读取其他事务提交的数据):」 当前会话只能读取到其他事务提交的数据,没有提交的数据是读取不到的。

「Repeatable read(可重读):」 这个是Mysql的默认隔离级别:当前会话可以重复读,就是每次读取到的结果集都是相同的,不管其他的事务有没有提交。

「Serializable(串行化):」 其他会话对该表的写操作将会被挂起,可以看到,这个是隔离级别里最为严格的,但是这样做势必会对性能造成影响

设置事务隔离级别的代码是

set session transaction isolation level serializable; 

一个数据库事务通常的话包含了一个序列对数据库的读/写操作,它的存在主要是包含有以下两个目的:

第一,为数据库操作序列提供了一个从失败中恢复到正常状态的方法,同时呢也提供了数据库即使在异常状态下仍然能够保持一致性的方法。

第二,当多个应用程序在并发访问数据库的时候, 仙乐飘飘可以在这些应用程序之间提供一个隔离的方法,以防止彼此的操作相互干扰对方。

并发事务导致的问题

在许多的事务同时处理一个数据的时候,如果没有采取有效的隔离机制的话,那么并发处理数据的时候,会带来一些问题。

「脏读:」 脏读是指在一个事务的处理过程中读取了另外一个没有提交事务里的数据。

「幻读:」 也叫虚读是指在一个事务执行了两次查询,第二次的结果集包含了第一次中没有或者是某些行已被删除的数据,造成了两次的结果不一致,只是呢另一个事务在这两次查询中间插入或者是删除造成的。幻读是一种事务非独立执行时发生的。

「不可复读:」 一个事务两次读取了同一行的数据,结果得到了不同状态的结果,中间过程的时候正好有其另外一个事务更新了这个数据,两个结果不一样,不可被信任。

Mysql数据执行过程剖析

Buffer Pool是什么?

Buffer Pool就是数据库的一个内存组件,缓存了磁盘上的真实数据,我们的系统对数据库执行增删改查操作其实呢就是主要对这个内存数据结构中的缓存数据执行的。

Mysql的RedoLog和UnidoLog日志

InnoDB使用了undolog、redolog来保证了事务的原子性、一致性与持久性,同时的话采用了预写日志的方式将随机写入变成顺序追加写入,从而提升了事务的性能。

「undo log:」 它就是作用于记录事前变更前的状态,在对数据进行操作之前,会先把数据备份到undu log,然后再进行数据的修改,如果出现错误或者是用户执行了rollback语句,则系统就可以利用undo log里备份的数据恢复到事务开始之前的状态。undo log日志是一种逻辑格式的日志,在执行undo的时候,仅仅是将数据从逻辑上恢复到事务之前的状态,而不是从物理页面上操作实现的。undo log位于数据库的data目录下的ibdata。

「redo log:」 它的作用就是记录事务变更后的状态。在提交事务之前,只要把redo log持久化就可以了,数据就在内存中变更。当系统崩溃的时候,虽然数据没有了落盘,但是redo log已经持久化了,系统就可以根据redo log的内容,把所有的数据恢复到最新的状态。redo log是一种物理格式的日志,记录的是物理数据页面的修改信息,其中redo log是顺序写入redo log file的物理文件中去的。它位于数据库的data目录下的ib_logfile1&ib_logfile2下。

「checkpoint:」 redo log会随着时间的积累,redo log就会变得很大很大。如果每一次都从第一条记录开始恢复数据的话,那么恢复的过程是漫长的。所以为了节省恢复时间,就引入了checkpoint机制,它会定期将databuffer的内容刷新到磁盘的datafile内,然后再清除掉checkpoint之前的redo log。其实就是InnoDB通过加载最新的快照,然后重做checkpoint之后所有的事务(包括了未提交和回滚的),然后再通过undo log来回滚那些未提交的事务来完成对数据的恢复。

MySQL的事务MVCC结构

InnoDB Multi-Versionnoing-InnoDB是多版本的存储引擎:它保留了有关已经更改行的旧版本信息,以支持并发和rollback的事务功能。像此类的信息称为rollback segment的数据结构存储在table空间当中。它的实现原理就是InnoDB向存储在数据库里的每一行添加两个关键的字段:DATA_TRX_ID和DATA_ROLL_PTR。

「DATA_TRX_ID:」 DATA_TRX_ID是标记了最新更新这条行数据的transaction id,每处理一个事务,值会自动+1。

「DATA_ROLL_PTR:」 表示了指向该行回滚段的指针,该行上所有旧的版本,在undo中都有通过链表的形式组织,而该值,正式指向undo中该行的历史记录链表。

MVCC

MVCC的目的就是多版本并发控制,在数据库的实现,就是为了解决读写冲突,它的实现原理主要依赖记录中的隐式(DATA_TRX_ID、DATA_ROLL_PTR、Read View)字段。undo log,Read View来实现的。InnoDB MVCC的实现基于undo log,通过回滚指针来构建需要的版本记录。通过Read View来判断哪一些版本的数据可见。

MVCC的作用

1、每一行的数据都会存在一个版本,每一次的数据更新的时候都会更新该版本。

2、修改时Copy出当前版本随意修改,各个事务之间无干扰。

3、把修改前的数据存放于undo log,通过回滚指针的主数据关联。

4、修改成功(commit)啥都不做,失败的话就回复undo log中的数据(rollback)

「Read View:」 它是一个数据结构,在SQL开始的时候被创建。这个数据结构里有三个主要的成员分别是low_trx_id、up_trx_id、trx_ids,在并发的情况下,一个事务在启动的时候,trx_sys链表里存储部分还未提交的事务,那么哪些改变对当前的事务是可见的,哪些又是不可见的,这个就需要通过这个ReadView来进行判定了。

low_trx_id:表示的是该SQL启动的时候,当前事务链表中最大的事务id编号,也就是最近创建的除自身以外最大的事务编号。

up_trx_id:表示的是该SQL启动的时候,当前的事务链表中最小的事务id编号,也就是当前系统里创建最早但是还没有提交的事务。

trx_ids:表示所有的事务链表里事务id的集合。

 

「ReadView读取的区别:」 READ COMMITTED 是每次读取数据前都生成一个ReadView,REPEATABLE READ 是在第一次读取数据时生成一个ReadView