根据存储事务的工作流程原理,来了解如何保证事务的ACID特性,利用了MySQL数据库的哪些工作机制;
事务工作流程名字解释:
- 名词解释一:redo log-Disk
表示重做日志,当出现异常情况,内存中数据直接写入磁盘失败时,可以通过重启数据库服务,读取此文件修复数据信息;
文件存储表项为:ib_logfile0~N 默认48M,轮询使用
- 名词解释二:redo log buffer-mem
表示重做日志生成缓冲区,相当于redo log的内存区域。redo log文件与redo log buffer是有IO关系的;
事务修改提交后:redo log buffer -> redo log,表示写入数据到redo log;
事务操作恢复时:redo log -> redo log buffer,表示读取数据从redo log;
- 名词解释三:tablespace file-disk
表示存储表数据行和索引等信息的文件,含有表空间所有数据文件;ibd
- 名词解释四:Innodb buffer pool-mem
表示数据缓冲区,主要用于缓冲事务要处理的数据和索引信息,tablespace文件与buffer pool是有IO关系的;
- 名词解释五:LSN
表示日志序列号,在buffer pool中有数据页信息的变化就会记录到redo log buffer中,主要记录变化了多少字节量;
利用LSN记录相应数据页的变化量(LSN+变化字节量),也可以理解为记录的是日志量的变化;
MySQL每次数据库启动,都会比较磁盘数据页和redolog的LSN,必须要求两者一致,数据库才能正常启动;
- 名词解释六:WAL(Write Ahead Log)
表示redo日志生成记录优先于数据页写入到磁盘的过程,并且是支持预写入机制(group commit)的;
- 名词解释七:Dirty page
表示在内存进行修改的数据页,在redo buffer中会记录数据页的数据量的变化,此时在数据页还未最终写入到磁盘中时;
就称之为脏页,所以一般所谓的脏读就是读取脏页的数据页信息;
- 名词解释八:CheckPoint
表示为检查点,就是将脏页刷写到磁盘的动作;
- 名词解释九:DB_TRX_ID(6字节)
表示为事务ID号,InnoDB会为每一个事务生成一个事务号(由事务管理器管理TM),伴随着整个事务生命周期
其中事务ID号码信息,在redo和undo日志文件中都会有相应的标识;
- 名词解释十:DB_ROLL_PTR(7字节)
表示回滚指针,在rollback时会使用undo日志回滚已修改的数据,DB_ROLL_PTR会指向此次事务的回滚业务点;
从而找到undo上的相应的日志信息;
数据库名词解释官方参考:https://dev.mysql.com/doc/refman/8.0/en/glossary.html
事务工作流程具体解读:
简单事务情况举例:
mysql> begin;
mysql> update t1 set A=2 where A=1;
mysql> commit;
事务工作流程一:redo log 重做日志如何应用
-
用户发起update操作事务语句,将磁盘数据页(page100,A=1,LSN=1000)加载到内存(buffer_pool)缓冲区;
-
将在内存中发生数据页修改操作(A=1改为A=2),形成数据页脏页,更改中数据页的变化会记录到redo buffer中;
加入1000个字节日志信息,LSN=1000+1000=2000;
-
当执行事务提交操作的时候,基于WAL机制,等到redo buffer中的日志完全落盘到ib_logfileN-redo log中,即commit正式完成;
-
此时ib_logfileN中记录了一条日志,内容为:page100数据页变化+LSN=2000
简单理解:记录内存数据页变化日志+undo(DB_TRX_ID,DB_ROLL_PTR),通过LSN和数据页建立关系
特殊情景分析:当此时,redo落盘了,数据页没有落盘,出现宕机情况了;
- MySQL CR(自动故障恢复)工作模式,启动数据库时,自动检查redo的LSN和数据页LSN;
- 如果发现redo LSN > 数据页的LSN,加载原始数据页+变化redo指定内存,使用redo重构脏页(前滚);
- 如果确认此次事务已经提交(commit标签),立即触发CKPT(checkpoint)动作,将脏页刷写到磁盘上;
知识点补充:
MySQL有一种机制,批量刷写redo的机制:会在A事务commit时,顺便将redo buffer中的未提交的redo日志也一并刷到磁盘;
为了区分不同状态的redo,日志记录时会标记是否commit;
redo保证了ACID哪些特性:
主要保证了D的特性,另外A C也有间接关联;
Redo Log日志文件生成流程:

Redo Log日志文件应用流程:

说明:利用redo Log重做日志功能可以保证事务的D特性,基于可以丢内存数据,但是不可以丢操作事务日志的原则;
存储引擎读写磁盘数据页IO信息:
存储引擎读写磁盘数据页IO信息:
mysql> select @@innodb_read_io_threads;
+------------------------------------+
| @@innodb_read_io_threads |
+------------------------------------+
| 4 |
+------------------------------------+
1 row in set (0.00 sec)
-- 接收SQL层处理信息传达到存储引擎层的读IO配置信息;
mysql> select @@innodb_write_io_threads;
+------------------------------------+
| @@innodb_write_io_threads |
+------------------------------------+
| 4 |
+------------------------------------+
1 row in set (0.00 sec)
-- 接收SQL层处理信息传导到存储引擎层的写IO配置信息
存储引擎序号号码信息查看:
mysql> show engine innodb status\G
Log sequence number 105377511
-- redo buffer中的SN号码信息
Log flushed up to 105377511
-- redo buffer刷新到磁盘上的SN号码信息
Last checkpoint at 105377511
-- 磁盘数据页的SN号码信息
存储引擎redo buffer落盘的机制策略:****
mysql> select @@innodb_flush_log_at_trx_commit;
+-----------------------------------------------+
| @@innodb_flush_log_at_trx_commit |
+-----------------------------------------------+
| 1 |
+-----------------------------------------------+
1 row in set (0.00 sec)
-- 表示数据库配置与安全有关的两个双一配置
-- 当数值为1:表示每次事务提交就立刻进行redo buffer刷新落盘,若落盘不成功,则commit命令操作也不会成功;默认
-- 当数值为0:表示日志缓存信息写入磁盘是按照每秒种进行一次操作,未刷新日志的事务可能会在崩溃中丢失;不安全
-- 当数值为2:表示在事务提交后先生成日志缓存信息,然后再按照每秒钟进行一次写入磁盘操作;不安全
-- 参考官方链接:https://dev.mysql.com/doc/refman/8.0/en/innodb-parameters.html
事务工作流程二:undo log 回滚日志如何应用
- 事务发生数据页修改之前,会申请一个undo事务操作,保存了事务回滚日志(逆向操作的逻辑日志)
- undo写完之后,事务修改数据页头部(会记录DB_TRX_ID+DB+ROLL_PTR),这个信息也会被记录在redo Log中
简单理解:记录数据修改的前镜像(逆向操作),数据页和undo通过DB_TRX_ID,DB_ROLL_PTR建立关系
特殊情景分析01:
当执行rollback命令时,根据数据页的DB_TRX_ID+DB+ROLL_PTR信息,找到undo日志并进行回滚;
特殊情景分析02:
mysql> begin;
mysql> update t1 set A=2 where A=1;
-- 此时宕机了
假设:undo 有;redo 没有
- 启动数据库时,检查redo和数据页的LSN号码,发现是一致的;
- 所以不需要进行redo的前滚,此时也不需要回滚。undo信息直接被标记为可覆盖状态;
假设:undo 有;redo 也有(没有commit标签)
- MySQL CR(自动故障恢复)工作模式,启动数据库时,自动检查redo的LSN和数据页LSN;
- 如果发现redo LSN>数据页的LSN。随即加载原始数据页+变化redo Log日志信息到相应内存位置,使用redo重构脏页(前滚);
- 如果确认此次事务没有commit标记,立即触发回滚操作,根据DB_TRX_ID+DB_ROLL_PTR信息,找到undo回滚日志,实现回滚;
以上流程被称之为InnoDB的核心特性:自动故障恢复(CR),会先前滚再回滚,先应用redo再应用undo;
undo保证了ACID哪些特性:
主要保证事务的A的特性,同时C和I的特性也有关系;
undo Log日志文件生成流程:

undo Log日志文件应用流程:

说明:利用undo Log重做日志功能可以保证事务的A特性,基于先进行数据页前滚操作恢复脏页,在进行回滚操作恢复操作前事务;
事务工作流程三:事务中的C特性如何保证
InnoDB crash recovery:数据库意外宕机时刻,通过redo前滚+undo回滚保证数据的最终一致;
InnoDB doubewrite buffer:默认存储在ibdataN中,解决数据页写入不完整;DWB一共2M,分两次。每次1M写入;
redo日志只能恢复好的数据页的内容,但是不能恢复已经有异常的数据页内容;
可以参考官方资料:https://dev.mysql.com/doc/refman/8.0/en/mysql-acid.html
DWB文件信息生成流程:

DWB文件信息应用流程:

事务工作流程四:事务中的I特性如何保证
主要对数据库服务并发访问资源的保护,在并发事务工作期间,防止事务与事务之间的资源争抢(相互影响);
- 保证读隔离性
方式一:利用隔离级别保证
| 序号 | 隔离级别 | 简单回顾 |
|---|---|---|
| 01 | RU | 有可能会出现脏读、不可重复读、幻读 |
| 02 | RC | 有可能会出现不可重复读,幻读 |
| 03 | RR | 有可能会出现幻读(99.9%的读异常问题配合锁机制都可以处理) |
| 04 | SR(SE) | 采用事务串行工作机制 |
方式二:利用MVCC机制隔离(只能保证读的隔离)
MVCC(multi-version-concurrent-control)即多版本并发控制,是一种并发控制的方法;
可以类别成Git进行并发处理的机制,其实就是每个事务在发生更新的过程中,维护发生更新事务的各个版本;
各个事务版本通过undo的日志(前镜像)实现快照的技术(read view),从而可以保存多个事务版本;
对于隔离级别而言,只有RC和RR级别可以使用到MVCC机制的,实现一种快照读机制,而RU和SR级别是不会使用到MVCC机制的;
- RC:应用MVCC的快照读机制,是基于语句级别的;
(不可重复读 ture)
在事务期间,执行每个查询语句的时候,都会检查MVCC版本(快照列表),获取最新的已提交事务的快照;
- RR:应用MVCC的快照读机制,是基于事务级别的;
(不可重复读 false)
在事务期间,执行首条查询语句的时候,就会生成MVCC版本(相应快照),将会一直读取此快照数据信息,直到事务生命周期结束;
以上的RR隔离级别利用MVCC的快照读机制,又称为一致性快照读;
==================================================================================================
MVCC进行多版本控制时,会应用的两种锁机制:乐观锁/悲观锁
每个事务操作都要经历两个阶段:
- 读阶段--应用乐观锁:
MVCC利用乐观锁机制,实现非锁定读取,借助快照技术(read view)
# 进行操作事务处理过程(trx1)
> begin;
> DML01 语句
-- 在做第一次事务操作的时候,当前事务获取系统最新的 rv1 版本快照
> DML02 语句
-- 在做下一次事务操作的时候,生成新的事务系统查询的 rv2 版本快照
> select
-- 此时查询的是 rv2快照数据信息
> commit
-- rv2 快照数据被提交,成为系统最新的快照
RC隔离级别快照应用:
trx-01:rv1 -> rv2 -> commit;
trx-02:rv1 -> rv1 -> rv2
RR隔离级别快照应用:
trx-01:第一个查询时,生成global consitence snapshot RV-CS1(10:00),一直伴随着事务生命周期结束
trx-02:第一个查询时,生成global consitence snapshot RV-CS2(10:01),一直伴随着事务生命周期结束
- 写阶段--应用悲观锁:
即对于写操作,是不能进行并发操作的;
MVCC技术总结:
01 mvcc采用乐观锁机制,实现非锁定读取;
02 在RC级别下,事务中可以立即读取到其它事务提交过的readview数据快照信息;
03 在RR级别下,事务中从第一次查询开始,生成一个一致性readview,直到事务结束
==================================================================================================
- 保证写隔离性
方式一:利用隔离级别保证
在应用不同隔离级别时也会有不同的锁机制
- RC:具有记录锁机制;
- RR:具有间隙锁机制+下一键锁机制(next lock) 表锁
方式二:利用锁进制隔离(保护并发访问资源)
| 类型 | 锁机制 | 简述说明 |
|---|---|---|
| 内存资源锁 | latch(闩锁) | 主要是保护内存资源;rwlock(读写锁)、mutex(只读锁) 避免不同程序争用相同地址区域内存资源) |
| 元数据锁 | MDL | 主要是保护元数据资源,限制DDL操作;metadata lock |
| 表级别锁 | table_lock | 主要是保护整个数据表资源; |
| 命令方式锁表 | lock table t1 read; | |
| 工具方式锁表 | 利用mysqldump、XBK(PBK)进行备份非InnoDB数据时,将触发FTWRL全局锁表; | |
| 行锁升级为表锁 | 比如做数据更新操作时,没有设置索引条件信息,就会出现全表扫描,出现表锁; | |
| 行级别锁 | row_lock | InnoDB默认锁粒度,加锁方式都是在索引上加锁的; |
| record lock | 记录锁,在聚簇索引锁定,在RC级别只有record lock | |
| gap lock | 间隙锁,在辅助索引间隙加锁,在RR级别存在,防止幻读; | |
| next look | 下一键锁,即GAP+Record,在RR级别存在,防止幻读; |
从功能应用方面进行锁分类:了解
- IS:表示意向读锁或查询锁,可以在表上进行加锁做提示(select * from t1 lock in shared mode);
- S:表示读锁或查询锁,现在基本上没有自动设置了,除非手工进行设置锁定(lock table t1 read);
- IX:表示意向写锁或排他锁,可以在表上进行加锁做提示(select * from t1 for update)
- X:表示写锁或排他锁,限制其他人的指定操作行为;
官方参考资料链接:https://dev.mysql.com/doc/refman/8.0/en/innodb-locking.html