MySQL - MVCC 并发版本控制实现

版本链

在InnoDB引擎表中,他们的聚簇索引记录中有两个隐藏列:

  • trx_id:用来存储对数据进行修改时的事务id

  • roll_pointer:每次对哪条聚簇索引记录有修改的时候,就会把老版本写入undo日志中。这个roll_pointer就是存了一个指针,它指向这条聚簇索引记录的上一个版本的位置,通过它来获得上一个版本的记录信息。

id name trx_id roll_pointer
1 小明 50 0x00af

例如目前有个trx_id是60的事务正执行如下语句:update table set name = '小明1' where id = 1

此时在 undo 日志中就存在版本链

id name trx_id roll_pointer
1 小明1 60 last_version
↓指向
1 小明 50 null

版本链可以类似git一样,对一行的数据进行版本控制,可以通过 undo_log进行回滚操作

ReadView

读已提交和可重复读的区别就在于它们生成ReadView的策略不同。

ReadView中主要就是有个列表来存储我们系统中当前活跃的读写事务( begin未 commit 的 tx)。通过这个列表来判断记录的某个版本是否对当前事务可见。假设当前列表里的事务 id 为[80,100]。

  • 如果你要访问的记录版本的事务 id 为 50,id <= 80(最小事务id),那说明这个事务在之前就提交了,所以对当前活动的事务来说是可访问的。
  • 如果你要访问的记录版本的事务 id 为 90, id >= 80 && id <= 100,那就再判断一下是否在列表内,如果在那就说明此事务还未提交,所以版本不能被访问。如果不在那说明事务已经提交,所以版本可以被访问。
  • 如果你要访问的记录版本的事务id为110,id >= 100,那说明这个版本是在 ReadView 生成之后才发生的,所以不能被访问。

这些记录都是去版本链里面找的,先找最近记录,如果最近这一条记录事务id不符合条件,不可见的话,再去找上一个版本再比较当前事务的id和这个版本事务id看能不能访问,以此类推直到返回可见的版本或者结束。

举个例子 ,在已提交读隔离级别下:

比如此时有一个事务id为100的事务,修改了name,使得的name等于小明2,但是事务还没提交。则此时的版本链是

id name trx_id roll_pointer
1 小明2 100 last_version
↓指向
1 小明1 60 last_version
↓指向
1 小明 50 null

那此时另一个事务发起了 select 语句要查询 id 为 1 的记录,那此时生成的 ReadView 列表只有[100]。那就去版本链去找了,首先肯定找最近的一条,发现 trx_id 是 100,也就是 name 为 小明2 的那条记录,发现在列表内,所以不能访问。

这时候就通过指针继续找下一条,name为 小明1 的记录,发现 trx_id 是 60,小于列表中的最小 id,所以可以访问,直接访问结果为 小明1

那这时候我们把事务 id 为 100 的事务提交了,并且新建了一个事务 id 为 110 也修改 id 为 1 的记录,并且不提交事务

1
2
3
-- trx_id = 110
BEGIN;
update table set name = '小明3' where id = 1

这时候版本链就是

id name trx_id roll_pointer
1 小明3 110 last_version
↓指向
1 小明2 100 last_version
↓指向
1 小明1 60 last_version
↓指向
1 小明 50 null

这时候之前那个select事务又执行了一次查询,要查询id为1的记录。

不同隔离级别造成此处结果不同

如果你是 已提交读 隔离级别,这时候你会重新一个ReadView,那你的活动事务列表中的值就变了,变成了[110]。

按照上的说法,你去版本链通过trx_id对比查找到合适的结果就是小明2。

如果你是 可重复读 隔离级别,这时候你的 ReadView 还是第一次 select 时候生成的 ReadView, 也就是列表的值还是[100]。所以 select 的结果是小明1。所以第二次 select 结果和第一次一样,所以叫 可重复读

这就是Mysql的MVCC,通过版本链,实现多版本,可并发读-写,写-读。通过ReadView生成策略的不同实现不同的隔离级别。

Licensed under CC BY-NC-SA 4.0
Built with Hugo
Theme Stack designed by Jimmy