MySQL源码学习:InnoDB关于group commit的简单QA

    前天同事问了个问题,今天又再翻了下group commit。关于这个话题Kristian Nielsen有一个很详尽的系列文章(http://kristiannielsen.livejournal.com/12254.html), 有四个页面,文中有链接。这里列出一些细节,主要是对上面文章补充一下。

Q:什么是group commit

A1) 简单说就是:好几个线程写文件,然后一个线程fsync

2) 只有事务日志(ib_logfile)用到;

3) 注意是多个线程(多用户)。一个线程在一个事务过程中若出现多次写事务日志,是不能一起提交的。

Q: 既然是多个线程,那怎么决定由哪个线程去”commit”

A:其实每个线程都会试着去fsync。成功fsync之后线程会修改log_sys->written_to_all_lsn 另外一个线程在fsync之前若判断log_sys->written_to_all_lsn大于自己的lsn,说明自己要作的事儿已经被别的线程做掉了,直接返回(group commit获益)。

Q:group commit怎么保证事务日志顺序和bin-log顺序一致。

A:这个问题是在Kristian Nielsen那篇文章中纠结最多的。目前的做法,是在写binlog前的prepare阶段加了个锁,这个锁直到binlog写完,然后将新的binlog位置填到trx->mysql_log_offset才解开。因此两个日志上的事务顺序是保证一致的。

在这个机制下,binlog是无法实现group commit的,所以直到最新的5.6版本中的log_xid函数的注释中依旧写着”todo: group commit”

(补充说明:Percona 5.5.18版本以后已经有binlog group commit的功能)

上一篇:关于InnoDB事务的一个“诡异”现象


下一篇:MySQL源码学习:简述InnoDB的BP LRU策略