上一篇《Innodb页面存储结构-1》介绍了Innodb页面存储的总体结构,本文会介绍页面的详细内容,主要包括页头、页尾和记录的详细格式。
学习数据结构时都说程序等于数据结构+算法,而在innodb中,其页面结构和记录格式可以说就是其数据结构。并且理解这些结构后,对innodb的页面行为(算法)的理解也有很大帮助。
上一篇说到页头就是一个页面第一个组成部分,表示该页的控制信息以及页面的使用情况。数据页的页头可分为两个部分:
- 通用页头:表示所有页面都使用的页头,占38个字节。innodb的页面有很多类型,如簇描述页、事务信息页、数据字典页、ibuf页、数据页等。这些不同类型的页面都有自己的页头,但都会包含这38字节的通用页头,记录一些通用信息。
- 数据页头:接下来的112个字节是数据页头,表示数据页的头信息。前面说到,innodb的页面有很多类型,上一篇和本文都是针对数据页来介绍的。数据页,顾名思义就是存储真正数据的页面,而数据页头是记录数据页的头信息,其他类型的页面有其他头信息。
也就是说,数据页页头的总大小为38+112=150字节。下面详细介绍页头记录的内容。
上一篇第一节介绍了B+树的基础内容,提到相同层次页面是通过一个双向链表连接起来的。而左兄弟页号就是该页在链表中的左兄弟页号。当然,左右兄弟页面都必须属于同一表空间。
上一篇说过不是真正的二分查找)。考虑以上情况,如果插入记录4前,先保存上一次插入记录3的位置,那么插入记录4就不需要二分查找来确定插入位置。
因此,页面统计优化就是针对按索引键顺序连续插入记录的优化,可以快速定位插入位置而避免过多的二分查找。并且,按索引键插入的情况是非常常见的,如以自增列或时间为主键的表。
页面统计优化的相关页头的意义为
- PAGE_LAST_INSERT:存储上次插入记录的位置
- PAGE_DIRECTION:存储插入的方向,如果本次插入比上次插入的值大就是PAGE_RIGHT,反之就是PAGE_LEFT。
- PAGE_N_DIRECTION:相同插入方向的连续插入次数,即递增插入或递减插入的次数。
页面统计优化的逻辑是:
假设PAGE_LAST_INSERT指向的记录是last_insert_rec,比last_insert_rec大的下一条记录是next_rec,比last_insert_rec小的上一条记录是prev_rec,插入的记录是rec。
- 1. 如果PAGE_N_DIRECTION > 3并且PAGE_DIRECTION为PAGE_RIGHT,即递增插入的次数多于3次,继续。否则,不能使用统计优化。
- 2. 如果last_insert_rec <= rec <= next_rec,则last_insert_rec就是插入位置,不需二分查找,返回。否则,不能使用统计优化。
- 3. 如果递减插入,并不使用该项优化。
除了统计优化,以上三个页头也会影响页面分裂的行为,即不是平分为两个页面,而是根据PAGE_LAST_INSERT指向的记录划分。另外,还影响页面分裂是往左分裂还是往右分裂,详见函数btr_page_split_and_insert。
上一篇提到,页面有效记录是从小到大通过记录指针(下一条记录相对于页面偏移)而连接起来的。那么这个偏移指的就是记录体的偏移,而不是记录头。
这样做的目的是根据记录指针向左和向右就可以分别解析记录头和记录体。
并且,不管聚集索引还是二级索引记录,记录格式都是一致的,仅是记录体的内容会不一样。显然,聚集索引记录体的内容会更多,5.4节会详细介绍。