MySQL存储引擎之InnoDB架构的知识点有哪些

141次阅读

共计 3442 个字符，预计需要花费 9 分钟才能阅读完成。

本篇内容主要讲解“MySQL 存储引擎之 InnoDB 架构的知识点有哪些”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让丸趣 TV 小编来带大家学习“MySQL 存储引擎之 InnoDB 架构的知识点有哪些”吧!

一、支持的存储引擎

进入 MySQL 的数据库查看存储引擎就可以看到 MySQL 数据库所有支持的存储引擎：

SHOW ENGINES

登录后复制

目前有一个引擎 Federated 不支持，我们只需要清楚其他八种数据库存储就好。

MySQL 中常见的数据库引擎有 MyISAM、InnoDB、Memory。那么我们就先清楚这三种引擎。

二、InnoDB 引擎

InnoDB 是 MySQL 的默认引擎，一个支持事务安全的存储引擎。mysql 中数据是存储在物理磁盘上的，而真正的数据处理又是在内存中执行的。由于磁盘的读写速度非常慢，如果每次操作都对磁盘进行频繁读写的话，那么性能就会非常差。

为了上述问题，InnoDB 将数据划分为若干页，以页作为磁盘与内存交互的基本单位，一般页的大小为 16KB。这样的话，一次性至少读取 1 页数据到内存中或者将 1 页数据写入磁盘。通过减少内存与磁盘的交互次数，从而提升性能。

这本质上就是一种典型的缓存设计思想，一般缓存的设计基本都是从时间维度或者空间维度进行考量的：

时间维度：如果一条数据正在在被使用，那么在接下来一段时间内大概率还会再被使用。可以认为热点数据缓存都属于这种思路的实现。

空间维度：如果一条数据正在在被使用，那么存储在它附近的数据大概率也会很快被使用。InnoDB 的数据页和操作系统的页缓存则是这种思路的体现。

下面是官方的 InnoDB 引擎结构图，主要分为内存结构和磁盘结构两大部分。

内存结构主要包括 Buffer Pool、Change Buffer、Adaptive Hash Index 和 Log Buffer 四大组件。

1.Buffer Pool

Buffer Pool 由包含数据、索引、insert buffer ,adaptive hash index,lock 信息及数据字典。缓冲池，简称 BP。BP 以 Page 页为单位，默认大小 16K，BP 的底层采用链表数据结构管理 Page。在 InnoDB 访问表记录和索引时会在 Page 页中缓存，以后使用可以减少磁盘 IO 操作，提升效率。

缓冲池简单来说就是一块内存区域，通过内存的速度来弥补磁盘速度较慢对数据库性能的影响。在数据库中进行读取页的操作，首先将从磁盘读到的页存放在缓冲池中，这个过程称为将页 FIX 在缓冲池中。下一次再读取相同的页时，首先判断该页是否在缓冲池中。若在缓冲池中，称该页在缓冲池中被命中。直接读取该页。否则读取磁盘上的页。对于数据库中页的修改操作，则首先修改在缓冲池中的页，然后再以一定的频率刷新到磁盘上。这里需要注意的是，页从缓冲池刷新回磁盘的操作并不是每次页发生更新时触发，而是通过一种称为 Checkpoint 的机制刷新回磁盘。同样这也是为了提高数据库的整体性能。

传统 LUR 算法

缓冲池是通过 LRU(Latest Recent Used，最近最少使用)算法来进行管理的，即最频繁使用的页在 LRU 列表的最前段，而最少使用的页在 LRU 列表的尾端，当缓冲池不能存放新读取到的页时，首先释放 LRU 列表尾端的页：

（1）页已经在缓冲池里，那就只做“移至”LRU 头部的动作，而没有页被淘汰；

（2）页不在缓冲池里，除了做“放入”LRU 头部的动作，还要做“淘汰”LRU 尾部页的动作；

但是 InnoDB 的 LUR 算法并不是传统的 LUR 算法。

这里有两个问题：

（1）预读失效；

（2）缓冲池污染；

我们先了解什么是预读；

预读

磁盘读写，并不是按需读取，而是按页读取，一次至少读一页数据（一般是 4K），如果未来要读取的数据就在页中，就能够省去后续的磁盘 IO，提高效率。数据访问，通常都遵循“集中读写”的原则，使用一些数据，大概率会使用附近的数据，这就是所谓的“局部性原理”，它表明提前加载是有效的，确实能够减少磁盘 IO。

预读失效

由于预读(Read-Ahead)，提前把页放入了缓冲池，但最终 MySQL 并没有从页中读取数据，称为预读失效。

要优化预读失效，思路是：

（1）让预读失败的页，停留在缓冲池 LRU 里的时间尽可能短；

（2）让真正被读取的页，才挪到缓冲池 LRU 的头部；

以保证，真正被读取的热数据留在缓冲池里的时间尽可能长。

具体方法是：

（1）将 LRU 分为两个部分：

新生代(new sublist)

老生代(old sublist)

（2）新老生代收尾相连，即：新生代的尾 (tail) 连接着老生代的头(head)；

（3）新页（例如被预读的页）加入缓冲池时，只加入到老生代头部：

如果数据真正被读取（预读成功），才会加入到新生代的头部

如果数据没有被读取，则会比新生代里的“热数据页”更早被淘汰出缓冲池

新老生代改进版 LRU 仍然解决不了缓冲池污染的问题。

2.Log Buffer

Log Buffer 用来缓存重做日志。

InnoDB 有两个非常重要的日志：undo log、redo log

（1）通过 undo log 可以看到数据较早版本，实现 MVCC，或回滚事务等功能。

（2）通过 redo log 用来保证事务持久性。

redo 日志缓冲区是内存存储区域，用于保存要写入磁盘上的日志文件的数据。日志缓冲区大小由 innodb_log_buffer_size 变量定义，默认大小为 16MB。

日志缓冲区的内容定期刷新到磁盘。较大的日志缓冲区可以运行大型事务，而无需在事务提交之前将重做日志数据写入磁盘。因此，如果有更新，插入或删除许多行的事务，则增加日志缓冲区的大小可以节省磁盘 I /O。

innodb_flush_log_at_trx_commit：控制如何将日志缓冲区的内容写入并刷新到磁盘。

innodb_flush_log_at_timeout：控制日志刷新频率。

如果磁盘 I / O 导致性能问题，则需要观察事务, 例如涉及许多 BLOB 条目的事务。只要 InnoDB 日志缓冲区已满，便会将其刷新到磁盘，因此增加缓冲区大小可以减少 I /O。

日志文件的缺省数量为两个: ib_logfile0 和 ib_logfile1。

日志具有固定大小，默认大小取决于 MySQL 版本。

3.Adaptive Hash Index

Adaptive Hash Index 自适应 hash 索引是一种键值对的存储结构，存储的是热点页所在的记录。InnoDB 存储引擎会自动根据访问的频率和模式来为某些页建立哈希索引。

上面的图就是区分 B + 树索引和自适应 hash 索引的区别。通过参数 innodb_adaptive_hash_index 来禁用或启动此特性，默认为开启。

4.Change Buffer

Change Buffer：MySQL 中数据分为内存和磁盘两个部分；在 buffer pool 中缓存热的数据页和索引页，减少磁盘读；通过 change buffer 就是为了缓解磁盘写的一种手段。

当需要更新一个数据页时，如果数据页在内存中就直接更新。如果数据页不在内存中。在不影响数据一致性的前下，InooDB 会将这些更新操作缓存在 change buffer 中，这样就不需要从磁盘中读入这个数据页了。在下次查询需要访问这个数据页的时候，将数据页读入内存，然后执行 change buffer 中与这个页有关的操作。通过这种方式就能保证这个数据逻辑的正确性。

虽然名字叫作 change buffer，实际上它是可以持久化的数据。也就是说，change buffer 在内存中有拷贝，也会被写入到磁盘上（ibdata）。

将 change buffer 中的操作合并到原数据页，得到最新结果的过程称为 merge。以下情况会触发 merge：

访问这个数据页；

后台 master 线程会定期 merge；

数据库缓冲池不够用时；

数据库正常关闭时；

redo log 写满时；

change buffer 就是在非唯一普通索引页不在 buffer pool 中时，对页进行了写操作的情况下，先将记录变更缓冲，等未来数据被读取时，再将 change buffer 中的操作 merge 到原数据页的技术。在 MySQL5.5 之前，叫插入缓冲(insert buffer)，只针对 insert 做了优化；现在对 delete 和 update 也有效，叫做写缓冲(change buffer)。

到此，相信大家对“MySQL 存储引擎之 InnoDB 架构的知识点有哪些”有了更深的了解，不妨来实际操作一番吧！这里是丸趣 TV 网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

正文完