InnoDB的插入缓冲方法

125次阅读

没有评论

共计 3243 个字符，预计需要花费 9 分钟才能阅读完成。

自动写代码机器人，免费开通

丸趣 TV 小编给大家分享一下 InnoDB 的插入缓冲方法，希望大家阅读完这篇文章后大所收获，下面让我们一起去探讨吧！

InnoDB 引擎有几个重点特性，为其带来了更好的性能和可靠性：

插入缓冲（Insert Buffer）两次写（Double Write）自适应哈希索引（Adaptive Hash Index）异步 IO（Async IO）刷新邻接页（Flush Neighbor Page）

今天我们的主题就是插入缓冲（Insert Buffer）, 由于 InnoDB 引擎底层数据存储结构式 B + 树，而对于索引我们又有聚集索引和非聚集索引。

在进行数据插入时必然会引起索引的变化，聚集索引不必说，一般都是递增有序的。而非聚集索引就不一定是什么数据了，其离散性导致了在插入时结构的不断变化，从而导致插入性能降低。

所以为了解决非聚集索引插入性能的问题，InnoDB 引擎创造了 Insert Buffer。

Insert Buffer 的存储

看到上图，可能大家会认为 Insert Buffer 就是 InnoDB 缓冲池的一个组成部分。

** 重点：** 其实对也不对，InnoDB 缓冲池确实包含了 Insert Buffer 的信息，但 Insert Buffer 其实和数据页一样，也是物理存在的（以 B + 树的形式存在共享表空间中）。

Insert Buffer 的作用

先说几个点：

一张表只能有一个主键索引，那是因为其物理存储是一个 B + 树。（别忘了聚集索引叶子节点存储的数据，而数据只有一份）

非聚集索引叶子节点存的是聚集索引的主键

聚集索引的插入

首先我们知道在 InnoDB 存储引擎中，主键是行唯一的标识符（也就是我们常叨叨的聚集索引）。我们平时插入数据一般都是按照主键递增插入，因此聚集索引都是顺序的，不需要磁盘的随机读取。

比如表：

CREATE TABLE test(
 id INT AUTO_INCREMENT,
 name VARCHAR(30),
 PRIMARY KEY(id)
); 复制代码

如上我创建了一个主键 id, 它有以下的特性：

Id 列是自增长的 Id 列插入 NULL 值时，由于 AUTO_INCREMENT 的原因，其值会递增同时数据页中的行记录按 id 的值进行顺序存放

一般情况下由于聚集索引的有序性，不需要随机读取页中的数据，因为此类的顺序插入速度是非常快的。

但如果你把列 Id 插入 UUID 这种数据，那你插入就是和非聚集索引一样都是随机的了。会导致你的 B + tree 结构不停地变化，那性能必然会受到影响。

非聚集索引的插入

很多时候我们的表还会有很多非聚集索引，比如我按照 b 字段查询，且 b 字段不是唯一的。如下表：

CREATE TABLE test(
 id INT AUTO_INCREMENT,
 name VARCHAR(30),
 PRIMARY KEY(id),
 KEY(name)
); 复制代码

这里我创建了一个 x 表，它有以下特点：

有一个聚集索引 id 有一个不唯一的非聚集索引 name 在插入数据时数据页是按照主键 id 进行顺序存放辅助索引 name 的数据插入不是顺序的

非聚集索引也是一颗 B + 树，只是叶子节点存的是聚集索引的主键和 name 的值。

因为不能保证 name 列的数据是顺序的，所以非聚集索引这棵树的插入必然也不是顺序的了。

当然如果 name 列插入的是时间类型数据，那其非聚集索引的插入也是顺序的。

Insert Buffer 的到来

可以看出非聚集索引插入的离散性导致了插入性能的下降，因此 InnoDB 引擎设计了 Insert Buffer 来提高插入性能。

我来看看使用 Insert Buffer 是怎么插入的：

首先对于非聚集索引的插入或更新操作，不是每一次直接插入到索引页中，而是先判断插入的非聚集索引页是否在缓冲池中。

若在，则直接插入；若不在，则先放入到一个 Insert Buffer 对象中。

给外部的感觉好像是树已经插入非聚集的索引的叶子节点，而其实是存放在其他位置了

以一定的频率和情况进行 Insert Buffer 和辅助索引页子节点的 merge（合并）操作，通常会将多个插入操作一起进行 merge，这就大大的提升了非聚集索引的插入性能。

Insert Buffer 的使用要求：索引是非聚集索引索引不是唯一（unique）的

只有满足上面两个必要条件时，InnoDB 存储引擎才会使用 Insert Buffer 来提高插入性能。

那为什么必须满足上面两个条件呢？

第一点索引是非聚集索引就不用说了，人家聚集索引本来就是顺序的也不需要你

第二点必须不是唯一（unique）的，因为在写入 Insert Buffer 时，数据库并不会去判断插入记录的唯一性。如果再去查找肯定又是离散读取的情况了，这样 InsertBuffer 就失去了意义。

Insert Buffer 信息查看

我们可以使用命令 SHOW ENGINE INNODB STATUS 来查看 Insert Buffer 的信息：

-------------------------------------
INSERT BUFFER AND ADAPTIVE HASH INDEX
-------------------------------------
Ibuf: size 7545, free list len 3790, seg size 11336, 
8075308 inserts,7540969 merged sec, 2246304 merges
... 复制代码

使用命令后，我们会看到很多信息，这里我们只看下 INSERT BUFFER 的:

seg size 代表当前 Insert Buffer 的大小 11336*16KB

free listlen 代表了空闲列表的长度

size 代表了已经合并记录页的数量

Inserts 代表了插入的记录数

merged recs 代表了合并的插入记录数量

merges 代表合并的次数，也就是实际读取页的次数

merges：merged recs 大约为 1∶3，代表了 Insert Buffer 将对于非聚集索引页的离散 IO 逻辑请求大约降低了 2 /3

Insert Buffer 的问题

说了这么多针对于 Insert Buffer 的好处，但目前 Insert Buffer 也存在一个问题：

即在写密集的情况下，插入缓冲会占用过多的缓冲池内存（innodb_buffer_pool），默认最大可以占用到 1 / 2 的缓冲池内存。

占用了过大的缓冲池必然会对其他缓冲池操作带来影响

Insert Buffer 的优化

MySQL5.5 之前的版本中其实都叫做 Insert Buffer，之后优化为 Change Buffer 可以看做是 Insert Buffer 的升级版。

插入缓冲（Insert Buffer）这个其实只针对 INSERT 操作做了缓冲，而 Change Buffer 对 INSERT、DELETE、UPDATE 都进行了缓冲，所以可以统称为写缓冲，其可以分为：

Insert Buffer

Delete Buffer

Purgebuffer

总结：

Insert Buffer 到底是个什么？

其实 Insert Buffer 的数据结构就是一棵 B + 树。

在 MySQL 4.1 之前的版本中每张表有一棵 Insert Buffer B+ 树

目前版本是全局只有一棵 Insert Buffer B+ 树，负责对所有的表的辅助索引进行 Insert Buffer

这棵 B + 树存放在共享表空间 ibdata1 中

以下几种情况下 Insert Buffer 会写入真正非聚集索引，也就是所说的 Merge Insert Buffer

当辅助索引页被读取到缓冲池中时 Insert Buffer Bitmap 页追踪到该辅助索引页已无可用空间时 Master Thread 线程中每秒或每 10 秒会进行一次 Merge Insert Buffer 的操作

一句话概括下：

Insert Buffer 就是用于提升非聚集索引页的插入性能的，其数据结构类似于数据页的一个 B + 树，物理存储在共享表空间 ibdata1 中。

看完了这篇文章，相信你对 InnoDB 的插入缓冲方法有了一定的了解，想了解更多相关知识，欢迎关注丸趣 TV 行业资讯频道，感谢各位的阅读！

向 AI 问一下细节

丸趣 TV 网 – 提供最优质的资源集合！

正文完

发表至：数据库

2023-12-18

转载说明：除特殊说明外本站除技术相关以外文章皆由网络搜集发布，转载请注明出处。

如何安装navicat

PostgreSQL中citus节点间的网络需求有哪些

怎么使用Mysql来管理关系型数据库

怎么安装并激活Navicat Premium 12.0.29

mysql个别文字乱码怎么办