共计 2140 个字符,预计需要花费 6 分钟才能阅读完成。
自动写代码机器人,免费开通
这篇文章给大家分享的是有关 MySQL 的数据行和行溢出机制是什么意思的内容。丸趣 TV 小编觉得挺实用的,因此分享给大家做个参考。一起跟随丸趣 TV 小编过来看看吧。
一、行 有哪些格式?
你可以像下面这样看一下你的 MySQL 行格式设置。
其实 MySQL 的数据行有两种格式,一种就是图中的 Compact 格式,还有一种是 Redundant 格式。
Compact 是一种紧凑的行格式,设计的初衷就是为了让一个数据页中可以存放更多的数据行。
你品一品,让一个数据页中可以存放更多的数据行是一个多么激动人心的事,MySQL 以数据页为单位从磁盘中读数据,如果能做到让一个数据页中有更多的行,那岂不是使用的空间变少了,且整体的效率直线飙升?
官网介绍:Compact 能比 Redundant 格式节约 20% 的存储。
Compact 从 MySQL5.0 引入,MySQL5.1 之后,行格式默认设置成 Compact。所以本文描述的也是 Compact 格式。
二、紧凑的行格式长啥样?
你肯定晓得表中有的列允许为 null,有的列是变长的 varchar 类型。
那 Compact 行格式是如何组织描述这些信息的呢?如下图:
每部分包含的数据可能要比我上面标注的 1、2、3 还要多。
为了给大家更直观的感受和理解我只是挑了一部分展示给大家看。
三、MySQL 单行能存多大体量的数据?
在 MySQL 的设定中,单行数据最大能存储 65535byte 的数据(注意是 byte,而不是字符)
但是当你像下面这样创建一张数据表时却发生了错误:
MySQL 不允许创建一个长度为 65535byte 的列,因为数据页中每一行中都有我们上图提到的隐藏列。
所以将 varchar 的长度降低到 65532byte 即可成功创建该表
注意这里的 65535 指的是字节,而不是字符。
所以如果你将 charset 换成 utf8 这种编码格式,那 varchar(N) 中的 N 其实指的 N 个字符,而不是 N 个 byte。所以如果你像下面这样创建表就会报错。
假如 encode=utf8 时三个 byte 表示一个字符。那么 65535 / 3 = 21845 个字符。
四、Compact 格式是如何做到紧凑的?
MySQL 每次进行随机的 IO 读
默认情况下,数据页的大小为 16KB。数据页中存储着数行。
那就意味着一个数据页中能存储越多的数据行,MySQL 整体的进行的 IO 次数就越少?性能就越快?
Compact 格式的实现思路是:当列的类型为 VARCHAR、VARBINARY、BLOB、TEXT 时,该列超过 768byte 的数据放到其他数据页中去。
如下图:
看到这里来龙去脉是不是很清晰了呢?
MySQL 这样做,有效的防止了单个 varchar 列或者 Text 列太大导致单个数据页中存放的行记录过少而让 IO 飙升的窘境且占内存的。
五、什么是行溢出?
那什么是行溢出呢?
如果数据页默认大小为 16KB,换算成 byte:16*1024 = 16384 byte
那你有没有发现,单页能存储的 16384byte 和单行最大能存储的 65535byte 差了好几倍呢?
也就是说,假如你要存储的数据行很大超过了 65532byte 那么你是写入不进去的。假如你要存储的单行数据小于 65535byte 但是大于 16384byte,这时你可以成功 insert,但是一个数据页又存储不了你插入的数据。这时肯定会行溢出!
其实在 MySQL 的设定中,发生行溢出并不是达到 16384byte 边缘才会发生。
对于 varchar、text 等类型的行。当这种列存储的长度达到几百 byte 时就会发生行溢。
六、行 如何溢出?
还是看这张图:
在 MySQL 设定中,当 varchar 列长度达到 768byte 后,会将该列的前 768byte 当作当作 prefix 存放在行中,多出来的数据溢出存放到溢出页中,然后通过一个偏移量指针将两者关联起来,这就是行溢出机制。
七、思考一个问题
不知道你有没有想过这样一个问题:
首先你肯定知道,MySQL 使用的是 B +Tree 的聚簇索引,在这棵 B +Tree 中非叶子节点是只存索引不存数据,叶子节点中存储着真实的数据。同时叶子结点指向数据页。
那当单行存不下的时候,为啥不存储在两个数据页中呢?就像下图这样~。
单个节点存储下,我用多个节点存总行吧!说不定这样我的 B +Tee 还能变大长高(这其实是错误的想法)
这个错误的描述对应的脑图如下:
那 MySQL 不这样做的原因如下:
MySQL 想让一个数据页中能存放更多的数据行,至少也得要存放两行数据。否则就失去了 B +Tree 的意义。B+Tree 也退化成一个低效的链表。
你可以品一下这句蓝色的话,他说的每个数据页至少要存放两行数据的意思不是说 数据页不能只存一行。你确确实实可以只往里面写一行数据,然后去吃个饭,干点别的。一直让这个数据页中只有一行数据。
这句话的意思是,当你往这个数据页中写入一行数据时,即使它很大将达到了数据页的极限,但是通过行溢出机制。依然能保证你的下一条数据还能写入到这个数据页中。
正确的脑图如下:
感谢各位的阅读!关于 MySQL 的数据行和行溢出机制是什么意思就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到吧!
向 AI 问一下细节丸趣 TV 网 – 提供最优质的资源集合!