MySQL统计信息的示例分析

89次阅读

没有评论

共计 2399 个字符，预计需要花费 6 分钟才能阅读完成。

自动写代码机器人，免费开通

这篇文章主要为大家展示了“MySQL 统计信息的示例分析”，内容简而易懂，条理清晰，希望能够帮助大家解决疑惑，下面让丸趣 TV 小编带领大家一起研究并学习一下“MySQL 统计信息的示例分析”这篇文章吧。

MySQL 统计信息的存储分为两种，非持久化和持久化统计信息。

一、非持久化统计信息

非持久化统计信息存储在内存里，如果数据库重启，统计信息将丢失。有两种方式可以设置为非持久化统计信息：

1 全局变量，

INNODB_STATS_PERSISTENT=OFF

2 CREATE/ALTER 表的参数，

STATS_PERSISTENT=0

非持久化统计信息在以下情况会被自动更新：

1 执行 ANALYZE TABLE

2 innodb_stats_on_metadata=ON 情况下，执 SHOW TABLE STATUS, SHOW INDEX, 查询 INFORMATION_SCHEMA 下的 TABLES, STATISTICS

3 启用 –auto-rehash 功能情况下，使用 mysql client 登录

4 表第一次被打开

5 距上一次更新统计信息，表 1 /16 的数据被修改

非持久化统计信息的缺点显而易见，数据库重启后如果大量表开始更新统计信息，会对实例造成很大影响，所以目前都会使用持久化统计信息。

二、持久化统计信息

5.6.6 开始，MySQL 默认使用了持久化统计信息，即 INNODB_STATS_PERSISTENT=ON，持久化统计信息保存在表 mysql.innodb_table_stats 和 mysql.innodb_index_stats。

持久化统计信息在以下情况会被自动更新：

1 INNODB_STATS_AUTO_RECALC=ON

情况下，表中 10% 的数据被修改

2 增加新的索引

innodb_table_stats 是表的统计信息，innodb_index_stats 是索引的统计信息，各字段含义如下：

innodb_table_stats

database_name

数据库名

table_name

表名

last_update

统计信息最后一次更新时间

n_rows

表的行数

clustered_index_size

聚集索引的页的数量

sum_of_other_index_sizes

其他索引的页的数量

innodb_index_stats

database_name

数据库名

table_name

表名

index_name

索引名

last_update

统计信息最后一次更新时间

stat_name

统计信息名

stat_value

统计信息的值

sample_size

采样大小

stat_description

类型说明

为更好的理解 innodb_index_stats，建一张测试表做说明：

CREATE TABLE t1 (
 a INT, b INT, c INT, d INT, e INT, f INT,
 PRIMARY KEY (a, b), KEY i1 (c, d), UNIQUE KEY i2uniq (e, f)
) ENGINE=INNODB;

写入数据如下：

查看 t1 表的统计信息，需主要关注 stat_name 和 stat_value 字段

tat_name=size 时：stat_value 表示索引的页的数量

stat_name=n_leaf_pages 时：stat_value 表示叶子节点的数量

stat_name=n_diff_pfxNN 时：stat_value 表示索引字段上唯一值的数量，此处做一下具体说明：

1、n_diff_pfx01 表示索引第一列 distinct 之后的数量，如 PRIMARY 的 a 列，只有一个值 1，所以 index_name= PRIMARY and stat_name= n_diff_pfx01 时，stat_value=1。

2、n_diff_pfx02 表示索引前两列 distinct 之后的数量，如 i2uniq 的 e,f 列，有 4 个值，所以 index_name= i2uniq and stat_name= n_diff_pfx02 时，stat_value=4。

3、对于非唯一索引，会在原有列之后加上主键索引，如 index_name= i1 and stat_name= n_diff_pfx03，在原索引列 c,d 后加了主键列 a，(c,d,a) 的 distinct 结果为 2。

了解了 stat_name 和 stat_value 的具体含义，就可以协助我们排查 SQL 执行时为什么没有使用合适的索引，例如某个索引 n_diff_pfxNN 的 stat_value 远小于实际值，查询优化器认为该索引选择度较差，就有可能导致使用错误的索引。

三、统计信息不准确的处理

我们查看执行计划，发现未使用正确的索引，如果是 innodb_index_stats 中统计信息差别较大引起，可通过以下方式处理：

1、手动更新统计信息，注意执行过程中会加读锁：

ANALYZETABLE TABLE_NAME;

2、如果更新后统计信息仍不准确，可考虑增加表采样的数据页，两种方式可以修改：

a) 全局变量 INNODB_STATS_PERSISTENT_SAMPLE_PAGES，默认为 20；

b) 单个表可以指定该表的采样：

ALTER TABLE TABLE_NAME STATS_SAMPLE_PAGES=40;

经测试，此处 STATS_SAMPLE_PAGES 的最大值是 65535，超出会报错。

目前 MySQL 并没有提供直方图的功能，某些情况下（如数据分布不均）仅仅更新统计信息不一定能得到准确的执行计划，只能通过 index hint 的方式指定索引。新版本 8.0 会增加直方图功能，让我们期待 MySQL 越来越强大的功能吧！

以上是“MySQL 统计信息的示例分析”这篇文章的所有内容，感谢各位的阅读！相信大家都有了一定的了解，希望分享的内容对大家有所帮助，如果还想学习更多知识，欢迎关注丸趣 TV 行业资讯频道！

向 AI 问一下细节

正文完

发表至：数据库

2023-12-04

转载说明：除特殊说明外本站除技术相关以外文章皆由网络搜集发布，转载请注明出处。

详解MySQL查询优化中的Using where 和 Using index概念

Holer如何实现Oracle外网访问

redis有什么用

redis

如何使用变量对SQL进行优化