MySQL的优化器对于count(*)的处理方式是什么

50次阅读
没有评论

共计 2912 个字符,预计需要花费 8 分钟才能阅读完成。

今天就跟大家聊聊有关 MySQL 的优化器对于 count(*)的处理方式是什么,可能很多人都不太了解,为了让大家更加了解,丸趣 TV 小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。

  最近看了很多阿里同学的 MySQL 文章,阿里内核同学的文章一言不合就上代码,不光让我们看到了结果,还能有代码可读,如果碰到了类似的问题,这样的解读确实是很难得的。

  今天做了一个小的测试,发现 MySQL 5.7 中对于 count(*) 的处理好像有点霸道,没想象中那么好。

  为了对比,我找了一套 5.6 的环境。

总体而言 5.6 的环境中对于 count(*) 的处理可塑性很强,很随和,你让我怎么查我就怎么查。初始数据为 100 万。

+———-+
| count(*) |
+———-+
|  1000000 |
+———-+

建表的语句如下:

show create table test\G
*************************** 1. row ***************************
  Table: test
Create Table: CREATE TABLE `test` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `a` int(11) DEFAULT NULL,
  `b` int(11) DEFAULT NULL,
  `c` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `mrrx` (`a`,`b`),
  KEY `xx` (`c`)
) ENGINE=InnoDB AUTO_INCREMENT=1000001 DEFAULT CHARSET=utf8
1 row in set (0.00 sec) 一直以来 MySQL 中 count(*) 的用法都是不被提倡,或者说是恶名远扬,这一点让很多学习 Oracle 的同学很不理解,其实他们是身在福中不知福。

这样的一个 count(*) 的查询,在 5.6 中的效果是这样的,估算的时候默认是走了索引 xx

explain select count(*) from test\G
*************************** 1. row ***************************
  id: 1
  select_type: SIMPLE
  table: test
  type: index
possible_keys: NULL
  key: xx
  key_len: 5
  ref: NULL
  rows: 998396
  Extra: Using index
1 row in set (0.01 sec) 
如果我们强制走 mrrx 索引,优化器说也行,于是就走了 mrrx 的索引,估算的数据情况和上面有一些小的差别。
explain select count(*) from test force index(mrrx)\G
*************************** 1. row ***************************
  id: 1
  select_type: SIMPLE
  table: test
  type: index
possible_keys: NULL
  key: mrrx
  key_len: 10
  ref: NULL
  rows: 947698
  Extra: Using index
1 row in set (0.00 sec) 或者我们显式指定就要 xx 索引了,优化器说好,然后估算得到的行数和第一个差别很小。
explain select count(*) from test force index(xx)\G
*************************** 1. row ***************************
  id: 1
  select_type: SIMPLE
  table: test
  type: index
possible_keys: NULL
  key: xx
  key_len: 5
  ref: NULL
  rows: 947698
  Extra: Using index
1 row in set (0.00 sec) 如果换一种姿势,如果指定索引列 c, 指定一个条件,再来看看,就会看到前后的结果差别就很大了。
explain select count(*) from test where c 0\G
*************************** 1. row ***************************
  id: 1
  select_type: SIMPLE
  table: test
  type: range
possible_keys: xx
  key: xx
  key_len: 5
  ref: NULL
  rows: 473849
  Extra: Using where; Using index
1 row in set (0.00 sec) 这么看来,5.6 里面的一个硬伤还是对于统计信息这块的评估差别较大,没有了统计信息还是有很大的局限性,不过优化器还是很随和的。

我们看看 5.7 的表现

同样的语句和数据量,在 5.7 中明显做了过滤处理,

explain select count(*) from test\G
*************************** 1. row ***************************
  id: 1
  select_type: SIMPLE
  table: NULL
  partitions: NULL
  type: NULL
possible_keys: NULL
  key: NULL
  key_len: NULL
  ref: NULL
  rows: NULL
  filtered: NULL
  Extra: Select tables optimized away
1 row in set, 1 warning (0.02 sec)

这表示在优化器阶段已经被优化了。

而接下来同样的语句也都是同样的处理方式。

explain select count(*) from test force index(mrrx)\G
explain select count(*) from test force index(xx)\G
  Extra: Select tables optimized away

而如果我们还是像之前一样给定索引列 c 一个过滤条件,优化器就一下子变得温和起来。很明显这个执行的效果要好很多。

explain select count(*) from test where c 0\G
*************************** 1. row ***************************
  id: 1
  select_type: SIMPLE
  table: test
  partitions: NULL
  type: range
possible_keys: xx
  key: xx
  key_len: 5
  ref: NULL
  rows: 498949
  filtered: 100.00
  Extra: Using where; Using index
1 row in set, 1 warning (0.02 sec)

从某种程度来说,5.7 这样的处理也算是一种变相的退步啦。

看完上述内容,你们对 MySQL 的优化器对于 count(*)的处理方式是什么有进一步的了解吗?如果还想了解更多知识或者相关内容,请关注丸趣 TV 行业资讯频道,感谢大家的支持。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-19发表,共计2912字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)