MySQL索引及优化的知识点有哪些

196次阅读

没有评论

共计 3158 个字符，预计需要花费 8 分钟才能阅读完成。

这篇文章主要介绍“MySQL 索引及优化的知识点有哪些”的相关知识，丸趣 TV 小编通过实际案例向大家展示操作过程，操作方法简单快捷，实用性强，希望这篇“MySQL 索引及优化的知识点有哪些”文章能帮助大家解决问题。

索引是什么？

索引是帮助 MySQL 进行高效查询的一种数据结构。好比一本书的目录，能加快查询的速度

索引的结构？

索引可以有 B -Tree 索引，Hash 索引。索引是在存储引擎中实现的

InnoDB / MyISAM 仅支持 B-Tree 索引

Memory/Heap 支持 B -Tree 索引和 Hash 索引

B-Tree

B-Tree 是一种非常适合用于磁盘操作的数据结构。它是一棵多路平衡查找树。其高度一般在 2 -4，其非叶子节点，叶子节点，都会存储数据。其所有的叶子节点，都在同一层。下图是一颗 B -Tree

B+ Tree：B+ 树是在 B -Tree 基础上的一种优化。它和 B 树的主要区别在于：B+ 树的数据全部存储在叶子节点中，且叶子节点被一个链表串了起来。下图是一颗 B + 树

InnoDB 中一个页的大小为 16KB（一个页即 B + 树上的一个节点），若表的主键为 INT，大小为 4 字节，那一个节点也能够存储 4K 个键值，假设指针和键值都占相同大小，那么高度为 3 的 B + 树，第二层有 2048 个节点，第三层的叶子节点数为 2048*2048 = 4194304，一个节点为 16KB，则一共可容纳 67108864KB，即 65536MB，即 64G 的数据。

由于叶子节点是被一个链表串起来的，所以若 order by 索引列，则默认已经是排好序的，所以效率会很高。

MyISAM 索引
MyISAM 的索引和数据是分开存放的。在 MyISAM 的主键索引中，B+ 树叶子节点里，存的是记录的地址，故 MyISAM 通过索引查询，需要经过 2 次 IO

MyISAM 的辅助索引和主键索引一样，唯一的区别是，辅助索引中的 key 可以重复，而主键索引的 key 不能重复

InnoDB 索引
InnoDB 的数据和索引是存放在一起的，又称聚集索引。数据通过主键索引，存放在主键索引 B + 树的叶子节点上。
InnoDB 主键索引，数据已经包含在了叶子节点中，即索引和数据存放在一起，是为聚集索引。

InnoDB 的辅助索引，叶子节点中存的是主键值，而不是地址。走辅助索引，需要检索 2 次。

InnoDB 和 MyISAM 索引的区别：

InnoDB 使用聚集索引，其主键索引叶子节点中直接存储了数据，而其辅助索引中叶子节点存的是主键的值

MyISAM 使用非聚集索引，数据和索引不在同一个文件中，其主键索引中叶子节点上存的是该行记录所在的地址，其辅助索引中叶子节点上存的也是记录所在的地址，只是辅助索引的 key 可以重复，而主键索引的 key 不能重复

问题：

InnoDB 为什么不要使用过长的字段做主键？
过长的主键，会使得辅助索引所占空间变得很大

为什么推荐 InnoDB 使用自增主键？
若使用自增主键，则每次插入新的记录，就会顺序的将新记录添加到当前索引节点的后续位置，一页写满了，才会进行开辟新的一页，这样使得索引结构很紧凑，且每次插入时不需要移动已有数据，非常高效。而如果不使用自增主键，则每次插入新记录时，都要选择一个插入位置，并且可能需要移动数据，使得效率不高，且索引结构不紧凑

为什么要用 B + 树，不用 B 树

索引存在哪儿？

索引本身也比较大，一般会存储在磁盘中，索引和数据可能是分开存放的（MyISAM 的非聚集索引），也可能是一起存放的（InnoDB 的聚集索引）

索引的优缺点?

优点

降低 IO 成本，提高数据查询效率

降低排序成本（被索引的列会自动排序，使用 order by 效率会提高很多）

缺点

索引会额外占据存储空间

索引会降低更新表数据的效率。进行增删改操作时，不仅要保存数据，还要更新对应的索引

索引的分类

单列索引

主键索引

唯一索引

普通索引

组合索引

索引使用

建立索引

 CREATE INDEX index_name ON table_name(col_name);
--  或者
ALTER TABLE table_name ADD INDEX index_name(col_name)

删除索引

DROP INDEX index_name ON table_name;

需要建立索引的场景

频繁作为查询条件的列，需建索引

多表关联中，关联字段需建索引

查询中排序的字段，需建索引

不适用索引的场景

写多读少的表，不适合建索引

频繁更新的字段，不适合建索引

explain 执行计划

现有一张 user 表，其索引如下所示

其中 name,age,address 三个字段作为一个组合索引

可以使用 explain 对某个 SQL 语句进行性能分析

explain select * from user where name =  am

possible_keys
可能用到的索引
key
实际用到的索引
key_len
用于查询的索引的长度
ref
如果是等值查询，这里会会是 const
rows
预计需要扫描的行数（不是精确值）
extra

额外信息，如

using where
表示存储引擎返回的结果，还需要在 SQL Layer 层过滤

using index
表示不需要回表查询，一般在使用了覆盖索引时会是这个值。覆盖索引指的是，select 中的列，全是索引列。不需要回表查询指的是，直接走辅助索引，就能拿到索引列的值，不需要再去主键索引上取记录了

using index condition
MySQL 5.6.x 之后支持 ICP 特性（Index Condition Pushdown），可以把检查条件下推到存储引擎层，不符合条件的记录，直接不读取，而不是像原来一样，先读取出来，再在 SQL Layer 层过滤，这样减少了存储引擎层扫描的行数

using filesort
排序时无法用到索引

type

system : 表中只有 1 行数据，或空表

const : 使用唯一索引或主键索引，且用 where 等值查询，返回记录是 1 行，又叫唯一索引扫描

ref : 针对非唯一索引，使用等值 where 条件，或者最左前缀规则的查询。

下面是满足了最左前缀规则，即对 idx_name_age_add 来说，满足了最左前缀，第一个索引为 name

range：索引范围扫描，常见于，，between，in，like 等查询

注意 like 时，通配符 % 不能放在开头，否则会导致全表扫描

index：没有完全匹配上索引，但不用回表查询的

all: 全表扫描，然后再在 SQL Layer 层过滤符合要求的记录

索引使用规范（索引失效分析）

全值匹配
在索引列上使用等值查询

explain select * from user where name =  y  and age = 15;

2. 最左前缀

组合索引中，查询条件要从组合索引的最左列开始，如上述 example 中组合索引 idx_name_age_add，是建立在三个列 name，age，address 的，若跳过 name，直接用 age 查询，则会变为全表扫描

explain select * from user where age = 15;

3. 不要在索引列上做计算

4. 范围条件右侧的索引列会失效

看到第一个 SQL 语句，没有用上 addresss 索引

5. 尽量使用覆盖索引

explain select name,age from user where name =  y  and age = 1;

可以避免回表查询

6. 索引字段不要使用不等（!= 或）, 不要判断 null（is null/ is not null）
会导致索引失效，转为全表扫描

7. 索引字段上使用 like 时，不要以 % 开头

8. 索引字段如果是字符串，记得加单引号

9. 索引字段不要用 or

例子总结：

关于“MySQL 索引及优化的知识点有哪些”的内容就介绍到这里了，感谢大家的阅读。如果想了解更多行业相关的知识，可以关注丸趣 TV 行业资讯频道，丸趣 TV 小编每天都会为大家更新不同的知识点。

正文完

innodb tree 主键索引节点

发表至：数据库

2023-07-13

转载说明：除特殊说明外本站除技术相关以外文章皆由网络搜集发布，转载请注明出处。

Couchbase如何处理数据的一致性和可靠性

linux下多个mysql5.7.19安装的方法

Ubuntu Linux下MySQL的安装指南

navicat如何看表信息

MySQL中的随机抽取如何实现