MySQL中Join的执行过程有哪些

211次阅读

共计 1926 个字符，预计需要花费 5 分钟才能阅读完成。

自动写代码机器人，免费开通

今天就跟大家聊聊有关 MySQL 中 Join 的执行过程有哪些，可能很多人都不太了解，为了让大家更加了解，丸趣 TV 小编给大家总结了以下内容，希望大家根据这篇文章可以有所收获。

MySQL 的 Join 是如何执行的

join 可以说一种集合的运算，比如 left join,right join,inner join,full join,outer join，cross join 等，这些集合间的计算关系对应在高中数学集合里面的交集，并集，补集，全集等。但在实际的代码中，join 运算基本上是通过多层循环来实现的。

举一个例子，假设有 t1,t2 两张表，表结构分别如下：

createtablet1(

idintnotnullAUTO_INCREMENT,

usernamevarchar(20)notnulldefault ,

ageintnotnulldefault0,

PRIMARYkey(`id`)

)ENGINE=INNODBDEFAULTCHARSET=UTF8MB4;

createtablet2(

idintnotnullauto_increment,

usernamevarchar(20)notnulldefault ,

scoreintnotnulldefalut0,

primarykey(`id`)

))ENGINE=INNODBDEFAULTCHARSET=UTF8MB4;

假设 t1 有 100 条数据，t2 表有 200 条数

查询 sql 为：

selectt1.*,t2.*fromt1leftjoint2on(t1.username=t2.username)

那么这条 SQL 的执行步骤如下：

从表 t1 中取一行数据 r1

从 r1 中，取出字段 username 到表 t2 中查询

取出表 t2 中满足条件的行，跟 r1 组成一行，作为结果集的一部份

重复执行步骤 1,2,3, 直到表 t1 的所以数据循环完毕

基本上先遍历 t，1, 然后根据 t1 中的每行数据中的 username，去表 t2 中查找满足条件的记录。基本就是 2 层循环。

如何优化 join 查询

从上面可以看出，join 本质是循环，这里的开销如下：

遍历 t1 数据，读取数据为 t1 表的行数，假设行数为 n, 则复杂度也为 n

根据 t1 的匹配字段 username 去 t2 中一行一行的查询数据

这个过程，因为 MySQL 的数据存储结构为二叉树，时间复杂度为 log2(m) m 为 t2 表的总行数

那么总复杂度近似为 n+n(2log2(m))

从上面的步骤可以看出，优化方向：

降低 t1 查询时的开销，主要是磁盘 io 开销，避免全表扫描，用索引

降低 t2 查询时的开销，也用索引

将数据量多的表做被驱动表，小表作驱动表，m 取了对数，大表数据量大对复杂度的影响没有线性增长

缓存 t1 表，不用每次去磁盘 load, 比如一次缓存 100 条，那么能显著降低磁盘读数据次数，t2 每次与缓存中的 t1 数据进行比较

随机磁盘读比较耗费磁盘性能，转为顺序读，因为二叉树的存储结构，每次非主键查找，有一个回表的动作，即根据主键再次查询需要的数据

优化的基本方法：

减少循环次数，减少磁盘 IO 次数，变随机 IO 为顺序 IO

其实 MySQL 针对上面的优化方法有对应的算法：

Simple Nested Loop Join 最普通的循环，这个要避免

Block Nested Loop Join 主要是针对 t2 表上没有索引，在步骤 2 将 t2 中的每一行数据跟 join buffer 数据做对比，这样将磁盘操作转为内存操作进行比较，但是如果被驱动表的数据比较大的话，也影响性能，主要是 cache pool 被占满，导致 MySQL 性能下降

Index Nested Join 就是都通过主键进行查找关联，这种性能比较好

Batched Key Access Join 这个是 Index Nested Join 上做的优化，因为回表的存在，随机操作 io 也很耗费性能，这个算法的核心在于通过辅助索引去查找时，将得到的主键进行排序，然后按照主键递增的顺序进行查找，对磁盘的读接近顺序读，从而优化性能

到底要不用 Join

从上面的分析我们可以看到，用 Join 还是可行的，只要性能可控且在接受范围内，还是能减少代码复杂度的。需要避免的是 join 的表没有索引，不然这样的 SQL 发线上是灾难性的。

总结

Join 还是可以大胆的使用，只要把握好几个原则：

1、尽量让 join 的列是索引列，而且最好是类型相同, 尽可能是主键索引；

2、尽量将小表做驱动表 (这一点 MySQL 在 5.6 某个版本后能自动完成)；

3、养成将写好的 SQL 进行 explain 的好习惯，观察 SQL 的执行过程。

看完上述内容，你们对 MySQL 中 Join 的执行过程有哪些有进一步的了解吗？如果还想了解更多知识或者相关内容，请关注丸趣 TV 行业资讯频道，感谢大家的支持。

向 AI 问一下细节

正文完

发表至：数据库

2023-12-04

转载说明：除特殊说明外本站除技术相关以外文章皆由网络搜集发布，转载请注明出处。

怎么在oracle中查询操作子查询

MySQL删除方法delete、truncate、drop的区别是什么

redhat linux 9 + oracle 8.17 安装过程是怎样的

数据库添加语句怎么写

MySQL中怎么访问内部安全数据目录