MySql Group by函数怎么正确使用

103次阅读
没有评论

共计 2188 个字符,预计需要花费 6 分钟才能阅读完成。

这篇文章主要介绍了 MySql Group by 函数怎么正确使用的相关知识,内容详细易懂,操作简单快捷,具有一定借鉴价值,相信大家阅读完这篇 MySql Group by 函数怎么正确使用文章都会有所收获,下面我们一起来看看吧。

MySql Group by 函数的正确打开方式

在使用分组函数时, 进行结果集筛选, 遇到的一些问题以及解决办法

1. 应用场景

有两张表

文章表 (一对多留言表) t_posts:      
oid, posts_name    
留言表(多对一文章表) t_comment:    
oid, posts_id, msg_content, create_time

2. 需求分析

查询每个文章的最新回复内容

3.SQL 编写

select 
 tp.oid,
 tp.posts_name,
 tc.msg_content,
 tc.create_time
from t_posts tp 
left join t_comment tc on tp.oid = tc.posts_id
group by tp.oid having create_time = max(create_time)

假设现在有两个文章 A, B (回复的记录在数据库的顺序与下述一致)

A 有一个回复记录时间为: 2019-09-10  
A 有一个回复记录时间为: 2019-09-11  
B 有一个回复记录时间为: 2019-09-01  
B 有一个回复记录时间为: 2019-09-09

运行上面的 sql, 会发现结果集丢失大量记录, 并且结果是错误的, 经过查询资料得知

mysql 的 having 是在 group by 之后再执行, 也就是说, 先分组, 在过滤, 但是因为存在两条以上的留言记录,
所以分组之后的结果集只会取每条留言的第一条作为分组之后的记录信息, 这时如果使用 having create_time = max(create_time)
那么, max(create_time) 为当前分组的最大时间

为: 2019-09-10 和 2019-09-09

所以上述 sql 会丢失结果集

4. 改造 SQL

因为知道分组之后合并的重复结果集为 rownum 最小的那条, 那么可不可以改造 sql 如下??

select 
 tp.oid,
 tp.posts_name,
 tc.msg_content,
 tc.create_time
from t_posts tp 
left join t_comment tc on tp.oid = tc.posts_id
group by tp.oid having create_time = max(create_time)
--  下面的是新增的 sql
order by tc.create_time desc

运行之后发现依旧不好使, 证明 order by 在 group by having 之后

后来想想可不可以 不用 having, 直接用 order by 来优化分组后的结果呢?

having create_time = max(create_time)

select 
 tp.oid,
 tp.posts_name,
 tc.msg_content,
 tc.create_time
from t_posts tp 
left join t_comment tc on tp.oid = tc.posts_id
group by tp.oid 
order by tc.create_time desc

结果集错误, 并不能影响分组结果, 依旧是按照 rownum 最小分组合并重复结果集, 然后在排序

5. 终极改造版本

因为 order by 只能后影响 group by, 那么是不是可以在 group by 之前先把结果集排序一下, 然后再分组呢?

select * from (
 select 
 tp.oid,
 tp.posts_name,
 tc.msg_content,
 tc.create_time
 from t_posts tp 
 left join t_comment tc on tp.oid = tc.posts_id
 order by tc.create_time desc
) t 
group by t.oid

发现还是不好使, 但是子查询确实先排序了

经查询(explain), 发现子查询的 order by 被优化没了, 解决办法:

在子查询里使用 limit 99999

在子查询里使用 where 条件, create_time = (select max(create_time) from t_comment group by oid)

select * from (
 select 
 tp.oid,
 tp.posts_name,
 tc.msg_content,
 tc.create_time
 from t_posts tp 
 left join t_comment tc on tp.oid = tc.posts_id
 order by tc.create_time desc limit 9999
) t 
group by t.oid

大功告成

附加知识点:

mysql5.5 与 mysql 5.7 版本差异: 5.7+ 版本, 如果不使用 limit, group by 会把 order by 优化掉

关于“MySql Group by 函数怎么正确使用”这篇文章的内容就介绍到这里,感谢各位的阅读!相信大家对“MySql Group by 函数怎么正确使用”知识都有一定的了解,大家如果还想学习更多知识,欢迎关注丸趣 TV 行业资讯频道。

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-07-15发表,共计2188字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)