共计 2750 个字符,预计需要花费 7 分钟才能阅读完成。
自动写代码机器人,免费开通
如何在 MySQL 中使用 count 聚合函数?相信很多没有经验的人对此束手无策,为此本文总结了问题出现的原因和解决方法,通过这篇文章希望你能解决这个问题。
一、基本使用
count 的基本作用是有两个:
统计某个列的数据的数量;
统计结果集的行数;
用来获取满足条件的数据的数量。但是其中有一些与使用中印象不同的情况,比如当 count 作用一列、多列、以及使用 * 来表达整行产生的效果是不同的。
示例表如下:
CREATE TABLE `NewTable` (`id` int(11) NULL DEFAULT NULL ,
`name` varchar(30) NULL DEFAULT NULL ,
`country` varchar(50) NULL DEFAULT NULL ,
`province` varchar(30) NULL DEFAULT NULL ,
`city` varchar(30) NULL DEFAULT NULL
)ENGINE=InnoDB
1.1 不计算 NULL 的值
如果有 NULL 值,在返回的结果中会被过滤掉
select count(country) from person;
返回结果如下:
如果满足条件的数据项不存在,则结构返回 0,经常通过这种方式判断是否有满足条件的数据存在;返回的数据类型是 bigint。
1.2 对 count(*)的处理
count(*)的处理是有点不同的,它会返回所有数据的数量,但是不会过滤其中的 NULL 值,它也并不是相当于展开成所有的列,而是直接会忽略所有的列而直接统计所有的行数。语句如下:
select count(*) from person;
返回结果如下:
当想要返回所有的数据的数量的时候,但是又不想包括全部是 NULL 的列,使用 count(*)是不可能做到的,但是在 1.1 中说到 count 作用于列的时候会过滤 NULL,那么直接这么写是不是对?
select count(id, `name`, country, province, city) from person;
那就错了,count 只能作用于单列,不能作用于多列,所以上面的写法是错误的。
另外针对 count(*)语句,在 MyISAM 存储引擎中做了优化,每个表的数据行数都会存储在存储引擎中,可以很快拿到;但是在事务性的存储引擎中,比如 InnoDB 中,因为会涉及到多个事务;
1.3 对 count(distinct …)的处理
count(distinct …)会返回彼此不同但是非 NULL 的数据的行数。这一点和只使用 distinct 是有区别的,因为 distinct 是不过滤 NULL 值的,详见 MySQL 中 distinct 的使用方法。
– 如果没有符合条件的数据则返回 0;
– 该语句可以作用于多列,是当各个列之间有一个不同,就认为整行数据不同,与 distinct 作用于多列时效果相同;
select count(DISTINCT country) from person;
返回结果如下:
但是对于 count(*)和 count(distinct)两者的结合,如下:
select count(DISTINCT *) from person;
该语句是错误的,无法执行,因此与 select count(DISTINCT *) from person 还是有区别的。
二、性能优化
通常情况下,count(*)操作需要大量扫描数据表中的行,如果避免扫描大量的数据就成为优化该语句的关键所在。针对这个问题可以从如下两个角度考虑。
2.1 在数据库的层次上优化
2.1.1 针对 count(*)
在 MySQL 内部已经针对 count(*)进行了优化,使用 explain 查询如下:
EXPLAIN select count(*) from person;
从中可以看出该查询没有使用全表扫描也没有使用索引,甚至不需要查询数据表,在上面的示例数据库中得知,该库的存储引擎是 InnoDB,而且其中既没有主键也没有索引。
2.2 针对单个列进行 count
查询如下:
EXPLAIN select count(country) from person where id
发现在没有主键和索引的情况下,对全表进行了扫描。在数据中避免大量扫描数据行,一个最直接的方法使用索引:
当对 id 设置为一般索引:INDEX abc (id) USING BTREE。
执行查询如下:
EXPLAIN select count(country) from person where id
结果如下:
此时发现并没有使用索引,仍然进行的是全表扫描,当执行如下时:
EXPLAIN select count(country) from person where id
结果如下:
这是使用了索引进行了范围查询,显然比上面的要好。
但是问题来了,为什么有时候使用索引,有时候不用索引?在上面的第一次查询中已经能够检测出可能的 key 但是并没有使用?如果有知道的大神给解读一下!
对 id 设置为主键,执行查询如下:
EXPLAIN select count(country) from person where id
结果如下:
2.2 在应用的层次上优化
在应用的层次上优化,可以考虑在系统架构中引入缓存子系统,比如在过去中常用的 Memcached,或者现在非常流行的 Redis,但是这样会增加系统的复杂性。
mysql group by 与聚合函数 (sum,count 等) 实例
首先我们先来了解一下 mysql 聚合函数
mysql 中一种特殊的函数: 聚合函数,SUM, COUNT, MAX, MIN, AVG 等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。例如:
SELECT SUM(score) FROM table
这个 sql 的意思是查询表 table 里面所有 score 列的总和。
接着我们通过一个实例来讲解 group by 语句中如何使用聚合函数。
book 表如下:
idfirst_namelast_namecity1JasonMartinToronto2AlisonMathewsVancouver3JamesMathewsVancouver4CeliaRiceVancouver5DavidLarryNew York
现在我们要对 city 进行分组查询,并获取每个分组有多少条数据,我们需要 count 聚合函数。
SELECT *,count(*) FROM book GROUP BY city
结果为:
idfirst_namelast_namecitycount(*)1JasonMartinToronto12AlisonMathewsVancouver35DavidLarryNew York1
看完上述内容,你们掌握如何在 MySQL 中使用 count 聚合函数的方法了吗?如果还想学到更多技能或想了解更多相关内容,欢迎关注丸趣 TV 行业资讯频道,感谢各位的阅读!
向 AI 问一下细节