设为首页收藏本站
网站公告 | 这是第一条公告
     

 找回密码
 立即注册
缓存时间23 现在时间23 缓存数据 荣耀也罢,屈辱也罢,都要以平和的心态去面对,少一些无奈与感慨,多一份从容和淡然。晚安!

荣耀也罢,屈辱也罢,都要以平和的心态去面对,少一些无奈与感慨,多一份从容和淡然。晚安!

查看: 952|回复: 4

MySQL中聚合函数count的使用和性能优化技巧

[复制链接]

  离线 

TA的专栏

  • 打卡等级:即来则安
  • 打卡总天数:21
  • 打卡月天数:0
  • 打卡总奖励:269
  • 最近打卡:2025-08-27 21:29:03
等级头衔

等級:晓枫资讯-上等兵

在线时间
0 小时

积分成就
威望
0
贡献
353
主题
309
精华
0
金钱
1278
积分
706
注册时间
2023-2-11
最后登录
2025-9-1

发表于 2023-6-10 13:39:05 | 显示全部楼层 |阅读模式
本文的环境是Windows 10,MySQL版本是5.7.12-log
一、 基本使用
count的基本作用是有两个:
      
  • 统计某个列的数据的数量;  
  • 统计结果集的行数;
用来获取满足条件的数据的数量。但是其中有一些与使用中印象不同的情况,比如当count作用一列、多列、以及使用*来表达整行产生的效果是不同的。
示例表如下:
  1. CREATE TABLE `NewTable` (
  2. `id` int(11) NULL DEFAULT NULL ,
  3. `name` varchar(30) NULL DEFAULT NULL ,
  4. `country` varchar(50) NULL DEFAULT NULL ,
  5. `province` varchar(30) NULL DEFAULT NULL ,
  6. `city` varchar(30) NULL DEFAULT NULL
  7. )ENGINE=InnoDB
复制代码
143944jsjfe6qvvsewxwov.png

1.1 不计算NULL的值
如果有NULL值,在返回的结果中会被过滤掉
  1. select count(country) from person;
复制代码
返回结果如下:
143944pzq0knqqvm1nqnj0.png

如果满足条件的数据项不存在,则结构返回0,经常通过这种方式判断是否有满足条件的数据存在;返回的数据类型是bigint。
1.2 对count(*)的处理
count(*)的处理是有点不同的,它会返回所有数据的数量,但是不会过滤其中的NULL值,它也并不是相当于展开成所有的列,而是直接会忽略所有的列而直接统计所有的行数。语句如下:
  1. select count(*) from person;
复制代码
返回结果如下:
143944cd3oddzvdwlrypqw.png

当想要返回所有的数据的数量的时候,但是又不想包括全部是NULL的列,使用count(*)是不可能做到的,但是在1.1中说到count作用于列的时候会过滤NULL,那么直接这么写是不是对?
  1. select count(id, `name`, country, province, city) from person;
复制代码
那就错了,count只能作用于单列,不能作用于多列 ,所以上面的写法是错误的。
另外针对count(*)语句,在MyISAM存储引擎中做了优化,每个表的数据行数都会存储在存储引擎中,可以很快拿到;但是在事务性的存储引擎中,比如InnoDB中,因为会涉及到多个事务;
1.3 对count(distinct …)的处理
count(distinct …)会返回彼此不同但是非NULL的数据的行数。这一点和只使用distinct是有区别的,因为distinct是不过滤NULL值的,详见MySQL中distinct的使用方法 。
- 如果没有符合条件的数据则返回0;
- 该语句可以作用于多列,是当各个列之间有一个不同,就认为整行数据不同,与distinct作用于多列时效果相同;
  1. select count(DISTINCT country) from person;
复制代码
返回结果如下:
143944cp1ae5bobxkaeukq.png

但是对于count(*)和count(distinct )两者的结合,如下:
  1. select count(DISTINCT *) from person;
复制代码
该语句是错误的,无法执行,因此与select count(DISTINCT *) from person 还是有区别的。
二、 性能优化
通常情况下,count(*)操作需要大量扫描数据表中的行,如果避免扫描大量的数据就成为优化该语句的关键所在。针对这个问题可以从如下两个角度考虑。
2.1 在数据库的层次上优化
2.1.1 针对count(*)
在MySQL内部已经针对count(*)进行了优化,使用explain查询如下:
  1. EXPLAIN select count(*) from person;
复制代码
143944vbu9kw19n6q6q5u7.png

从中可以看出该查询没有使用全表扫描也没有使用索引,甚至不需要查询数据表,在上面的示例数据库中得知,该库的存储引擎是InnoDB ,而且其中既没有主键也没有索引。
2.2 针对单个列进行count
查询如下:
  1. EXPLAIN select count(country) from person where id > 2;
复制代码
143944g37usmtxtkbhbbhd.png

发现在没有主键和索引的情况下,对全表进行了扫描。在数据中避免大量扫描数据行,一个最直接的方法使用索引:
当对id设置为一般索引 :INDEX abc (id) USING BTREE 。
执行查询如下:
  1. EXPLAIN select count(country) from person where id > 2;
复制代码
结果如下:
143944c7dydsbxkts9o4ms.png

此时发现并没有使用索引,仍然进行的是全表扫描,当执行如下时:
  1. EXPLAIN select count(country) from person where id > 4;
复制代码
结果如下:
143944so3kxw96b2ktb2kt.png

这是使用了索引进行了范围查询,显然比上面的要好。
但是问题来了,为什么有时候使用索引,有时候不用索引?在上面的第一次查询中已经能够检测出可能的key但是并没有使用?如果有知道的大神给解读一下!
对id设置为主键,执行查询如下:
  1. EXPLAIN select count(country) from person where id > 2;
复制代码
结果如下:
143944o53vv2tokcv37b3i.png

2.2 在应用的层次上优化
在应用的层次上优化,可以考虑在系统架构中引入缓存子系统,比如在过去中常用的Memcached,或者现在非常流行的Redis, 但是这样会增加系统的复杂性。
mysql group by与聚合函数(sum,count等)实例
首先我们先来了解一下mysql聚合函数
mysql中一种特殊的函数:聚合函数,SUM, COUNT, MAX, MIN, AVG等。这些函数和其它函数的根本区别就是它们一般作用在多条记录上。例如:
  1. SELECT SUM(score) FROM table
复制代码
这个sql的意思是查询表table里面所有score列的总和。
接着我们通过一个实例来讲解group by语句中如何使用聚合函数。
book表如下:
idfirst_namelast_namecity
1JasonMartinToronto
2AlisonMathewsVancouver
3JamesMathewsVancouver
4CeliaRiceVancouver
5DavidLarryNew York

现在我们要对city进行分组查询,并获取每个分组有多少条数据,我们需要count聚合函数。
  1. SELECT *,count(*) FROM book GROUP BY city
复制代码
结果为:
idfirst_namelast_namecitycount(*)
1JasonMartinToronto1
2AlisonMathewsVancouver3
5DavidLarryNew York1

先以city把返回记录分成多个组,这就是GROUP BY的字面含义。分完组后,然后用聚合函数对每组中的不同字段(一或多条记录)作运算。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!
晓枫资讯-科技资讯社区-免责声明
免责声明:以上内容为本网站转自其它媒体,相关信息仅为传递更多信息之目的,不代表本网观点,亦不代表本网站赞同其观点或证实其内容的真实性。
      1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
      2、管理员及版主有权在不事先通知或不经作者准许的情况下删除其在本社区所发表的文章。
      3、本社区的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,举报反馈:点击这里给我发消息进行删除处理。
      4、本社区一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
      5、以上声明内容的最终解释权归《晓枫资讯-科技资讯社区》所有。
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
14
积分
8
注册时间
2022-12-28
最后登录
2022-12-28

发表于 2024-3-4 12:00:59 | 显示全部楼层
顶顶更健康!!!
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
21
积分
22
注册时间
2022-12-28
最后登录
2022-12-28

发表于 2024-5-25 02:51:25 | 显示全部楼层
感谢楼主,顶。
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

  • 打卡等级:无名新人
  • 打卡总天数:1
  • 打卡月天数:0
  • 打卡总奖励:16
  • 最近打卡:2023-12-17 09:22:49
等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
29
积分
6
注册时间
2023-9-25
最后登录
2023-12-17

发表于 2025-1-16 17:43:03 | 显示全部楼层
路过,支持一下
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~

  离线 

TA的专栏

等级头衔

等級:晓枫资讯-列兵

在线时间
0 小时

积分成就
威望
0
贡献
0
主题
0
精华
0
金钱
11
积分
2
注册时间
2024-1-14
最后登录
2024-1-14

发表于 3 天前 | 显示全部楼层
感谢楼主分享。
http://bbs.yzwlo.com 晓枫资讯--游戏IT新闻资讯~~~
严禁发布广告,淫秽、色情、赌博、暴力、凶杀、恐怖、间谍及其他违反国家法律法规的内容。!晓枫资讯-社区
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

1楼
2楼
3楼
4楼
5楼

手机版|晓枫资讯--科技资讯社区 本站已运行

CopyRight © 2022-2025 晓枫资讯--科技资讯社区 ( BBS.yzwlo.com ) . All Rights Reserved .

晓枫资讯--科技资讯社区

本站内容由用户自主分享和转载自互联网,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

如有侵权、违反国家法律政策行为,请联系我们,我们会第一时间及时清除和处理! 举报反馈邮箱:点击这里给我发消息

Powered by Discuz! X3.5

快速回复 返回顶部 返回列表