目录
一、MySQL中count()的不同用法
二、union执行流程
三、group by语句详解
1、group by执行流程
2、group by优化方法——索引
3、group by优化方法——直接排序
首页 数据库 mysql教程 详解MySQL中的count()、union()和group by语句

详解MySQL中的count()、union()和group by语句

Sep 03, 2021 pm 06:49 PM
count() group by mysql union

本篇文章带大家了解一下count()、union()和group by语句,补充一下MySQL知识点(不同count()的用法、union执行流程、group by语句)。

详解MySQL中的count()、union()和group by语句

一、MySQL中count()的不同用法

count()是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是NULL,累计值就加1,否则不加。最后返回累计值。【相关推荐:mysql视频教程

1.对于count(主键id)来说,InnoDB引擎会遍历整张表,把每一行的id值都取出来,返回给server层。server层拿到id后,判断是不可能为空的,就按行累加

2.对于count(1)来说,InnoDB引擎遍历整张表,但不取值。server层对于返回的每一行,放一个数字1进入,判断是不可能为空的,按行累加

3.对于count(字段)来说,如果这个字段是定义为not null的话,一行行地从记录里面读出这个字段,判断不能为null,按行累加;如果这个字段定义允许为null的话,那么执行的时候,判断到有可能是null,还要把值取出来在判断一下,不是null才累加

4.对于count(*)来说,并不会把全部字段取出来,而是专门做了优化。不取值,count(*)肯定不是null,按行累加

详解MySQL中的count()、union()和group by语句

二、union执行流程

为了便于量化分析,以下面表t1来举例

create table t1(id int primary key, a int, b int, index(a));

CREATE DEFINER=`root`@`%` PROCEDURE `idata`()
BEGIN
	declare i int;
  set i=1;
  while(i<=1000)do
    insert into t1 values(i, i, i);
    set i=i+1;
  end while;

END
登录后复制

分析下面这条SQL语句:

(select 1000 as f) union (select id from t1 order by id desc limit 2);
登录后复制

union的语义是取这两个子查询结果的并集。并集的意思是这两个集合加起来,重复的行只保留一行

详解MySQL中的count()、union()和group by语句

  • 第二行的key=PRIMARY,说明第二个子句用到了索引id
  • 第三行的Extra字段,表示在对子查询的结果集做union的时候,使用了临时表

这个语句的执行流程如下:

1.创建一个内存临时表,这个临时表只有一个整型字段f,并且f是主键字段

2.执行第一个子查询,得到1000这个值

3.执行第二个子查询:

  • 拿到第一行id=1000,试图插入临时表中。但由于1000这个值已经存在于临时表了,违反了唯一性约束,所以插入失败,然后继续执行
  • 取到第二行id=999,插入临时表成功

4.从临时表中按行取出数据,返回结果,并删除临时表,结果中包含两行数据分别是1000和999

详解MySQL中的count()、union()和group by语句

这里的内存临时表起到了暂存数据的作用,而且计算过程还用上了临时表主键id的唯一性约束,实现了union的语义

如果把上面的语句中union改成union all的话,就没有了去重的语义。这样执行的时候,就依次执行子查询,得到的结果直接作为结果集的一部分,发给客户端。因此也就不需要临时表了

详解MySQL中的count()、union()和group by语句

第二行Extra字段显示的是Using index,表示只使用了覆盖索引,没有用临时表

三、group by语句详解

1、group by执行流程

还是使用上面的表t1,分析下面这条SQL语句:

select id%10 as m, count(*) as c from t1 group by m;
登录后复制

这个语句的逻辑是把表t1里的数据,按照id进行分组统计,并按照m的结果排序后输出。explain结果如下:

详解MySQL中的count()、union()和group by语句
在Extra字段里面,可以看到三个信息:

  • Using index,表示这个语句使用了覆盖索引,选择了索引a,不需要回表
  • Using temporary,表示使用了临时表
  • Using filesort,表示需要排序

这个语句的执行流程如下:

1.创建内存临时表,表里有两个字段m和c,主键是m

2.扫描表t1的索引a,依次取出叶子节点上的id值,计算id的结果,记为x

  • 如果临时表中没有主键为x的行,就插入一个记录(x,1)
  • 如果表中有主键为x的行,就将x这一行的c值加1

3.遍历完成后,再根据字段m做排序,得到结果集返回给客户端

详解MySQL中的count()、union()和group by语句

内存临时表排序流程图:

详解MySQL中的count()、union()和group by语句

详解MySQL中的count()、union()和group by语句

如果并不需要对结果进行排序,在SQL语句末尾增加order by null:

select id%10 as m, count(*) as c from t1 group by m order by null;
登录后复制

详解MySQL中的count()、union()和group by语句

由于表t1中的id值是从1开始的,因此返回的结果集中第一行是id=1

这个例子里由于临时表只有10行,内存可以放得下,因此全程只使用了内存临时表。但是,内存临时表的大小是有限的,参数tmp_table_size就是控制整个内存大小的,默认是16M

set tmp_table_size=1024;
select id%100 as m, count(*) as c from t1 group by m order by null limit 10;
登录后复制

把内存临时表的大小限制为最大1024字节,并把语句改成id%100,这样返回结果里有100行数据。但是,这时的内存临时表大小不够存下这100行数据,也就是说,执行过程中会发现内存临时表大小达到了上限。那么,这时候会把内存临时表转成磁盘临时表,磁盘临时表默认使用的引擎是InnoDB

2、group by优化方法——索引

group by的语义逻辑,是统计不同的值的个数。但是,由于每一行的id%100的结果是无序的,所以就需要有一个临时表来记录并统计结果。那么,如果扫描过程中可以保证出现的数据是有序的就可以了

假设,现在有一个类似下图的这么一个数据结构

详解MySQL中的count()、union()和group by语句
如果可以确保输入的数据是有序的,那么计算group by的时候,就只需要从左到右,顺序扫描,依次累加。也就是下面这个流程:

  • 当碰到第一个1的时候,已经知道累积了X个0,结果集里的第一行就是(0,X)
  • 当碰到第一个2的时候,已经知道累积了Y个1,结果集里的第一行就是(1,Y)

按照这个逻辑执行的话,扫描到整个输入的数据结束,就可以拿到group by的结果,不需要临时表,也需要再额外排序

在MySQL5.7版本支持了generated column机制,用来实现列数据的关联更新。创建一个列z,在z列上创建一个索引

alter table t1 add column z int generated always as(id % 100), add index(z);
登录后复制

这样,索引z上的数据就是有序的了。group by语句就可以改成:

select z, count(*) as c from t1 group by z;
登录后复制

详解MySQL中的count()、union()和group by语句
从这个Extra字段可以看到,这个语句的执行不再需要临时表,也不需要排序了

3、group by优化方法——直接排序

在group by语句中加入SQL_BIG_RESULT这个提示,就可以告诉优化器:这个语句涉及的数据量很大,直接用磁盘临时表。因为磁盘临时表是B+树存储,存储效率不如数组来得高。所以MySQL优化器直接用数组来存

select SQL_BIG_RESULT id%100 as m, count(*) as c from t1 group by m;
登录后复制

1.初始化sort_buffer,确定放入一个整型字段,记为m

2.扫描表t1的索引a,依次取出里面的id值,将id%100的值存入sort_buffer中

3.扫描完成后,对sort_buffer的字段m做排序(如果sort_buffer内存不够用,就会利用磁盘临时文件辅助排序)

4.排序完成后,就得到了一个有序数组

根据有序数组,得到数组里面的不同值,以及每个值的出现次数

详解MySQL中的count()、union()和group by语句详解MySQL中的count()、union()和group by语句
这个语句的执行没有再使用临时表,而是直接用了排序算法

更多编程相关知识,请访问:编程入门!!

以上是详解MySQL中的count()、union()和group by语句的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
2 周前 By 尊渡假赌尊渡假赌尊渡假赌
仓库:如何复兴队友
4 周前 By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island冒险:如何获得巨型种子
4 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

PHP 的大数据结构处理技巧 PHP 的大数据结构处理技巧 May 08, 2024 am 10:24 AM

大数据结构处理技巧:分块:分解数据集并分块处理,减少内存消耗。生成器:逐个产生数据项,无需加载整个数据集,适用于无限数据集。流:逐行读取文件或查询结果,适用于大文件或远程数据。外部存储:对于超大数据集,将数据存储在数据库或NoSQL中。

如何优化 PHP 中的 MySQL 查询性能? 如何优化 PHP 中的 MySQL 查询性能? Jun 03, 2024 pm 08:11 PM

可以通过以下方式优化MySQL查询性能:建立索引,将查找时间从线性复杂度降至对数复杂度。使用PreparedStatements,防止SQL注入并提高查询性能。限制查询结果,减少服务器处理的数据量。优化连接查询,包括使用适当的连接类型、创建索引和考虑使用子查询。分析查询,识别瓶颈;使用缓存,减少数据库负载;优化PHP代码,尽量减少开销。

如何在 PHP 中使用 MySQL 备份和还原? 如何在 PHP 中使用 MySQL 备份和还原? Jun 03, 2024 pm 12:19 PM

在PHP中备份和还原MySQL数据库可通过以下步骤实现:备份数据库:使用mysqldump命令转储数据库为SQL文件。还原数据库:使用mysql命令从SQL文件还原数据库。

如何使用 PHP 插入数据到 MySQL 表中? 如何使用 PHP 插入数据到 MySQL 表中? Jun 02, 2024 pm 02:26 PM

如何将数据插入MySQL表中?连接到数据库:使用mysqli建立与数据库的连接。准备SQL查询:编写一个INSERT语句以指定要插入的列和值。执行查询:使用query()方法执行插入查询,如果成功,将输出一条确认消息。

如何修复 MySQL 8.4 上的 mysql_native_password 未加载错误 如何修复 MySQL 8.4 上的 mysql_native_password 未加载错误 Dec 09, 2024 am 11:42 AM

MySQL 8.4(截至 2024 年的最新 LTS 版本)中引入的主要变化之一是默认情况下不再启用“MySQL 本机密码”插件。此外,MySQL 9.0完全删除了这个插件。 此更改会影响 PHP 和其他应用程序

如何在 PHP 中使用 MySQL 存储过程? 如何在 PHP 中使用 MySQL 存储过程? Jun 02, 2024 pm 02:13 PM

要在PHP中使用MySQL存储过程:使用PDO或MySQLi扩展连接到MySQL数据库。准备调用存储过程的语句。执行存储过程。处理结果集(如果存储过程返回结果)。关闭数据库连接。

如何使用 PHP 创建 MySQL 表? 如何使用 PHP 创建 MySQL 表? Jun 04, 2024 pm 01:57 PM

使用PHP创建MySQL表需要以下步骤:连接到数据库。创建数据库(如果不存在)。选择数据库。创建表。执行查询。关闭连接。

oracle数据库和mysql的区别 oracle数据库和mysql的区别 May 10, 2024 am 01:54 AM

Oracle数据库和MySQL都是基于关系模型的数据库,但Oracle在兼容性、可扩展性、数据类型和安全性方面更胜一筹;而MySQL则侧重速度和灵活性,更适合小到中等规模的数据集。①Oracle提供广泛的数据类型,②提供高级安全功能,③适合企业级应用程序;①MySQL支持NoSQL数据类型,②安全性措施较少,③适合小型到中等规模应用程序。

See all articles