目录
问题分析
解决办法
知识点
首页 数据库 mysql教程 mysql踩坑之count distinct多列问题怎么解决

mysql踩坑之count distinct多列问题怎么解决

Jun 03, 2023 am 10:49 AM
mysql count distinct

复现的测试数据库如下所示:

CREATE TABLE `test_distinct` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `a` varchar(50) CHARACTER SET utf8 DEFAULT NULL,
  `b` varchar(50) CHARACTER SET utf8 DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=latin1;
登录后复制

表内测试数据如下,现在我们需要统计这三列去重后的列的数量。

mysql踩坑之count distinct多列问题怎么解决

问题分析

小伙伴给了我四条用来定位问题的查询语句

SELECT COUNT(*) AS cnt FROM test_distinct;
SELECT COUNT(DISTINCT id, a, b) as cnt FROM test_distinct;
SELECT id, a, b, COUNT(*) AS cnt FROM test_distinct GROUP BY id, a, b HAVING cnt > 1;
SELECT 
	l.id AS l_id,
	l.a AS l_a,
	l.b AS l_b,
	r.id AS r_id,
	r.a AS r_a,
	r.b AS r_b
FROM test_distinct l LEFT JOIN test_distinct r
ON l.id = r.id AND l.a = r.a AND l.b = r.b
WHERE r.id is NULL or r.id = 'null';
登录后复制

查询结果,如下所示:

mysql踩坑之count distinct多列问题怎么解决

mysql踩坑之count distinct多列问题怎么解决

mysql踩坑之count distinct多列问题怎么解决

mysql踩坑之count distinct多列问题怎么解决

注意!!!从测试数据很快就能大概猜出问题在哪,但是原来表中数据是有3万多条,无法用肉眼查看数据。

上面查询结果违反直觉的点有两个:

  • 第二条去重统计后数据少了一条,但是,第三条数据的结果显示并没有相同的数据。

  • 用同一张表做左外连接出现了驱动表有数据,而被驱动表为空的情况。

先看第二个问题,官方文档上有如下解释:

  • 在使用ON子句时,其所包含的条件表达式与WHERE子句中使用的相同。常见的情况是使用ON子句来指定表的连接条件,而使用WHERE子句对结果集中包含的行进行限制。

  • 如果对于LEFT JOIN中ON或USING部分中的条件,右表没有匹配的行,则右表使用所有列设置为NULL。

  • 不能使用算术比较运算符(如=,<或<>)来比较NULL。

SELECT NULL = NULL;
SELECT NULL IS NULL;
登录后复制

mysql踩坑之count distinct多列问题怎么解决

mysql踩坑之count distinct多列问题怎么解决

所以问题二在于NULL=NULL的结果永远为False,也就导致两行原本相等的数据结果却不相等。

可是这并没有解决第一个问题:为什么去重后有一条数据消失了。但是,我们可以猜测消失的数据很有可能和NULL值有关系。

我们将count和distinct两个操作分开:

SELECT COUNT(*) as cnt FROM (SELECT  DISTINCT id, a, b FROM test_distinct) as tmp;
登录后复制

mysql踩坑之count distinct多列问题怎么解决

嗯?结果是正确的,那就说明count(distinct expr)生成的查询计划可能和我们想象的不一样,并不是先去重再统计,使用explain分析一下两条语句的查询计划,如下所示:

mysql踩坑之count distinct多列问题怎么解决

mysql踩坑之count distinct多列问题怎么解决

从表中可以看到,mysql执行引擎直接将count(distinct expr)作为一个查询,查看官方文档:

mysql踩坑之count distinct多列问题怎么解决

解决办法

至此问题才终于弄清楚了。解决这个问题的办法有两种,第一种就是上述的先去重后统计,第二种可以利用IFNULL()函数:

SELECT COUNT(DISTINCT id, a, IFNULL(b, &#39;0&#39;)) as cnt FROM test_distinct;
登录后复制

另外补充一点,count()嘚瑟使用:

SELECT id, a, b, COUNT(*) FROM test_distinct GROUP BY id, a, b;
SELECT id, a, b, COUNT(b) FROM test_distinct GROUP BY id, a, b;
登录后复制

mysql踩坑之count distinct多列问题怎么解决

mysql踩坑之count distinct多列问题怎么解决

知识点

  • 不能使用算术比较运算符(如=,<或<>)来比较空值;

  • count(distinct expr)返回expr列中不同的且非空的行数;

  • COUNT()具有两种截然不同的用途:它既可用于计算某个列值的数量,也可用于计算行数。在统计列值时要求列值是非空的(不统计NULL)。当在COUNT()函数的括号中指定了列或者表达式时,函数会统计这个表达式中有值的结果数。COUNT()的另一个作用是统计结果集的行数。当MySQL确认括号内的表达式值不可能为空时,实际上就是在统计行数。最简单的就是当我们使用COUNT()的时候,这种情况下通配符并不像我们猜想的那样扩展成所有的列,实际上,他会忽略所有列而直接统计所有的行数——《高性能MySQL》;

  • 在InnoDB中,SELECT COUNT(*)和SELECT COUNT(1)处理方式一样, 没有性能差异。

以上是mysql踩坑之count distinct多列问题怎么解决的详细内容。更多信息请关注PHP中文网其他相关文章!

本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn

热AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover

AI Clothes Remover

用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool

Undress AI Tool

免费脱衣服图片

Clothoff.io

Clothoff.io

AI脱衣机

AI Hentai Generator

AI Hentai Generator

免费生成ai无尽的。

热门文章

R.E.P.O.能量晶体解释及其做什么(黄色晶体)
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳图形设置
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您听不到任何人,如何修复音频
3 周前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解锁Myrise中的所有内容
4 周前 By 尊渡假赌尊渡假赌尊渡假赌

热工具

记事本++7.3.1

记事本++7.3.1

好用且免费的代码编辑器

SublimeText3汉化版

SublimeText3汉化版

中文版,非常好用

禅工作室 13.0.1

禅工作室 13.0.1

功能强大的PHP集成开发环境

Dreamweaver CS6

Dreamweaver CS6

视觉化网页开发工具

SublimeText3 Mac版

SublimeText3 Mac版

神级代码编辑软件(SublimeText3)

MySQL:初学者的数据管理易用性 MySQL:初学者的数据管理易用性 Apr 09, 2025 am 12:07 AM

MySQL适合初学者使用,因为它安装简单、功能强大且易于管理数据。1.安装和配置简单,适用于多种操作系统。2.支持基本操作如创建数据库和表、插入、查询、更新和删除数据。3.提供高级功能如JOIN操作和子查询。4.可以通过索引、查询优化和分表分区来提升性能。5.支持备份、恢复和安全措施,确保数据的安全和一致性。

忘记数据库密码,能在Navicat中找回吗? 忘记数据库密码,能在Navicat中找回吗? Apr 08, 2025 pm 09:51 PM

Navicat本身不存储数据库密码,只能找回加密后的密码。解决办法:1. 检查密码管理器;2. 检查Navicat的“记住密码”功能;3. 重置数据库密码;4. 联系数据库管理员。

navicat premium怎么创建 navicat premium怎么创建 Apr 09, 2025 am 07:09 AM

使用 Navicat Premium 创建数据库:连接到数据库服务器并输入连接参数。右键单击服务器并选择“创建数据库”。输入新数据库的名称和指定字符集和排序规则。连接到新数据库并在“对象浏览器”中创建表。右键单击表并选择“插入数据”来插入数据。

mysql怎么复制表 mysql怎么复制表 Apr 08, 2025 pm 07:24 PM

在 MySQL 中复制表需要创建新表、插入数据、设置外键、复制索引、触发器、存储过程和函数。具体步骤包括:创建具有相同结构的新表。将数据从原始表插入新表。设置相同的外键约束(如果原始表有)。创建相同索引。创建相同触发器(如果原始表有)。创建相同存储过程或函数(如果原始表使用了)。

Navicat for MariaDB如何查看数据库密码? Navicat for MariaDB如何查看数据库密码? Apr 08, 2025 pm 09:18 PM

Navicat for MariaDB 无法直接查看数据库密码,因为密码以加密形式存储。为确保数据库安全,有三个方法可重置密码:通过 Navicat 重置密码,设置复杂密码。查看配置文件(不推荐,风险高)。使用系统命令行工具(不推荐,需要对命令行工具精通)。

mysql怎么查看 mysql怎么查看 Apr 08, 2025 pm 07:21 PM

通过以下命令查看 MySQL 数据库:连接到服务器:mysql -u 用户名 -p 密码运行 SHOW DATABASES; 命令获取所有现有数据库选择数据库:USE 数据库名;查看表:SHOW TABLES;查看表结构:DESCRIBE 表名;查看数据:SELECT * FROM 表名;

mysql怎么复制粘贴 mysql怎么复制粘贴 Apr 08, 2025 pm 07:18 PM

MySQL 中的复制粘贴包含以下步骤:选择数据,使用 Ctrl C(Windows)或 Cmd C(Mac)复制;在目标位置右键单击,选择“粘贴”或使用 Ctrl V(Windows)或 Cmd V(Mac);复制的数据将插入到目标位置,或替换现有数据(取决于目标位置是否已存在数据)。

navicat如何执行sql navicat如何执行sql Apr 08, 2025 pm 11:42 PM

在 Navicat 中执行 SQL 的步骤:连接到数据库。创建 SQL 编辑器窗口。编写 SQL 查询或脚本。单击“运行”按钮执行查询或脚本。查看结果(如果执行查询的话)。

See all articles