84669 人学习
152542 人学习
20005 人学习
5487 人学习
7821 人学习
359900 人学习
3350 人学习
180660 人学习
48569 人学习
18603 人学习
40936 人学习
1549 人学习
1183 人学习
32909 人学习
光阴似箭催人老,日月如移越少年。
假设你的表名是user:
select * from user where name in (select name from user group by name having count(1) > 1);
select * from user group by (...) having count(*) > 1就足够了,不需要再用in。其实高效什么的你真的想太多了,这属于设计失误,花时间修复一次然后修改表结构防止此类问题再次发生才是正根。
select * from user group by (...) having count(*) > 1
另外这个表没有id,所以你也不能自动删除重复的数据,因为写不出条件,只能再用中间表去倒。
综上,别考虑效率了,手工改正就好。
SELECT * FROM user AS a WHERE EXISTS ( SELECT 1 FROM user AS b WHERE a.name = b.name GROUP BY name HAVING COUNT(1) > 1 )
由于涉及到全表GROUP BY,所以性能比较低。如果可以修改表结构的话,建议增加一个字段表示该用户名称是否重名,该字段在写入数据的时候就可以判断维护了。
GROUP BY
数据库的世界没有魔法,索引之所以能加快搜索速度就是因为它预先处理了,用延长每次插入更新数据的时间来加快搜索速度,都是有代价的。
回到这个问题,你可以在name上加索引,这样group by就能更高效一点,但是根据你的需求还是要子查询。
不过在name上加索引我觉得不是个健康的做法。如果是我,解决这个问题会做一个定时任务:扫描重名的用户,把ID记录在某个表A上。然后页面上显示时直接把表A拿出来关联用户表即可。之所以这样做还有一个原因就是这个工作并非要做到很严格,和实际有点误差是无妨的。
假设你的表名是user:
select * from user group by (...) having count(*) > 1
就足够了,不需要再用in。其实高效什么的你真的想太多了,这属于设计失误,花时间修复一次然后修改表结构防止此类问题再次发生才是正根。
另外这个表没有id,所以你也不能自动删除重复的数据,因为写不出条件,只能再用中间表去倒。
综上,别考虑效率了,手工改正就好。
由于涉及到全表
GROUP BY
,所以性能比较低。如果可以修改表结构的话,建议增加一个字段表示该用户名称是否重名,该字段在写入数据的时候就可以判断维护了。
数据库的世界没有魔法,索引之所以能加快搜索速度就是因为它预先处理了,用延长每次插入更新数据的时间来加快搜索速度,都是有代价的。
回到这个问题,你可以在name上加索引,这样group by就能更高效一点,但是根据你的需求还是要子查询。
不过在name上加索引我觉得不是个健康的做法。如果是我,解决这个问题会做一个定时任务:扫描重名的用户,把ID记录在某个表A上。然后页面上显示时直接把表A拿出来关联用户表即可。之所以这样做还有一个原因就是这个工作并非要做到很严格,和实际有点误差是无妨的。