浅谈 MySQL 子查询及其优化_MySQL-MySQL 튜토리얼-php.cn

1、案例：

2、现象：其他表的更新被阻塞

3、分析执行计划:

A . 使用覆盖索引:

B．查看该表的字段定义：

C．查看表字段的平均长度：

D．缩小字段长度

4、改写子查询：

5、查看执行计划：

6、执行时间：

7、总结：

8、Refer：

집

데이터 베이스

MySQL 튜토리얼

浅谈 MySQL 子查询及其优化_MySQL

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 31, 2016 am 08:46 AM

使用过oracle或者其他关系数据库的DBA或者开发人员都有这样的经验，在子查询上都认为数据库已经做过优化，能够很好的选择驱动表执行，然后在把该经验移植到mysql数据库上，但是不幸的是，mysql在子查询的处理上有可能会让你大失所望，在我们的生产系统上就碰到过一些案例，例如：

SELECT i_id, sum(i_sell) AS i_sellFROM table_dataWHERE i_id IN(SELECT i_id FROM table_data WHERE Gmt_create >= '2011-10-07 00:00:00')GROUP BY i_id;

로그인 후 복사

（备注：sql的业务逻辑可以打个比方：先查询出10-07号新卖出的100本书，然后在查询这新卖出的100本书在全年的销量情况）。

这条sql之所以出现的性能问题在于mysql优化器在处理子查询的弱点

，mysql优化器在处理子查询的时候，会将将子查询改写。通常情况下，我们希望由内到外，先完成子查询的结果，然后在用子查询来驱动外查询的表，完成查询；但是mysql处理为将会先扫描外面表中的所有数据，每条数据将会传到子查询中与子查询关联，如果外表很大的话，那么性能上将会出现问题；

针对上面的查询，由于table_data这张表的数据有70W的数据，同时子查询中的数据较多，有大量是重复的，这样就需要关联近70W次，大量的关联导致这条sql执行了几个小时也没有执行完成，所以我们需要改写sql：

SELECT t2.i_id, SUM(t2.i_sell) AS soldFROM(SELECT DISTINCT i_id FROM table_data WHERE gmt_create >= '2011-10-07 00:00:00') t1,table_data t2WHERE t1.i_id = t2.i_idGROUP BY t2.i_id;

로그인 후 복사

我们将子查询改为了关联，同时在子查询中加上distinct，减少t1关联t2的次数；

改造后，sql的执行时间降到100ms以内。

mysql的子查询的优化一直不是很友好，一直有受业界批评比较多,也是我在sql优化中遇到过最多的问题之一，mysql在处理子查询的时候，会将子查询改写,通常情况下，我们希望由内到外，也就是先完成子查询的结果，然后在用子查询来驱动外查询的表，完成查询，但是恰恰相反，子查询不会先被执行；今天希望通过介绍一些实际的案例来加深对mysql子查询的理解。下面将介绍一个完整的案例及其分析、调优的过程与思路。

1、案例：

用户反馈数据库响应较慢，许多业务动更新被卡住；登录到数据库中观察，发现长时间执行的sql；

| 10437 | usr0321t9m9 | 10.242.232.50:51201 | oms | Execute | 1179 | SendingSql为：SELECT tradedto0_.*FROM a1 tradedto0_WHERE tradedto0_.tradestatus='1'AND (tradedto0_.tradeoid IN (SELECT orderdto1_.tradeoidFROM a2 orderdto1_WHERE orderdto1_.proname LIKE '%??%'OR orderdto1_.procode LIKE '%??%'))AND tradedto0_.undefine4='1'AND tradedto0_.invoicetype='1'AND tradedto0_.tradestep='0'AND (tradedto0_.orderCompany LIKE '0002%')ORDER BY tradedto0_.tradesign ASC, tradedto0_.makertime DESC LIMIT 15;

로그인 후 복사

2、现象：其他表的更新被阻塞

UPDATE a1SET tradesign='DAB67634-795C-4EAC-B4A0-78F0D531D62F',markColor=' #CD5555',memotime='2012-09- 22', markPerson='??'WHERE tradeoid IN ('gy2012092204495100032') ；

로그인 후 복사

为了尽快恢复应用，将其长时间执行的sql kill掉后，应用恢复正常;

3、分析执行计划:

db@3306 ：explainSELECT tradedto0_.*FROM a1 tradedto0_WHERE tradedto0_.tradestatus='1'AND (tradedto0_.tradeoid IN	(SELECT orderdto1_.tradeoid	 FROM a2 orderdto1_	 WHERE orderdto1_.proname LIKE '%??%'	 OR orderdto1_.procode LIKE '%??%'))AND tradedto0_.undefine4='1'AND tradedto0_.invoicetype='1'AND tradedto0_.tradestep='0'AND (tradedto0_.orderCompany LIKE '0002%')ORDER BY tradedto0_.tradesign ASC,	tradedto0_.makertime DESC LIMIT 15;+----+--------------------+------------+------+---------------+------+---------+------+-------+-----| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |+----+--------------------+------------+------+---------------+------+---------+------+-------+-----| 1 | PRIMARY | tradedto0_ | ALL | NULL | NULL | NULL | NULL | 27454 | Using where; Using filesort || 2 | DEPENDENT SUBQUERY | orderdto1_ | ALL | NULL | NULL | NULL | NULL | 40998 | Using where |+----+--------------------+------------+------+---------------+------+---------+------+-------+-----

로그인 후 복사

从执行计划上，我们开始一步一步地进行优化：

首先，我们看看执行计划的第二行，也就是子查询的那部分，orderdto1_进行了全表的扫描，我们看看能不能添加适当的索引：

A . 使用覆盖索引:

db@3306：alter table a2 add index ind_a2(proname,procode,tradeoid);ERROR 1071 (42000): Specified key was too long; max key length is 1000 bytes

로그인 후 복사

添加组合索引超过了最大key length限制：

B．查看该表的字段定义：

db@3306 ：DESCa2 ;+---------------------+---------------+------+-----+---------+-------+| FIELD | TYPE| NULL | KEY | DEFAULT | Extra |+---------------------+---------------+------+-----+---------+-------+| OID | VARCHAR(50) | NO | PRI | NULL| || TRADEOID| VARCHAR(50) | YES| | NULL| || PROCODE | VARCHAR(50) | YES| | NULL| || PRONAME | VARCHAR(1000) | YES| | NULL| || SPCTNCODE | VARCHAR(200)| YES| | NULL| |

로그인 후 복사

C．查看表字段的平均长度：

db@3306 ：SELECT MAX(LENGTH(PRONAME)),avg(LENGTH(PRONAME)) FROM a2;+----------------------+----------------------+| MAX(LENGTH(PRONAME)) | avg(LENGTH(PRONAME)) |+----------------------+----------------------+|95| 24.5588 |

로그인 후 복사

D．缩小字段长度

ALTER TABLE MODIFY COLUMN PRONAME VARCHAR(156);

로그인 후 복사

再进行执行计划分析：

db@3306 ：explainSELECT tradedto0_.*FROM a1 tradedto0_WHERE tradedto0_.tradestatus='1'AND (tradedto0_.tradeoid IN	(SELECT orderdto1_.tradeoid	 FROM a2 orderdto1_	 WHERE orderdto1_.proname LIKE '%??%'	 OR orderdto1_.procode LIKE '%??%'))AND tradedto0_.undefine4='1'AND tradedto0_.invoicetype='1'AND tradedto0_.tradestep='0'AND (tradedto0_.orderCompany LIKE '0002%')ORDER BY tradedto0_.tradesign ASC,	tradedto0_.makertime DESC LIMIT 15;+----+--------------------+------------+-------+-----------------+----------------------+---------+| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |+----+--------------------+------------+-------+-----------------+----------------------+---------+| 1 | PRIMARY | tradedto0_ | ref | ind_tradestatus | ind_tradestatus | 345 | const,const,const,const | 8962 | Using where; Using filesort || 2 | DEPENDENT SUBQUERY | orderdto1_ | index | NULL | ind_a2 | 777 | NULL | 41005 | Using where; Using index |+----+--------------------+------------+-------+-----------------+----------------------+---------+

로그인 후 복사

发现性能还是上不去，关键在两个表扫描的行数并没有减小（8962*41005），上面添加的索引没有太大的效果，现在查看t表的执行结果：

db@3306 ：SELECT orderdto1_.tradeoidFROM t orderdto1_WHERE orderdto1_.proname LIKE '%??%'OR orderdto1_.procode LIKE '%??%'; EmptySET (0.05 sec)

로그인 후 복사

结果集为空，所以需要将t表的结果集做作为驱动表；

4、改写子查询：

通过上面测试验证，普通的mysql子查询写法性能上是很差的，为mysql的子查询天然的弱点，需要将sql进行改写为关联的写法：

SELECT tradedto0_.*FROM a1 tradedto0_ ,(SELECT orderdto1_.tradeoid FROM a2 orderdto1_ WHERE orderdto1_.proname LIKE '%??%' OR orderdto1_.procode LIKE '%??%')t2WHERE tradedto0_.tradestatus='1'AND (tradedto0_.tradeoid=t2.tradeoid)AND tradedto0_.undefine4='1'AND tradedto0_.invoicetype='1'AND tradedto0_.tradestep='0'AND (tradedto0_.orderCompany LIKE '0002%')ORDER BY tradedto0_.tradesign ASC, tradedto0_.makertime DESC LIMIT 15;

로그인 후 복사

5、查看执行计划：

db@3306 ：explainSELECT tradedto0_.*FROM a1 tradedto0_ ,(SELECT orderdto1_.tradeoid FROM a2 orderdto1_ WHERE orderdto1_.proname LIKE '%??%' OR orderdto1_.procode LIKE '%??%')t2WHERE tradedto0_.tradestatus='1'AND (tradedto0_.tradeoid=t2.tradeoid)AND tradedto0_.undefine4='1'AND tradedto0_.invoicetype='1'AND tradedto0_.tradestep='0'AND (tradedto0_.orderCompany LIKE '0002%')ORDER BY tradedto0_.tradesign ASC,	tradedto0_.makertime DESC LIMIT 15;+----+-------------+------------+-------+---------------+----------------------+---------+------+| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |+----+-------------+------------+-------+---------------+----------------------+---------+------+| 1 | PRIMARY | NULL | NULL | NULL | NULL | NULL | NULL | NULL | Impossible WHERE noticed after reading const tables || 2 | DERIVED | orderdto1_ | index | NULL | ind_a2 | 777 | NULL | 41005 | Using where; Using index |+----+-------------+------------+-------+---------------+----------------------+---------+------+

로그인 후 복사

6、执行时间：

db@3306 ：SELECT tradedto0_.*FROM a1 tradedto0_ ,(SELECT orderdto1_.tradeoid FROM a2 orderdto1_ WHERE orderdto1_.proname LIKE '%??%' OR orderdto1_.procode LIKE '%??%')t2WHERE tradedto0_.tradestatus='1'AND (tradedto0_.tradeoid=t2.tradeoid)AND tradedto0_.undefine4='1'AND tradedto0_.invoicetype='1'AND tradedto0_.tradestep='0'AND (tradedto0_.orderCompany LIKE '0002%')ORDER BY tradedto0_.tradesign ASC, tradedto0_.makertime DESC LIMIT 15; EmptySET (0.03 sec)

로그인 후 복사

缩短到了毫秒；

7、总结：

1. mysql子查询在执行计划上有着明显的弱点，需要将子查询进行改写

可以参考：

a. 生产库中遇到mysql的子查询：http://hidba.org/?p=412

b. 内建的builtin InnoDB,子查询阻塞更新：http://hidba.org/?p=456

2. 在表结构设计上，不要随便使用varchar(N)的大字段，导致无法使用索引

可以参考：

a. JDBC内存管理—varchar2(4000)的影响：http://hidba.org/?p=31

b. innodb中大字段的限制：http://hidba.org/?p=144

c. innodb使用大字段text，blob的一些优化建议： http://hidba.org/?p=551

8、Refer：

[1] 生产库中遇到mysql的子查询 http://hidba.org/?p=412

[2] 浅谈mysql的子查询 http://hidba.org/?p=624

[3] mysql子查询的弱点 http://hidba.org/?p=260

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

뜨거운 도구

뜨거운 주제

Gmail 이메일의 로그인 입구는 어디에 있나요?

7563

Cakephp 튜토리얼

1385

Steam의 계정 이름 형식은 무엇입니까?

Win11 활성화 키 영구

NYT 연결 힌트와 답변

Related knowledge

InnoDB 전체 텍스트 검색 기능을 설명하십시오. Apr 02, 2025 pm 06:09 PM

InnoDB의 전체 텍스트 검색 기능은 매우 강력하여 데이터베이스 쿼리 효율성과 대량의 텍스트 데이터를 처리 할 수있는 능력을 크게 향상시킬 수 있습니다. 1) InnoDB는 기본 및 고급 검색 쿼리를 지원하는 역 색인화를 통해 전체 텍스트 검색을 구현합니다. 2) 매치 및 키워드를 사용하여 검색, 부울 모드 및 문구 검색을 지원합니다. 3) 최적화 방법에는 워드 세분화 기술 사용, 인덱스의 주기적 재건 및 캐시 크기 조정, 성능과 정확도를 향상시키는 것이 포함됩니다.

Alter Table 문을 사용하여 MySQL에서 테이블을 어떻게 변경합니까? Mar 19, 2025 pm 03:51 PM

이 기사는 MySQL의 Alter Table 문을 사용하여 열 추가/드롭 테이블/열 변경 및 열 데이터 유형 변경을 포함하여 테이블을 수정하는 것에 대해 설명합니다.

MySQL에서 인덱스를 사용하는 것보다 전체 테이블 스캔이 더 빠를 수 있습니까? Apr 09, 2025 am 12:05 AM

전체 테이블 스캔은 MySQL에서 인덱스를 사용하는 것보다 빠를 수 있습니다. 특정 사례는 다음과 같습니다. 1) 데이터 볼륨은 작습니다. 2) 쿼리가 많은 양의 데이터를 반환 할 때; 3) 인덱스 열이 매우 선택적이지 않은 경우; 4) 복잡한 쿼리시. 쿼리 계획을 분석하고 인덱스 최적화, 과도한 인덱스를 피하고 정기적으로 테이블을 유지 관리하면 실제 응용 프로그램에서 최상의 선택을 할 수 있습니다.

Windows 7에 MySQL을 설치할 수 있습니까? Apr 08, 2025 pm 03:21 PM

예, MySQL은 Windows 7에 설치 될 수 있으며 Microsoft는 Windows 7 지원을 중단했지만 MySQL은 여전히 호환됩니다. 그러나 설치 프로세스 중에 다음 지점이 표시되어야합니다. Windows 용 MySQL 설치 프로그램을 다운로드하십시오. MySQL의 적절한 버전 (커뮤니티 또는 기업)을 선택하십시오. 설치 프로세스 중에 적절한 설치 디렉토리 및 문자를 선택하십시오. 루트 사용자 비밀번호를 설정하고 올바르게 유지하십시오. 테스트를 위해 데이터베이스에 연결하십시오. Windows 7의 호환성 및 보안 문제에 주목하고 지원되는 운영 체제로 업그레이드하는 것이 좋습니다.

InnoDB에서 클러스터 된 인덱스와 비 클러스터 된 인덱스 (2 차 지수)의 차이. Apr 02, 2025 pm 06:25 PM

클러스터 인덱스와 비 클러스터 인덱스의 차이점은 1. 클러스터 된 인덱스는 인덱스 구조에 데이터 행을 저장하며, 이는 기본 키 및 범위별로 쿼리에 적합합니다. 2. 클러스터되지 않은 인덱스는 인덱스 키 값과 포인터를 데이터 행으로 저장하며 비 예산 키 열 쿼리에 적합합니다.