Maison > base de données > tutoriel mysql > Explication du plan d'exécution MySQL et déduction de la structure des données d'indexation

Explication du plan d'exécution MySQL et déduction de la structure des données d'indexation

Libérer: 2020-11-13 17:08:07
2738 Les gens l'ont consulté

Tutoriel MySQLLa colonne présente le plan d'exécution, explique et indexe la structure des données

Explication du plan d'exécution MySQL et déduction de la structure des données d'indexation

Préparation work

Construisez d'abord la table de base de données, la table MySQL pour la démonstration, l'instruction de création de table :

CREATE TABLE `emp` (  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',  `empno` int(11) DEFAULT NULL COMMENT '雇员工号',  `ename` varchar(255) DEFAULT NULL COMMENT '雇员姓名',  `job` varchar(255) DEFAULT NULL COMMENT '工作',  `mgr` varchar(255) DEFAULT NULL COMMENT '经理的工号',  `hiredate` date DEFAULT NULL COMMENT '雇用日期',  `sal` double DEFAULT NULL COMMENT '工资',  `comm` double DEFAULT NULL COMMENT '津贴',  `deptno` int(11) DEFAULT NULL COMMENT '所属部门号',
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='雇员表';CREATE TABLE `dept` (  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',  `deptno` int(11) DEFAULT NULL COMMENT '部门号',  `dname` varchar(255) DEFAULT NULL COMMENT '部门名称',  `loc` varchar(255) DEFAULT NULL COMMENT '地址',
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='部门表';CREATE TABLE `salgrade` (  `id` int(11) NOT NULL COMMENT '主键',  `grade` varchar(255) DEFAULT NULL COMMENT '等级',  `lowsal` varchar(255) DEFAULT NULL COMMENT '最低工资',  `hisal` varchar(255) DEFAULT NULL COMMENT '最高工资',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='工资等级表';CREATE TABLE `bonus` (  `id` int(11) NOT NULL COMMENT '主键',  `ename` varchar(255) DEFAULT NULL COMMENT '雇员姓名',  `job` varchar(255) DEFAULT NULL COMMENT '工作',  `sal` double DEFAULT NULL COMMENT '工资',  `comm` double DEFAULT NULL COMMENT '津贴',
  PRIMARY KEY (`id`)
Copier après la connexion

Plan d'exécution de suivi, optimisation des requêtes, optimisation de l'index et autres exercices de connaissances, basés sur le tableau ci-dessus pour fonctionner.

Plan d'exécution MySQL

Pour effectuer le réglage SQL, vous devez savoir comment l'instruction SQL à régler est exécutée et vérifier le processus d'exécution spécifique de l'instruction SQL pour accélérer l'efficacité de l'exécution de l'instruction SQL.

Vous pouvez utiliser l'instruction explain + SQL pour simuler l'optimiseur exécutant des instructions de requête SQL, afin de savoir comment MySQL traite les instructions SQL.

Pour plus d'informations sur explain, vous pouvez consulter l'introduction du site officiel.

expliquer le format de sortie

mysql> explain select * from emp;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+|  1 | SIMPLE      | emp   | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    1 |   100.00 | NULL  |
Copier après la connexion

champ id, select_type et explication des autres champs :

Column Meaning
id The SELECT identifier(该SELECT标识符)
select_type The SELECT type( 该SELECT类型)
table The table for the output row(输出该行的表名)
partitions The matching partitions(匹配的分区)
type The join type(连接类型)
possible_keys The possible indexes to choose(可能的索引选择)
key The index actually chosen(实际选择的索引)
key_len The length of the chosen key(所选键的长度)
ref The columns compared to the index(与索引比较的列)
rows Estimate of rows to be examined(检查的预估行数)
filtered Percentage of rows filtered by table condition(按表条件过滤的行百分比)
extra Additional information(附加信息)




  • 如果id相同,那么执行顺序从上到下
mysql> explain select * from emp e join dept d on e.deptno = d.deptno join salgrade sg on e.sal between sg.lowsal and sg.hisal;
| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra                                              |
|  1 | SIMPLE      | e     | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    1 |   100.00 | NULL                                               |
|  1 | SIMPLE      | d     | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    1 |   100.00 | Using where; Using join buffer (Block Nested Loop) |
|  1 | SIMPLE      | sg    | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    1 |   100.00 | Using where; Using join buffer (Block Nested Loop) |
Copier après la connexion


  • 如果id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
mysql> explain select * from emp e where e.deptno in (select d.deptno from dept d where d.dname = 'SALEDept');
+----+--------------+-------------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+| id | select_type  | table       | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra                                              |
+----+--------------+-------------+------------+------+---------------+------+---------+------+------+----------+----------------------------------------------------+|  1 | SIMPLE       | <subquery2> | NULL       | ALL  | NULL          | NULL | NULL    | NULL | NULL |   100.00 | NULL                                               |
|  1 | SIMPLE       | e           | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    2 |    50.00 | Using where; Using join buffer (Block Nested Loop) |
|  2 | MATERIALIZED | d           | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    1 |   100.00 | Using where                                        |
Copier après la connexion


  • id相同和不同的,同时存在:相同的可以认为是一组,从上往下顺序执行,在所有组中,id值越大,优先级越高,越先执行




select_type Value JSON Name Meaning
SIMPLE None Simple SELECT (not using UNION or subqueries)
UNION None Second or later SELECT statement in a UNION
DEPENDENT UNION dependent (true) Second or later SELECT statement in a UNION, dependent on outer query
UNION RESULT union_result Result of a UNION.
SUBQUERY None First SELECT in subquery
DEPENDENT SUBQUERY dependent (true) First SELECT in subquery, dependent on outer query
DERIVED None Derived table
MATERIALIZED materialized_from_subquery Materialized subquery
UNCACHEABLE SUBQUERY cacheable (false) A subquery for which the result cannot be cached and must be re-evaluated for each row of the outer query
UNCACHEABLE UNION cacheable (false) The second or later select in a UNION that belongs to an uncacheable subquery (see UNCACHEABLE SUBQUERY)
  • SIMPLE 简单的查询,不包含子查询和union
mysql> explain select * from emp;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------+|  1 | SIMPLE      | emp   | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    3 |   100.00 | NULL  |
Copier après la connexion
  • primary 查询中若包含任何复杂的子查询,最外层查询则被标记为Primary
  • union 若第二个select出现在union之后,则被标记为union
mysql> explain select * from emp where deptno = 1001 union select * from emp where sal  | NULL       | ALL  | NULL          | NULL | NULL    | NULL | NULL |     NULL | Using temporary |
Copier après la connexion


  • dependent union 跟union类似,此处的depentent表示union或union all联合而成的结果会受外部表影响
  • union result 从union表获取结果的select
  • dependent subquery subquery的子查询要受到外部表查询的影响
mysql> explain select * from emp e where e.empno  in ( select empno from emp where deptno = 1001 union select empno from emp where sal  | NULL       | ALL  | NULL          | NULL | NULL    | NULL | NULL |     NULL | Using temporary |
Copier après la connexion


  • subquery 在select或者where列表中包含子查询


mysql> explain select * from emp where sal > (select avg(sal) from emp) ;
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+| id | select_type | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+-------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+|  1 | PRIMARY     | emp   | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    4 |    33.33 | Using where |
|  2 | SUBQUERY    | emp   | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    4 |   100.00 | NULL        |
Copier après la connexion
  • DERIVED from子句中出现的子查询,也叫做派生表
  • MATERIALIZED Materialized subquery?
  • UNCACHEABLE SUBQUERY 表示使用子查询的结果不能被缓存


mysql> explain select * from emp where empno = (select empno from emp where deptno=@@sort_buffer_size);
+----+----------------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+| id | select_type          | table | partitions | type | possible_keys | key  | key_len | ref  | rows | filtered | Extra       |
+----+----------------------+-------+------------+------+---------------+------+---------+------+------+----------+-------------+|  1 | PRIMARY              | emp   | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    4 |   100.00 | Using where |
|  2 | UNCACHEABLE SUBQUERY | emp   | NULL       | ALL  | NULL          | NULL | NULL    | NULL |    4 |    25.00 | Using where |
Copier après la connexion
  • uncacheable union 表示union的查询结果不能被缓存



  1. 如果是具体的表名,则表明从实际的物理表中获取数据,当然也可以是表的别名
  2. 表名是derivedN的形式,表示使用了id为N的查询产生的衍生表
  3. 当有union result的时候,表名是union n1,n2等的形式,n1,n2表示参与union的id




system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL


  • all 全表扫描,一般情况下出现这样的sql语句而且数据量比较大的话那么就需要进行优化


  • index 全索引扫描这个比all的效率要好,主要有两种情况:
    • 一种是当前的查询时覆盖索引,即我们需要的数据在索引中就可以索取
    • 一是使用了索引进行排序,这样就避免数据的重排序
  • range 表示利用索引查询的时候限制了范围,在指定范围内进行查询,这样避免了index的全索引扫描,适用的操作符: =, , >, >=,


SELECT * FROM tbl_name WHERE key_column = 10;

SELECT * FROM tbl_name WHERE key_column BETWEEN 10 and 20;

SELECT * FROM tbl_name WHERE key_column IN (10,20,30);

SELECT * FROM tbl_name WHERE key_part1 = 10 AND key_part2 IN (10,20,30);

  • index_subquery 利用索引来关联子查询,不再扫描全表

value IN (SELECT key_column FROM single_table WHERE some_expr)

  • unique_subquery 该连接类型类似与index_subquery,使用的是唯一索引

value IN (SELECT primary_key FROM single_table WHERE some_expr)

  • index_merge 在查询过程中需要多个索引组合使用
  • ref_or_null 对于某个字段既需要关联条件,也需要null值的情况下,查询优化器会选择这种访问方式

SELECT * FROM ref_table

WHERE key_column=expr OR key_column IS NULL;

  • fulltext 使用FULLTEXT索引执行join
  • ref 使用了非唯一性索引进行数据的查找

SELECT * FROM ref_table WHERE key_column=expr;

SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;

SELECT * FROM ref_table,other_table WHERE ref_table.key_column_part1=other_table.column AND ref_table.key_column_part2=1;

  • eq_ref 使用唯一性索引进行数据查找

SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;

SELECT * FROM ref_table,other_table WHERE ref_table.key_column_part1=other_table.column AND ref_table.key_column_part2=1;

  • const 这个表至多有一个匹配行

SELECT * FROM tbl_name WHERE primary_key=1;

SELECT * FROM tbl_name WHERE primary_key_part1=1 AND primary_key_part2=2;


mysql> explain select * from emp where id = 1;
+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+| id | select_type | table | partitions | type  | possible_keys | key     | key_len | ref   | rows | filtered | Extra |
+----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+|  1 | SIMPLE      | emp   | NULL       | const | PRIMARY       | PRIMARY | 4       | const |    1 |   100.00 | NULL  |
Copier après la connexion
  • system 表只有一行记录(等于系统表),这是const类型的特例,平时不会出现













  • using filesort 说明mysql无法利用索引进行排序,只能利用排序算法进行排序,会消耗额外的位置
  • using temporary 建立临时表来保存中间结果,查询完成之后把临时表删除
  • using index 这个表示当前的查询是覆盖索引的,直接从索引中读取数据,而不用访问数据表。如果同时出现using where 表明索引被用来执行索引键值的查找,如果没有,表示索引被用来读取数据,而不是真的查找
  • using where 使用where进行条件过滤
  • using join buffer 使用连接缓存
  • impossible where where语句的结果总是false




  1. 大大减少了服务器需要扫描的数据量
  2. 帮助服务器避免排序和临时表
  3. 将随机io变成顺序io(提升效率)


  1. 快速查找匹配WHERE子句的行
  2. 从consideration中消除行,如果可以在多个索引之间进行选择,mysql通常会使用找到最少行的索引
  3. 如果表具有多列索引,则优化器可以使用索引的任何最左前缀来查找行
  4. 当有表连接的时候,从其他表检索行数据
  5. 查找特定索引列的min或max值
  6. 如果排序或分组时在可用索引的最左前缀上完成的,则对表进行排序和分组
  7. 在某些情况下,可以优化查询以检索值而无需查询数据行

Explication du plan dexécution MySQL et déduction de la structure des données dindexation

Explication du plan dexécution MySQL et déduction de la structure des données dindexation









Inconvénients du stockage de données dans des tables de hachage :

  1. Si vous utilisez le stockage de hachage, vous devez ajouter tous les fichiers de données à la mémoire, ce qui consomme plus de mémoire espace
  2. Si toutes les requêtes sont des requêtes équivalentes, alors le hachage est très rapide, mais dans l'environnement de travail réel, les données de recherche de plage sont plus nombreuses que les requêtes équivalentes, dans ce cas, le hachage ne convient pas

En fait, lorsque le moteur de stockage MySQL est memory, la structure des données d'index utilise une table de hachage.

Arbre binaire

La structure d'un arbre binaire est comme ceci :

Explication du plan dexécution MySQL et déduction de la structure des données dindexation

Un arbre binaire provoquera perte de données en raison de la profondeur de l'arborescence, si la profondeur de l'arborescence est trop profonde, cela entraînera plus de temps d'E/S et affectera l'efficacité de la lecture des données.

L'arbre AVL doit être tourné, voir la légende :

Explication du plan dexécution MySQL et déduction de la structure des données dindexation

Arbre rouge-noir Il y a plus d'opérations en plus de la rotation Une fonction 变色 (afin de réduire la rotation), bien que la vitesse d'insertion soit rapide, l'efficacité des requêtes est perdue.

Explication du plan dexécution MySQL et déduction de la structure des données dindexation

Arbre binaire, Arbre AVL, Arbre rouge-noir seront tous causés par la profondeur de l'arborescence étant trop profonde. Le nombre de fois d'E/S augmente, ce qui affecte l'efficacité de la lecture des données.

Jetons un coup d'œil aux B-tree

Caractéristiques du B-tree :

  • Toutes les valeurs clés sont distribuées dans tout le arbre
  • La recherche peut se terminer à un nœud non-feuille, et une recherche est effectuée dans l'ensemble complet de mots-clés. Les performances sont proches de la recherche binaire
  • Chaque nœud a au plus m sous-arbres.
  • Le nœud racine a au moins 2 sous-arbres Arbre
  • Le nœud de branche a au moins m/2 sous-arbres (tous les nœuds de branche sauf le nœud racine et les nœuds feuilles)
  • Tous les nœuds feuilles sont au même niveau, et chaque nœud peut avoir au plus une clé m -1 et disposés par ordre croissant

Explication du plan dexécution MySQL et déduction de la structure des données dindexation

Description de la légende:

Chaque nœud occupe un bloc de disque. Il y a deux clés d'ordre croissant sur un nœud et trois pointeurs vers le nœud racine du sous-arbre. Les pointeurs stockent l'adresse du bloc de disque où se trouve le nœud enfant. situé.

Les trois champs range divisés par les deux mots-clés correspondent aux champs range des données du sous-arbre pointé par les trois pointeurs.

Prenons l'exemple du nœud racine, les mots-clés sont 16 et 34, la plage de données du sous-arbre pointé par le pointeur P1 est inférieure à 16, la plage de données du sous-arbre pointé par le pointeur P2 est 16 ~ 34 et la plage de données pointée par le pointeur P3. La plage de données du sous-arbre est supérieure à 34.

Processus de recherche par mot clé :

1. Recherchez le bloc de disque 1 en fonction du nœud racine et lisez-le en mémoire. [Opération d'E/S disque 1ère fois]

2. Comparez le mot-clé 28 dans l'intervalle (16,34), trouvez le pointeur P2 du bloc disque 1.

3. Recherchez le bloc de disque 3 en fonction du pointeur P2 et lisez-le dans la mémoire. [Opération d'E/S disque 2ème fois]

4. Comparez le mot-clé 28 dans l'intervalle (25,31), recherchez le pointeur P2 du bloc disque 3.

5. Recherchez le bloc de disque 8 en fonction du pointeur P2 et lisez-le dans la mémoire. [Opération d'E/S disque 3ème fois]

6. Recherchez le mot-clé 28 dans la liste de mots-clés du bloc de disque 8.

De là, nous pouvons connaître les lacunes du stockage B-tree :

  • Chaque nœud a une clé et contient également des données, et l'espace de stockage de chaque page est limité si. les données sont relativement volumineuses, cela entraînera une diminution du nombre de clés stockées dans chaque nœud
  • Lorsque la quantité de données stockées est importante, cela entraînera une plus grande profondeur et augmentera le nombre de fois d'E/S disque pendant la requête, et ainsi affecter les performances de la requête

Alors, quelle est la structure des données de l'index MySQL ?

Site Web officiel : La plupart des index MySQL (PRIMARY KEY, UNIQUE, INDEX et FULLTEXT) sont stockés dans des B-trees

Ne vous méprenez pas, en fait, la structure de stockage de l'index MySQL est B+树 Après notre analyse ci-dessus, nous savons que B树 est. inapproprié.

Structure de données d'index mysql---B+Tree

B+Tree est une optimisation basée sur BTree, avec les changements suivants :

1 . Chaque nœud de B+Tree peut contenir plus de nœuds. Il y a deux raisons à cela. La première raison est de réduire la hauteur de l'arborescence, et la deuxième raison est de modifier la plage de données en plusieurs intervalles. la récupération des données est plus rapide.

2. Les nœuds non-feuilles stockent les clés et les nœuds feuilles stockent les clés et les données.

3. Deux pointeurs de nœuds feuilles sont connectés l'un à l'autre (conformément aux caractéristiques de lecture anticipée du disque), et les performances des requêtes séquentielles sont plus élevées.

Schéma de stockage et de recherche de l'arbre B+ :

Explication du plan dexécution MySQL et déduction de la structure des données dindexation



因此可以对 B+Tree 进行两种查找运算:一种是对于主键的范围查找和分页查找,另一种是从根节点开始,进行随机查找。




mysql> select * from stu;
+------+---------+------+| id   | name    | age  |
+------+---------+------+|    1 | Jack Ma |   18 |
|    2 | Pony    |   19 |
Copier après la connexion



select * from stu where name='Pony';复制代码
Copier après la connexion





mysql> select id from stu where name='Pony';复制代码
Copier après la connexion




再来以nameage两个字段建组合索引(name, age),然后有这样一个查询:

select * from stu where name=? and age=?复制代码
Copier après la connexion

这时按照组合索引(name, age)查询,先匹配name,再匹配age,如果查询变成这样:

select * from stu where age=?复制代码
Copier après la connexion



  • (推荐)把组合索引(name, age)换个顺序,建(age, name)索引
  • 或者直接把age字段单独建个索引



select, from t1 join t2 on复制代码
Copier après la connexion









  1. Explain 为了知道优化SQL语句的执行,需要查看SQL语句的具体执行过程,以加快SQL语句的执行效率。
  2. 索引优点及用处。
  3. 索引采用的数据结构是B+树。
  4. 回表,覆盖索引,最左匹配和索引下推。


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter
Tutoriels populaires
Derniers téléchargements
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal