MySQL查询优化器浅析(一)-mysql チュートリアル-php.cn

ホームページ

データベース

mysql チュートリアル

MySQL查询优化器浅析(一)

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 07, 2016 pm 02:52 PM

mysql 最適化意味お問い合わせ

1 定义 Mysql查询优化器的工作是为查询语句选择合适的执行路径。查询优化器的代码一般是经常变动的，这和存储引擎不太一样。因此，需要理解最新版本的查询优化器是如何组织的，请参考相应的源代码。整体而言，优化器有很多相同性，对mysql一个版本的优化器做

1 定义

　　Mysql查询优化器的工作是为查询语句选择合适的执行路径。查询优化器的代码一般是经常变动的，这和存储引擎不太一样。因此，需要理解最新版本的查询优化器是如何组织的，请参考相应的源代码。整体而言，优化器有很多相同性，对mysql一个版本的优化器做到整体掌握，理解起mysql新版本以及其他数据库的优化器都是类似的。

　　优化器会对查询语句进行转化，转化等价的查询语句。举个例子，优化器会将下面语句进行转化：

　　SELECT … WHERE 5=a;

　　转化后的等价语句为：

　　SELECT … WHERE a=5;

　　因为这两个语句的结果集是一致的，所以这两个语句是等价的。

　　这里我需要提出一点需要注意的，如果查询语句没带order by。查询语句1出现的结果为(1,1),(2,2)，查询语句2出现的结果为(2,2),(1,1)，我们会认为这是等价的，因为不带order by的查询语句是无序的，怎么排序都行。

2 代码组织

　　在内核当中handle_select()函数是处理查询语句的顶层函数，里面有两个分支，一个是处理带union的情况，另外一个是处理不带union的情况，这里我们只是列出一个简单的路径便于说明，调用层次见下图。　

handle_select()
   mysql_select()
     JOIN::prepare()
       setup_fields()
     JOIN::optimize()            /* optimizer is from here ... */
       optimize_cond()
       opt_sum_query()
       make_join_statistics()
         get_quick_record_count()
         choose_plan()
           /* Find the best way to access tables */
           /* as specified by the user.          */
           optimize_straight_join()
             best_access_path()
           /* Find a (sub-)optimal plan among all or subset */
           /* of all possible query plans where the user    */
           /* controlls the exhaustiveness of the search.   */
           greedy_search()
             best_extension_by_limited_search()
               best_access_path()
           /* Perform an exhaustive search for an optimal plan */
           find_best()
       make_join_select()        /* ... to here */
     JOIN::exec()

　　上面的缩进表示函数的相互调用关系，因此可以看出handle_select()调用函数mysql_select(),mysql_select()调用JOIN::prepare()，等等。

　　mysql_select()首先调用函数JOIN::prepare()进行语句分析、元数据设置、子查询转化等等。然后调用函数JOIN::optimize()进行优化，选出最后的执行计划。最后调用函数JOIN::exec()执行该执行计划。

　　尽管出现了单词“JOIN”，这些优化函数是为所有的查询语句服务的，不管你是什么查询类型。

　　函数optimize_cond()和函数opt_sum_query()是执行一些转化操作。函数make_join_statistics()对所有可用索引统计信息进行分析。

3 常量转化

　　对类似下面的表达式可以进行转化：

　　WHERE column1 = column2 AND column2 = 'x';

　　因为我们知道：如果A=B and B=C，那么A=C。所以上面的表达式可以转化为：

　　WHERE column1 = 'x' AND column2 = 'x';

　　对于column1 column2，只要是属于下面的操作符之一就可以进行类似的转化：

　　=,,=,,,LIKE

　　从中我们也可以看出，对于BETWEEN的情况是不进行转换的。

4 无效代码的排除

　　见如下表达式：

　　WHERE 0=0 AND column1='y'

　　因为第一个条件是始终为true的，所以可以移除该条件，变为：

　　WHERE column1='y'

　　再见如下表达式：

　　WHERE (0=1 AND s1=5) OR s1=7

　　因为前一个括号内的表达式始终为false，因此可以移除该表达式，变为：

　　WHERE s1=7

　　一些情况下甚至可以将整个WHERE子句去掉，见下面的表达式：

　　WHERE (0=1 AND s1=5)

　　我们可以看到，WHERE子句始终为FALASE，那么WHERE条件是不可能发生的。当然我们也可以讲，WHERE条件被优化掉了。

　　如果一个列的定义是不允许为NULL，那么：

　　WHERE not_null_column IS NULL

　　该条件是始终为false的，再看：

　　WHERE not_null_column IS NOT NULL

　　该条件是始终为true的，因此这样的表达式也是可以从条件表达式中删除的。

　　当然，也是有特殊情况的，比如在out join中，被定义为NOT NULL的列也可能包含NULL值。在这种情况下，IS NULL条件是被保留的。

　　当然优化器没有对所有的情况进行检测，因为这实在太复杂了。举个例子：

　　CREATE TABLE Table1(column1 CHAR(1));

　　…

　　SELECT * FROM Table1 WHERE column1 = 'Canada';

　　尽管该条件是无效条件，优化器也不会将它移除。

5 常量计算

　　如下表达式：

　　WHERE columb1 = 1 + 2

　　转化为：

　　WHERE columb1 = 3

6 常量以及常量表

　　常量表的定义如下：

　　1) 一个表只有0行或者1行数据。

　　2) 在WHERE子句中包含条件column = constant，并且这些列是primary key，或者这些列是UNIQUE(假设该UNIQUE同时被定义为NOT NULL)。这样生成的查询结果也可以成为常量表。

　　如果表Table0定义中包含：

　　… PRIMARY KEY(column1,column2)

　　再看下面的语法：

　　FROM Table0 … WHERE column1=5 AND column2=7 …

　　那么该语句返回的就是常量表。

　　举个更简单的情况，建设Table1定义中包含:

　　… unique_not_null_column INT NOT NULL UNIQUE

　　再看下面的语法：

　　FROM Table1 ... WHERE unique_not_null_column=5

　　该语句返回的也是常量表。

　　从例子中我们可以看出常量表最多只有1个行值。MySQL会预先评估常量表，找出这个值，然后将这个值引入到查询语句中进行优化，举例如下：

　　SELECT Table1.unique_not_null_column, Table2.any_column

　　FROM Table1, Table2

　　WHERE Table1.unique_not_null_column = Table2.any_column

　　AND Table1.unique_not_null_column = 5;

　　在评估这个查询语句时，MySQL首先发现通过Table1.unique_not_null_column条件的限制，Table1会变成一个常量表。然后，取回该值。

　　如果取回操作失败(Table1中没有行满足条件unique_not_null_column = 5)，那么该常量表就包含0行，那么如果对该语句执行EXPLAIN操作，会得到提示信息：

　　Impossible WHERE noticed after reading const tables

　　另外一种情况是取回操作成功(Table1中严格只有一行满足条件unique_not_null_column = 5)，那么常量表中包含一条数据，并且MySQL会将查询语句转化为：

　　SELECT 5, Table2.any_column

　　FROM Table1, Table2

　　WHERE 5 = Table2.any_column

　　AND 5 = 5;

　　实际上，这个例子是个复杂的例子，这里面也用到了上文所说的常量转化。　　

7 存取类型

　　当我们评估一个条件表达式，MySQL判断该表达式的存取类型。下面是一些存取类型，按照从最优到最差的顺序进行排列：

　　system … 系统表，并且是常量表

　　const … 常量表

　　eq_ref … unique/primary索引，并且使用的是'='进行存取

　　ref … 索引使用'='进行存取

　　ref_or_null … 索引使用'='进行存取，并且有可能为NULL

　　range … 索引使用BETWEEN、IN、>=、LIKE等进行存取

　　index … 索引全扫描

　　ALL … 表全扫描

　　优化器根据存取类型选择合适的驱动表达式。考虑如下的查询语句：

以下是引用片段：
　　SELECT *
　　FROM Table1
　　WHERE indexed_column = 5 AND unindexed_column = 6

　　因为indexed_column拥有更好的存取类型，所以更有可能使用该表达式做为驱动表达式。这里只考虑简单的情况，不考虑特殊的情况。

　　那么驱动表达式的意思是什么呢?考虑到这个查询语句有两种可能的执行方法:

　　1) 不好的执行路径：读取表的每一行(称为“全表扫描”)，对于读取到的每一行，检查相应的值是否满足indexed_column以及unindexed_column对应的条件。

　　2) 好的执行路径：通过键值indexed_column=5查找B树，对于符合该条件的每一行，判断是否满足unindexed_column对应的条件。

　　一般情况下，索引查找比全表扫描需要更少的存取路径，尤其当表数据量很大，并且索引的类型是UNIQUE的时候。因此称它为好的执行路径，使用indexed_column列作为驱动表达式。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7333

Java チュートリアル

1627

CakePHP チュートリアル

1351

Laravel チュートリアル

1262

PHP チュートリアル

1209

Related knowledge

PHP で MySQL クエリのパフォーマンスを最適化するにはどうすればよいですか? Jun 03, 2024 pm 08:11 PM

MySQL クエリのパフォーマンスは、検索時間を線形の複雑さから対数の複雑さまで短縮するインデックスを構築することで最適化できます。 PreparedStatement を使用して SQL インジェクションを防止し、クエリのパフォーマンスを向上させます。クエリ結果を制限し、サーバーによって処理されるデータ量を削減します。適切な結合タイプの使用、インデックスの作成、サブクエリの使用の検討など、結合クエリを最適化します。クエリを分析してボトルネックを特定し、キャッシュを使用してデータベースの負荷を軽減し、オーバーヘッドを最小限に抑えます。

PHP で MySQL のバックアップと復元を使用するにはどうすればよいですか? Jun 03, 2024 pm 12:19 PM

PHP で MySQL データベースをバックアップおよび復元するには、次の手順を実行します。データベースをバックアップします。 mysqldump コマンドを使用して、データベースを SQL ファイルにダンプします。データベースの復元: mysql コマンドを使用して、SQL ファイルからデータベースを復元します。

PHP を使用して MySQL テーブルにデータを挿入するにはどうすればよいですか? Jun 02, 2024 pm 02:26 PM

MySQLテーブルにデータを挿入するにはどうすればよいですか?データベースに接続する: mysqli を使用してデータベースへの接続を確立します。 SQL クエリを準備します。挿入する列と値を指定する INSERT ステートメントを作成します。クエリの実行: query() メソッドを使用して挿入クエリを実行します。成功すると、確認メッセージが出力されます。

MySQL 8.4 で mysql_native_password がロードされていないエラーを修正する方法 Dec 09, 2024 am 11:42 AM

MySQL 8.4 (2024 年時点の最新の LTS リリース) で導入された主な変更の 1 つは、「MySQL Native Password」プラグインがデフォルトで有効ではなくなったことです。さらに、MySQL 9.0 ではこのプラグインが完全に削除されています。この変更は PHP および他のアプリに影響します

PHP で MySQL ストアドプロシージャを使用するにはどうすればよいですか? Jun 02, 2024 pm 02:13 PM

PHP で MySQL ストアドプロシージャを使用するには: PDO または MySQLi 拡張機能を使用して、MySQL データベースに接続します。ストアドプロシージャを呼び出すステートメントを準備します。ストアドプロシージャを実行します。結果セットを処理します (ストアドプロシージャが結果を返す場合)。データベース接続を閉じます。

PHP を使用して MySQL テーブルを作成するにはどうすればよいですか? Jun 04, 2024 pm 01:57 PM

PHP を使用して MySQL テーブルを作成するには、次の手順が必要です。データベースに接続します。データベースが存在しない場合は作成します。データベースを選択します。テーブルを作成します。クエリを実行します。接続を閉じます。

C++ プログラムの最適化: 時間の複雑さを軽減する手法 Jun 01, 2024 am 11:19 AM

時間計算量は、入力のサイズに対するアルゴリズムの実行時間を測定します。 C++ プログラムの時間の複雑さを軽減するためのヒントには、適切なコンテナー (ベクター、リストなど) を選択して、データのストレージと管理を最適化することが含まれます。クイックソートなどの効率的なアルゴリズムを利用して計算時間を短縮します。複数の操作を排除して二重カウントを削減します。条件分岐を使用して、不必要な計算を回避します。二分探索などのより高速なアルゴリズムを使用して線形探索を最適化します。

Oracleデータベースとmysqlの違い May 10, 2024 am 01:54 AM

Oracle データベースと MySQL はどちらもリレーショナルモデルに基づいたデータベースですが、Oracle は互換性、スケーラビリティ、データ型、セキュリティの点で優れており、MySQL は速度と柔軟性に重点を置いており、小規模から中規模のデータセットに適しています。 ① Oracle は幅広いデータ型を提供し、② 高度なセキュリティ機能を提供し、③ エンタープライズレベルのアプリケーションに適しています。① MySQL は NoSQL データ型をサポートし、② セキュリティ対策が少なく、③ 小規模から中規模のアプリケーションに適しています。

See all articles