MySQL的词法分析纵谈

Jun 07, 2016 pm 04:26 PM
mysql 分析する

MySQL的词法分析漫谈 这个链接上有点介绍,可以了解个大概:http://blog.imaginea.com/mysql-query-parsing/ 关键点: 1. SQL解析包括语法分析器和词法分析器。 简便的做法是用bison/flex组合。不过MySQL的词法分析器是手工打造的。 语法分析器的入口函数是MY

MySQL的词法分析漫谈
这个链接上有点介绍,可以了解个大概:http://blog.imaginea.com/mysql-query-parsing/   

关键点:
1. SQL解析包括语法分析器和词法分析器。
   简便的做法是用bison/flex组合。不过MySQL的词法分析器是手工打造的。
   语法分析器的入口函数是MYSQLparse,词法分析器的入口函数是MYSQLlex。
2. 词法分析中会检查token是否为关键字。
    最直接的做法是弄个大的关键字数组,进行折半查找。MySQL在此做了些优化。
   本文主要介绍的是这一部分。

考虑到关键字是一个只读的列表,对它做一个只读的查找树可以改善查找的性能。
产生查找树:
1. 读取关键字数组,产生一个Trie树。
2. 调整这棵树,并产生一个数组(也就是一个不用链表表示的树)。

使用查找树:
这个比较简单,直接看函数get_hash_symbol好了。

产生查找树,相关的Makefile规则:     
In `sql/CMakeFiles/sql.dir/build.make':

sql/lex_hash.h: sql/gen_lex_hash
  $(CMAKE_COMMAND) -E cmake_progress_report /home/zedware/Workspace/mysql/CMakeFiles $(CMAKE_PROGRESS_153)
  @$(CMAKE_COMMAND) -E cmake_echo_color --switch=$(COLOR) --blue --bold "Generating lex_hash.h"
  cd /home/zedware/Workspace/mysql/sql && ./gen_lex_hash > lex_hash.h

容易发现,最主要的函数就是`get_hash_symbol',它主要的调用关系为:

/* sql/lex_hash.h */
get_hash_symbol->sql_functions_map
get_hash_symbol->symbols_map

/* sql/sql_lex.cc */
find_keyword->get_hash_symbol
is_keyword->get_hash_symbol
is_lex_native_function->get_hash_symbol

文件"gen_lex_hash.cc"注释中的树的示例:

+-----------+-+-+-+
|       len |1|2|3|
+-----------+-+-+-+
|first_char |0|0|a|
|last_char  |0|0|d|
|link       |0|0|+|
                 |
                 V
       +----------+-+-+-+--+
       |    1 char|a|b|c|d |
       +----------+-+-+-+--+
       |first_char|d|0|0|0 |
       |last_char |n|0|0|-1|
       |link      |+|0|0|+ |
                   |     |
                   |     V
                   |  symbols[2] ( "DAY" )
                   V
+----------+--+-+-+-+-+-+-+-+-+-+--+
|    2 char|d |e|f|j|h|i|j|k|l|m|n |
+----------+--+-+-+-+-+-+-+-+-+-+--+
|first_char|0 |0|0|0|0|0|0|0|0|0|0 |
|last_char |-1|0|0|0|0|0|0|0|0|0|-1|
|link      |+ |0|0|0|0|0|0|0|0|0|+ |
            |                    |
            V                    V
         symbols[0] ( "ADD" )  symbols[1] ( "AND" )

如果你还记得Trie树,理解起来会容易一点。下面是不同的输入数组对应的树。
i=0

+-----------+-+--+
|       len |1| 2|
+-----------+-+--+
|first_char |0|-1|
|last_char  |0| 0|
|char_tails |0| x|
|ithis      |0| 0|
|iresult    |0| 0|
                |
               &&

static SYMBOL symbols[] = {
  { "&&",   SYM(AND_AND_SYM)},

static uchar symbols_map[8]= {
0,   0,   1, 0,                    0,   0,   0, 0,                    };

i=1

+-----------+--+--+
|       len | 1| 2|
+-----------+--+--+
|first_char |-1|-1|
|last_char  | 0| 0|
|char_tails | x| x|
|ithis      | 0| 0|
|iresult    | 1| 0|
              |  |
             
static SYMBOL symbols[] = {
  { "&&",   SYM(AND_AND_SYM)},
  { "
static uchar symbols_map[8]= {
0,   0,   1, 0,                    0,   0,   0, 0,                    };
             
i=2

+-----------+--+--+
|       len | 1| 2|
+-----------+--+--+
|first_char |-1| &|
|last_char  | 0| |char_tails | x| ^|
|ithis      | 0| 0|
|iresult    | 1| x|
              |  |
                               |          
       +----------+--+--+   +--+
       |    1 char| &|  |...|        +----------+--+--+   +--+
       |first_char|-1| 0|   |-1|
       |last_char | 0| 0|   | 0|
       |char_tails| 0| 0|   | x|
       |ithis     | 0| 0|   | 0|
       |iresult   | 0| 0|   | 2|
                   |          |
                   &&       
static SYMBOL symbols[] = {
  { "&&",   SYM(AND_AND_SYM)},
  { "   { "
static uchar symbols_map[100]= {
0,   0,   1, 0,
'&', ' 0,   0,   0, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   3, 0,
0,   0,   2, 0,
};

i=3

+-----------+--+--+
|       len | 1| 2|
+-----------+--+--+
|first_char |-1| &|
|last_char  | 0| |char_tails | x| ^|
|ithis      | 0| 0|
|iresult    | 1| x|
              |  |
                               |          
       +----------+--+--+   +--+
       |    1 char| &|  |...|        +----------+--+--+   +--+
       |first_char|-1| 0|   |-1|
       |last_char | 0| 0|   | 0|
       |char_tails| 0| 0|   | x|
       |ithis     | 0| 0|   | 0|
       |iresult   | 0| 0|   | p|
                   |          |
                   &&         |
                              |
                   +----------+--+--+
                   |    2 char| =| >|
                   +----------+--+--+
                   |first_char|-1|-1|
                   |last_char | 0| 0|
                   |char_tails| x| x|
                   |ithis     | 0| 0|
                   |iresult   | 2| 3|
                                |  |
                              
                              
static SYMBOL symbols[] = {
  { "&&",   SYM(AND_AND_SYM)},
  { "   { "   { "",   SYM(NE)},

static uchar symbols_map[108]= {
0,   0,   1, 0,
'&', ' 0,   0,   0, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
0,   0,   4, 0,
'=', '>', 25, 0,
0,   0,   2, 0,
0,   0,   3, 0,
};
                              
可以看到,数组表示中存在一定的空间浪费。要是不怕麻烦,我们还可以去榨出一点油水来。
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

PHPのビッグデータ構造処理スキル PHPのビッグデータ構造処理スキル May 08, 2024 am 10:24 AM

ビッグ データ構造の処理スキル: チャンキング: データ セットを分割してチャンクに処理し、メモリ消費を削減します。ジェネレーター: データ セット全体をロードせずにデータ項目を 1 つずつ生成します。無制限のデータ セットに適しています。ストリーミング: ファイルやクエリ結果を 1 行ずつ読み取ります。大きなファイルやリモート データに適しています。外部ストレージ: 非常に大規模なデータ セットの場合は、データをデータベースまたは NoSQL に保存します。

PHP で MySQL クエリのパフォーマンスを最適化するにはどうすればよいですか? PHP で MySQL クエリのパフォーマンスを最適化するにはどうすればよいですか? Jun 03, 2024 pm 08:11 PM

MySQL クエリのパフォーマンスは、検索時間を線形の複雑さから対数の複雑さまで短縮するインデックスを構築することで最適化できます。 PreparedStatement を使用して SQL インジェクションを防止し、クエリのパフォーマンスを向上させます。クエリ結果を制限し、サーバーによって処理されるデータ量を削減します。適切な結合タイプの使用、インデックスの作成、サブクエリの使用の検討など、結合クエリを最適化します。クエリを分析してボトルネックを特定し、キャッシュを使用してデータベースの負荷を軽減し、オーバーヘッドを最小限に抑えます。

PHP で MySQL のバックアップと復元を使用するにはどうすればよいですか? PHP で MySQL のバックアップと復元を使用するにはどうすればよいですか? Jun 03, 2024 pm 12:19 PM

PHP で MySQL データベースをバックアップおよび復元するには、次の手順を実行します。 データベースをバックアップします。 mysqldump コマンドを使用して、データベースを SQL ファイルにダンプします。データベースの復元: mysql コマンドを使用して、SQL ファイルからデータベースを復元します。

PHP を使用して MySQL テーブルにデータを挿入するにはどうすればよいですか? PHP を使用して MySQL テーブルにデータを挿入するにはどうすればよいですか? Jun 02, 2024 pm 02:26 PM

MySQLテーブルにデータを挿入するにはどうすればよいですか?データベースに接続する: mysqli を使用してデータベースへの接続を確立します。 SQL クエリを準備します。挿入する列と値を指定する INSERT ステートメントを作成します。クエリの実行: query() メソッドを使用して挿入クエリを実行します。成功すると、確認メッセージが出力されます。

MySQL 8.4 で mysql_native_password がロードされていないエラーを修正する方法 MySQL 8.4 で mysql_native_password がロードされていないエラーを修正する方法 Dec 09, 2024 am 11:42 AM

MySQL 8.4 (2024 年時点の最新の LTS リリース) で導入された主な変更の 1 つは、「MySQL Native Password」プラグインがデフォルトで有効ではなくなったことです。さらに、MySQL 9.0 ではこのプラグインが完全に削除されています。 この変更は PHP および他のアプリに影響します

PHP で MySQL ストアド プロシージャを使用するにはどうすればよいですか? PHP で MySQL ストアド プロシージャを使用するにはどうすればよいですか? Jun 02, 2024 pm 02:13 PM

PHP で MySQL ストアド プロシージャを使用するには: PDO または MySQLi 拡張機能を使用して、MySQL データベースに接続します。ストアド プロシージャを呼び出すステートメントを準備します。ストアド プロシージャを実行します。結果セットを処理します (ストアド プロシージャが結果を返す場合)。データベース接続を閉じます。

PHP を使用して MySQL テーブルを作成するにはどうすればよいですか? PHP を使用して MySQL テーブルを作成するにはどうすればよいですか? Jun 04, 2024 pm 01:57 PM

PHP を使用して MySQL テーブルを作成するには、次の手順が必要です。 データベースに接続します。データベースが存在しない場合は作成します。データベースを選択します。テーブルを作成します。クエリを実行します。接続を閉じます。

Oracleデータベースとmysqlの違い Oracleデータベースとmysqlの違い May 10, 2024 am 01:54 AM

Oracle データベースと MySQL はどちらもリレーショナル モデルに基づいたデータベースですが、Oracle は互換性、スケーラビリティ、データ型、セキュリティの点で優れており、MySQL は速度と柔軟性に重点を置いており、小規模から中規模のデータ セットに適しています。 ① Oracle は幅広いデータ型を提供し、② 高度なセキュリティ機能を提供し、③ エンタープライズレベルのアプリケーションに適しています。① MySQL は NoSQL データ型をサポートし、② セキュリティ対策が少なく、③ 小規模から中規模のアプリケーションに適しています。

See all articles