まえがき

順序配列の書き込み効率は高くないので、書き込み効率の高いものを見てみましょう。二分木は考えるのが簡単ですが、ここではバランス型を使用します例としての二分木の例:

スキップテーブルは、上記のハッシュテーブル、順序付けされた配列、バイナリツリーほど一般的ではないかもしれませんが、実際には、

データを増分的に書き込む場合は、このような考慮事項は必要なく、毎回順番に書き込むだけで済みます。

ESでは、

しかし、このインデックス構造で

したがって、妥協方法を選択できます。

最適化を使用できます。

ホームページ

データベース

mysql チュートリアル

MySQL インデックス VS ElasticSearch インデックス

coldplay.xixi

Oct 09, 2020 pm 05:03 PM

mysqlインデックス

TodayMySQL データベース列では、MySQL インデックスと ElasticSearch インデックスの比較を紹介します。

まえがき

この期間中、製品の検索機能をメンテナンスしていますが、# が表示されるたびに、 # 管理コンソール上で #elasticsearch 彼がどのようにしてこのような効率的なクエリ効率を達成しているのか非常に興味があります。

これは、ローカルマシンで

MySQL を使用して主キーでクエリを実行するよりもさらに高速です。

順序配列の書き込み効率は高くないので、書き込み効率の高いものを見てみましょう。二分木は考えるのが簡単ですが、ここではバランス型を使用します例としての二分木の例:

左側のノードが小さくなります右側のノードは親ノードよりも大きく、右側のノードは親ノードよりも大きくなります。

したがって、

id=11

のデータをクエリしたいと仮定すると、最終的には 10—>12—>11 をクエリするだけで済みます。時間計算量は O(logn) であり、データを書き込む場合も同様に O(logn) です。しかし、まだ間隔範囲検索は十分にサポートされていません。

5≤id≤20

のデータをクエリしたいとすると、最初に 10 個のノードの左側のサブツリーをクエリする必要があります。次に、10 ノードの左側のサブツリーをクエリします。最終的にすべてのデータをクエリできるのは、右側のサブツリーだけです。結果として、そのようなクエリ効率は高くありません。

ジャンプテーブル

スキップテーブルは、上記のハッシュテーブル、順序付けされた配列、バイナリツリーほど一般的ではないかもしれませんが、実際には、

Redis

の sort set はスキップテーブルを使用して実装されます。 ここでは、ジャンプテーブルによって実現されるデータ構造の利点を簡単に紹介します。 誰もが知っているように、順序付きリンクリスト をクエリすることすら効率的ではありません。二分探索に配列添字を使用できないため、時間計算量は <code>o( n) になります。

しかし、以下に示すように、リンクリストを巧みに最適化して、二分検索を偽装して実装することもできます。

# プライマリを抽出できます。最下位データのインデックスとセカンダリインデックスデータ量に応じて、N レベルのインデックスを抽出できます。

クエリを実行するとき、ここのインデックスを使用して、二分検索を偽装して実装できます。

id=13 のデータをクエリしたいとします。必要なのは 4 つのノード 1->7->10->13## だけです。 # to query データの場合、数が大きいほど効率の向上がより顕著になります。

同時に、間隔クエリもサポートされています。これは、先ほどの単一ノードのクエリと似ています。開始ノードをクエリし、それを順番に走査するだけです (

リンクリストはターゲットノードへの順序です) データの全範囲がクエリされます。

同時に、インデックスには実際のデータを格納せず、ポインターのみを格納するため、データが格納される下部のリンクリストと比較して、占有されるスペースは無視できます。

バランス型バイナリツリーの最適化

しかし実際には、

MySQL の Innodb はスキップテーブルを使用せず、 と呼ばれるテーブルを使用します。 B ツリーデータ構造。

このデータ構造は、基本的なデータ構造として大学の先生がよく言う二分木のようなものではなく、実際のプロジェクトでの需要シナリオに応じて基本的なデータ構造を発展させたものであるためです。

たとえば、ここの

B ツリーは、バランスの取れた二分木から進化したものと考えることができます。

先ほど、バイナリツリーの間隔クエリ効率は高くないと述べましたが、これは最適化できます。元のバイナリツリー最適化後: すべての非リーフノードはデータを格納せず、リーフノードのインデックスとしてのみ機能し、すべてのデータはリーフノードに格納されます。

このようにして、すべてのリーフノードのデータが順番に保存され、間隔クエリを適切にサポートできます。

MySQL

はインデックスファイルをディスクに直接保存します。

これは、後述する elasticsearch インデックスとは少し異なります。

#インデックスはディスクに保存されるため、ディスクの IO をできる限り削減する必要があります (ディスク IO の効率はメモリの効率とは桁違いです)

上の図からわかるように、データのクエリには少なくとも 4 回の IO 時間が必要です。明らかに、IO 回の回数はツリーの高さと密接に関係しています。ツリーの高さが低いほど、、IO 回数が少ないほどパフォーマンスが向上します。

木の高さを低くするにはどうすればよいでしょうか?

#二分木を三項木に変更してみると、木の高さが大幅に下がり、数値が下がります。データクエリ時の IO は自然に減少し、クエリ効率が大幅に向上します。

実はこれが B ツリーの起源です。

実際、上の図の

B ツリー

を理解することで、日々の作業の細部を最適化することもできます。 ; たとえば、なぜ最も必要なのか良いものは順番に増えていくのでしょうか？

書き込む主キーデータが順序付けされていないと仮定すると、後で書き込まれるデータの ID が前に書き込まれたデータの ID よりも小さくなる可能性があります。これは、
B ツリー# を維持するときに必要になる可能性があります。 ## インデックス。モバイルはすでにデータを書き込んでいます。

データを増分的に書き込む場合は、このような考慮事項は必要なく、毎回順番に書き込むだけで済みます。

そのため、データベースの主キーは可能な限り増加傾向にする必要があり、最も合理的なのは、分割テーブルの状況を考慮せずに主キーを自動インクリメントすることです。

全体として、アイデアはスキップテーブルのアイデアに似ていますが、使用シナリオに基づいて調整が行われています (たとえば、すべてのデータはリーフノードに格納されます)。 ES インデックス

MySQL

チャットの後、
Elasticsearch
がインデックスをどのように使用するかを見てみましょう。

前方インデックス

ESでは、

転置インデックス

と呼ばれるデータ構造が使用されます。転置インデックスについて正式に話す前に、彼の反対のがランク付けされることについて話しましょう。索引＃＃＃。

上の図は例です。doc_id を通じて特定のオブジェクトをクエリする方法は、Forward Index## を使用して呼び出されます。 # は、実際にはハッシュテーブルとしても理解できます。

本質は、キーを通じて価値を見つけることです。

たとえば、

doc_id=4 を通じて、データ name=jetty wang,age=20 をすばやくクエリできます。

逆インデックス

次に、

name に li が含まれるデータをクエリしたい場合は?このように効率的にクエリを実行するにはどうすればよいでしょうか?

上記の順方向インデックスを使用するだけでは明らかに何の効果もありません。すべてのデータを順番に走査して、名前に

li が含まれているかどうかを判断することしかできません。これは非常に非効率です。

しかし、インデックス構造を再構築すると:

クエリを実行するとき、

name には li# が含まれます。 ## データの場合は、このインデックス構造を通じて Posting List に含まれるデータをクエリし、マッピングを通じて最終データをクエリするだけで済みます。このインデックス構造は実際には

逆インデックス

です。用語辞書

しかし、このインデックス構造で

を効率的にクエリするにはどうすればよいでしょうか? Term を追加する限り、これまでの経験と組み合わせることができます。順番に、バイナリツリー検索ツリーのデータ構造を使用して、o(logn) の下のデータをクエリできます。テキストを独立した

Term

に分割するプロセスは、実際には単語の分割とよく呼ばれるものです。すべての

Term

を結合したものが Term Dictionary であり、単語辞書とも呼ばれます。

英語の単語の分割は比較的簡単です。単語を分割するには、テキストをスペースと句読点で区切るだけです。中国語は比較的複雑ですが、それをサポートするオープンソースツールも多数あります (この記事の主題ではないので、単語の分割については興味のある方はご自身で検索してください)。

テキストの量が膨大な場合、単語分割後の

Term

が大量に存在することになります。このような転置インデックスデータ構造がメモリに保存されていれば、間違いなくしかし、MySQL のようにディスクに保存されている場合、効率はそれほど高くありません。用語インデックス

したがって、妥協方法を選択できます。

用語辞書

全体をメモリに入れることはできないため、用語辞書 インデックスを作成してメモリに置きます。このようにして、

用語辞書

を効率的にクエリでき、最終的に投稿リストを用語辞書を通じてクエリできるようになります。 MySQL の

B ツリー

と比較すると、ディスク IO も数倍削減されます。

トライツリー

を使用できます。これはよく言われることです辞書ツリーを保存します。辞書ツリーの詳細については、ここを参照してください。

Term

を検索する場合、最初のステップは # を検索することです。メモリ内の ##Term Index は、Term Dictionary 辞書ファイル内の j で始まる Term の位置をクエリします (この位置はファイルポインタである場合があります) 、おそらく間隔範囲）。 次に、この位置範囲内のすべての Term を取り出します。これらはソートされているため、二分検索によって特定の位置をすばやく見つけることができます。このようにして、## をクエリできます。 #投稿リスト。

最後に、投稿リストの位置情報を介して、元のファイルから目的のデータを取得できます。さらなる最適化

もちろん、ElasticSearch では、多くの対象を絞った最適化も行っています。2 つのフィールドを取得する場合、

bitmap

最適化を使用できます。

たとえば、name=li と age=18 のデータをクエリする必要があります。このとき、それぞれの結果 投稿リスト を取得する必要があります。この2つのフィールドを通じて。

最も簡単な方法は、2 つのコレクションを別々に走査して重複データを削除することですが、これは明らかに非効率です。

以上がMySQL インデックス VS ElasticSearch インデックスの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7451

CakePHP チュートリアル

1374

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

mysql インデックス障害のいくつかの状況 Feb 21, 2024 pm 04:23 PM

一般的な状況: 1. 関数または演算を使用する; 2. 暗黙的な型変換; 3. 等しくない (!= または <>) を使用する; 4. LIKE 演算子を使用し、ワイルドカードで始める; 5. OR 条件; 6. NULL値、7. 低いインデックス選択性、8. 複合インデックスの左端の接頭辞の原則、9. オプティマイザーの決定、10. FORCE INDEX および IGNORE INDEX。

どのような状況で mysql インデックスが失敗しますか? Aug 09, 2023 pm 03:38 PM

MySQL インデックスは、インデックスカラムを使用せずにクエリを実行した場合、データ型が一致していない場合、プレフィックスインデックスが不適切に使用された場合、クエリに関数や式を使用した場合、インデックスカラムの順序が正しくない場合、データ更新が頻繁に行われる場合、インデックスが多すぎるか少なすぎる場合に失敗します。 1. クエリにはインデックス列を使用しないでください。この状況を回避するには、クエリで適切なインデックス列を使用する必要があります。2. データ型が一致しません。テーブル構造を設計するときは、インデックス列がクエリの構造と一致していることを確認する必要があります。クエリのデータ型; 3. 、プレフィックスインデックスの不適切な使用、プレフィックスインデックスを使用できます。

MySQL インデックスの左プレフィックスマッチングルール Feb 24, 2024 am 10:42 AM

MySQL インデックスの左端の原則とコード例 MySQL では、インデックス作成はクエリ効率を向上させる重要な手段の 1 つです。その中でも、インデックスの左端の原則は、インデックスを使用してクエリを最適化するときに従う必要がある重要な原則です。この記事では、MySQL インデックスの左端の原則を紹介し、具体的なコード例をいくつか示します。 1. インデクス左端原則の原則インデクス左端原則とは、インデクスにおいて問合せ条件が複数の列で構成される場合、問合せ条件を完全に満たすにはインデクスの左端の列のみを問合せできることを意味します。

mysqlインデックスの分類は何ですか? Apr 22, 2024 pm 07:12 PM

MySQL インデックスは次のタイプに分類されます: 1. 通常のインデックス: 値、範囲、またはプレフィックスに一致します。 2. 固有のインデックス: 値が一意であることを確認します。 3. 主キーインデックス: 主キー列の一意のインデックス。キーインデックス: 別のテーブルの主キーを指します。 5. フルテキストインデックス: 全文検索。 7. 空間インデックス: 地理空間検索。列。

PHP および MySQL インデックスのデータ更新とインデックス保守のためのパフォーマンス最適化戦略と、それらがパフォーマンスに及ぼす影響 Oct 15, 2023 pm 12:15 PM

PHP および MySQL インデックスのデータ更新とインデックス保守のためのパフォーマンス最適化戦略と、それらがパフォーマンスに与える影響概要: PHP および MySQL の開発において、インデックスはデータベースクエリのパフォーマンスを最適化するための重要なツールです。この記事では、インデックスの基本原則と使用法を紹介し、データの更新とメンテナンスに対するインデックスのパフォーマンスへの影響を検討します。同時に、この記事では、開発者がインデックスをよりよく理解して適用できるように、いくつかのパフォーマンス最適化戦略と具体的なコード例も提供します。インデックスの基本原則と使用法 MySQL では、インデックスは特別な番号です。

MySQL インデックスを合理的に使用し、データベースのパフォーマンスを最適化するにはどうすればよいでしょうか?技術系の学生が知っておくべき設計プロトコル! Sep 10, 2023 pm 03:16 PM

MySQL インデックスを合理的に使用し、データベースのパフォーマンスを最適化するにはどうすればよいでしょうか?技術系の学生が知っておくべき設計プロトコル!はじめに: 今日のインターネット時代では、データ量は増加し続けており、データベースのパフォーマンスの最適化が非常に重要なテーマになっています。最も人気のあるリレーショナルデータベースの 1 つである MySQL では、データベースのパフォーマンスを向上させるためにインデックスを合理的に使用することが重要です。この記事では、MySQL インデックスを合理的に使用し、データベースのパフォーマンスを最適化し、技術系の学生向けにいくつかの設計ルールを提供する方法を紹介します。 1. なぜインデックスを使用するのでしょうか?インデックスは、以下を使用するデータ構造です。

さまざまなタイプのMySQLインデックス（Bツリー、ハッシュ、フルテキスト、空間）を説明します。 Apr 02, 2025 pm 07:05 PM

MySQLは、Bツリー、ハッシュ、フルテキスト、および空間の4つのインデックスタイプをサポートしています。 1.B-Treeインデックスは、等しい値検索、範囲クエリ、ソートに適しています。 2。ハッシュインデックスは、等しい値検索に適していますが、範囲のクエリとソートをサポートしていません。 3.フルテキストインデックスは、フルテキスト検索に使用され、大量のテキストデータの処理に適しています。 4.空間インデックスは、地理空間データクエリに使用され、GISアプリケーションに適しています。

MySQL で一意のインデックスを作成してデータの一意性を確保する方法 Mar 15, 2024 pm 12:45 PM

タイトル: データの一意性を確保するために MySQL で一意のインデックスを作成する方法とコード例データベース設計では、データの一意性を確保することが非常に重要です。これは、MySQL で一意のインデックスを作成することで実現できます。一意のインデックスを使用すると、テーブル内の特定の列 (または列の組み合わせ) の値が一意であることが保証されます。重複する値を挿入しようとすると、MySQL はこの操作を阻止し、エラーを報告します。この記事では、MySQL で一意のインデックスを作成する方法を、具体的なコード例を示しながら紹介します。一意のインデックスとは何ですか? 一意のインデックスは、インデックスの一種です。

See all articles

MySQL インデックス VS ElasticSearch インデックス

まえがき

順序配列の書き込み効率は高くないので、書き込み効率の高いものを見てみましょう。二分木は考えるのが簡単ですが、ここではバランス型を使用します例としての二分木の例:

スキップ テーブルは、上記のハッシュ テーブル、順序付けされた配列、バイナリ ツリーほど一般的ではないかもしれませんが、実際には、

データを増分的に書き込む場合は、このような考慮事項は必要なく、毎回順番に書き込むだけで済みます。

ESでは、

しかし、このインデックス構造で

したがって、妥協方法を選択できます。

最適化を使用できます。

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

スキップテーブルは、上記のハッシュテーブル、順序付けされた配列、バイナリツリーほど一般的ではないかもしれませんが、実際には、