MySQL + ES + MongoDB と互換性を持たせて、数億のデータのディープページングを実現するにはどうすればよいでしょうか?-PHPチュートリアル-php.cn

ホームページ

バックエンド開発

PHPチュートリアル

MySQL + ES + MongoDB と互換性を持たせて、数億のデータのディープページングを実現するにはどうすればよいでしょうか?

Guanhui

Jul 27, 2020 pm 05:24 PM

mysql

インタビューの質問と実際の経験

インタビュー質問: データ量が多い場合にディープページングを実現するにはどうすればよいですか?

面接中や面接の準備中に、上記の質問に遭遇することがあります。基本的に、データベースとテーブルを分割してインデックスを構築するという答えがほとんどです。これは非常に標準的な正解ですが、現実は常に難しいため、面接官は通常、プロジェクトのスケジュールも人員も不足している中で、どうすればディープページングを実現できるか、と尋ねます。

この時期、実務経験のない学生は基本的に無感覚なので、聞いてください。

痛ましい教訓

まず最初に明確にしておきたいのは、深度ページングは実行できますが、

前の画像:

MySQL + ES + MongoDB と互換性を持たせて、数億のデータのディープページングを実現するにはどうすればよいでしょうか?

ページ 142360 をクリックすると、サービスが爆発するでしょうか?

MongoDB データベースも MySQL と同じで大丈夫です。それ自体は専門的なデータベースです。処理は良くなく、せいぜい遅いです。しかし、ES が関与すると性質が異なります。 SearchAfter API をループするデータの取得にはメモリ使用量の問題があり、コードを丁寧に書かないとメモリオーバーフローに直結する可能性があります。

ランダムな深さのページジャンプが許可されない理由

ランダムな深さのページジャンプが技術的な観点から許可されない理由について簡単に説明しましょう、またはディープページングが推奨されないのはなぜですか?

MySQL

ページングの基本原則:

SELECT * FROM test ORDER BY id DESC LIMIT 10000, 20;

ログイン後にコピー

LIMIT 10000、20 は 10020 行をスキャンすることを意味します条件を満たすものを破棄します。最初の 10,000 行を削除し、最後の 20 行を返します。 LIMIT 1000000 であれば、100、1000100 行をスキャンする必要があり、同時実行性の高いアプリケーションでは、各クエリで 100W 以上の行をスキャンする必要があり、爆発しないのは不思議です。

MongoDB

ページングの基本原理:

db.t_data.find().limit(5).skip(5);

ログイン後にコピー

同様に、ページ番号が増加するにつれて、skip でスキップされる項目も増加します。ページ番号が非常に大きく、頻繁に使用されると、必然的に爆発的に増加します。

ElasticSearch

ビジネスの観点から見ると、ElasticSearch は一般的なデータベースではなく、検索エンジンです。フィルター条件で目的のデータが見つからない場合、深いページングを続けると、必要なデータは見つかりません。一歩下がって、クエリ用のデータベースとして ES を使用すると、ページング時に間違いなく max_result_window の制限に遭遇します。わかりましたか? 当局は最大値を教えてくれますオフセット制限は 10,000 です。

クエリプロセス:

ページあたり 10 項目でページ 501 をクエリすると、クライアントは特定のノードにリクエストを送信します
このノードはデータを各シャードにブロードキャストし、各シャードは最初の 5010 個のデータをクエリします。
クエリ結果はノードに返され、データが統合されます
クライアントに戻る

ここから、なぜ制限する必要があるのかがわかります。さらに、Search After API のディープページジャンプクエリなどのスクロールメソッドを使用する場合、毎回数千のアイテムをスクロールする必要があり、合計で数百万、数千万のデータをスクロールする必要がある場合があります。過去 20 個のデータの効率性は想像できます。

もう一度製品と合わせてください

よく言われるように、テクノロジーで解決できない問題はビジネスで解決する必要があります。

インターンシップ中、私は製品が悪であると信じていたため、ディープページングとページジャンプを実装する必要がありました。今度は混乱を修正し、ビジネスに次の変更を加える必要があります:

期間などのデフォルトのフィルタ条件をできるだけ追加します。表示されるデータ量を減らすためです。

ページジャンプの表示方法を変更し、スクロール表示に変更します。または狭い範囲でページをジャンプする場合

スクロール表示参考図:

MySQL + ES + MongoDB と互換性を持たせて、数億のデータのディープページングを実現するにはどうすればよいでしょうか?

小規模なページジャンプ参考図:

MySQL + ES + MongoDB と互換性を持たせて、数億のデータのディープページングを実現するにはどうすればよいでしょうか?

##一般的な解決策短期間での迅速な解決策には、主に次の点が含まれます。

MySQL

元のページング SQL:

# 第一页
SELECT * FROM `year_score` where `year` = 2017 ORDER BY id limit 0, 20;
# 第N页
SELECT * FROM `year_score` where `year` = 2017 ORDER BY id limit (N - 1) * 20, 20;

ログイン後にコピー

コンテキストを通じて、次のように書き換えられます:

# XXXX 代表已知的数据
SELECT * FROM `year_score` where `year` = 2017 and id > XXXX ORDER BY id limit 20;

ログイン後にコピー

在没内鬼，来点干货！SQL优化和诊断一文中提到过，LIMIT会在满足条件下停止查询，因此该方案的扫描总量会急剧减少，效率提升Max！

方案和MySQL相同，此时我们就可以随用所欲的使用 FROM-TO Api，而且不用考虑最大限制的问题。

MongoDB

方案基本类似，基本代码如下：

MySQL + ES + MongoDB と互換性を持たせて、数億のデータのディープページングを実現するにはどうすればよいでしょうか?

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7445

CakePHP チュートリアル

1372

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

rootとしてmysqlにログインできません Apr 08, 2025 pm 04:54 PM

ルートとしてMySQLにログインできない主な理由は、許可の問題、構成ファイルエラー、一貫性のないパスワード、ソケットファイルの問題、またはファイアウォール傍受です。解決策には、構成ファイルのBind-Addressパラメーターが正しく構成されているかどうかを確認します。ルートユーザー許可が変更されているか削除されてリセットされているかを確認します。ケースや特殊文字を含むパスワードが正確であることを確認します。ソケットファイルの許可設定とパスを確認します。ファイアウォールがMySQLサーバーへの接続をブロックすることを確認します。

MySQLテーブルロックテーブルを変更するかどうか Apr 08, 2025 pm 05:06 PM

MySQLがテーブル構造を変更すると、メタデータロックが通常使用され、テーブルがロックされる可能性があります。ロックの影響を減らすために、次の測定値をとることができます。1。オンラインDDLでテーブルを使用できます。 2。バッチで複雑な変更を実行します。 3.小規模またはオフピーク期間中に操作します。 4. PT-OSCツールを使用して、より細かい制御を実現します。

MySQLユーザーとデータベースの関係 Apr 08, 2025 pm 07:15 PM

MySQLデータベースでは、ユーザーとデータベースの関係は、アクセス許可と表によって定義されます。ユーザーには、データベースにアクセスするためのユーザー名とパスワードがあります。許可は助成金コマンドを通じて付与され、テーブルはCreate Tableコマンドによって作成されます。ユーザーとデータベースの関係を確立するには、データベースを作成し、ユーザーを作成してから許可を付与する必要があります。

MySQLはAndroidで実行できますか Apr 08, 2025 pm 05:03 PM

MySQLはAndroidで直接実行できませんが、次の方法を使用して間接的に実装できます。Androidシステムに構築されたLightWeight Database SQLiteを使用して、別のサーバーを必要とせず、モバイルデバイスアプリケーションに非常に適したリソース使用量が少ない。 MySQLサーバーにリモートで接続し、データの読み取りと書き込みのためにネットワークを介してリモートサーバー上のMySQLデータベースに接続しますが、強力なネットワーク依存関係、セキュリティの問題、サーバーコストなどの短所があります。

mysqlは支払う必要がありますか Apr 08, 2025 pm 05:36 PM

MySQLには、無料のコミュニティバージョンと有料エンタープライズバージョンがあります。コミュニティバージョンは無料で使用および変更できますが、サポートは制限されており、安定性要件が低く、技術的な能力が強いアプリケーションに適しています。 Enterprise Editionは、安定した信頼性の高い高性能データベースを必要とするアプリケーションに対する包括的な商業サポートを提供し、サポートの支払いを喜んでいます。バージョンを選択する際に考慮される要因には、アプリケーションの重要性、予算編成、技術スキルが含まれます。完璧なオプションはなく、最も適切なオプションのみであり、特定の状況に応じて慎重に選択する必要があります。

高負荷アプリケーションのMySQLパフォーマンスを最適化する方法は？ Apr 08, 2025 pm 06:03 PM

MySQLデータベースパフォーマンス最適化ガイドリソース集約型アプリケーションでは、MySQLデータベースが重要な役割を果たし、大規模なトランザクションの管理を担当しています。ただし、アプリケーションのスケールが拡大すると、データベースパフォーマンスのボトルネックが制約になることがよくあります。この記事では、一連の効果的なMySQLパフォーマンス最適化戦略を検討して、アプリケーションが高負荷の下で効率的で応答性の高いままであることを保証します。実際のケースを組み合わせて、インデックス作成、クエリ最適化、データベース設計、キャッシュなどの詳細な主要なテクノロジーを説明します。 1.データベースアーキテクチャの設計と最適化されたデータベースアーキテクチャは、MySQLパフォーマンスの最適化の基礎です。いくつかのコア原則は次のとおりです。適切なデータ型を選択し、ニーズを満たす最小のデータ型を選択すると、ストレージスペースを節約するだけでなく、データ処理速度を向上させることもできます。

RDS MySQL Redshift Zero ETLとの統合 Apr 08, 2025 pm 07:06 PM

データ統合の簡素化：AmazonrdsmysqlとRedshiftのゼロETL統合効率的なデータ統合は、データ駆動型組織の中心にあります。従来のETL（抽出、変換、負荷）プロセスは、特にデータベース（AmazonrdsmysQlなど）をデータウェアハウス（Redshiftなど）と統合する場合、複雑で時間がかかります。ただし、AWSは、この状況を完全に変えたゼロETL統合ソリューションを提供し、RDSMYSQLからRedshiftへのデータ移行のための簡略化されたほぼリアルタイムソリューションを提供します。この記事では、RDSMysQl Zero ETLのRedshiftとの統合に飛び込み、それがどのように機能するか、それがデータエンジニアと開発者にもたらす利点を説明します。

MySQLのクエリ最適化は、特に大規模なデータセットを扱う場合、データベースのパフォーマンスを改善するために不可欠です Apr 08, 2025 pm 07:12 PM

1.正しいインデックスを使用して、データの量を削減してデータ検索をスピードアップしました。テーブルの列を複数回検索する場合は、その列のインデックスを作成します。あなたまたはあなたのアプリが基準に従って複数の列からのデータが必要な場合、複合インデックス2を作成します2。選択した列のみを避けます。必要な列のすべてを選択すると、より多くのサーバーメモリを使用する場合にのみサーバーが遅くなり、たとえばテーブルにはcreated_atやupdated_atやupdated_atなどの列が含まれます。

See all articles

MySQL + ES + MongoDB と互換性を持たせて、数億のデータのディープ ページングを実現するにはどうすればよいでしょうか?

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

MySQL + ES + MongoDB と互換性を持たせて、数億のデータのディープページングを実現するにはどうすればよいでしょうか?