数百億のデータがテーブルに分割された後のページングクエリを理解する-mysql チュートリアル-php.cn

一意の主キー

最初のステップは、テーブルを分割した後の順序番号が一意であることを確認することです。次に、テーブルの分割の問題を考えてみましょう。まず、サブテーブル自体の業務量と増分に基づいて、サブテーブルのサイズを検討します。

長々と話してようやく本題に到達したのですが、テーブル分割後のクエリとページングクエリの問題をどうやって解決するのでしょうか？

もう一方のサイドクエリ

概要

ホームページ

データベース

mysql チュートリアル

数百億のデータがテーブルに分割された後のページングクエリを理解する

coldplay.xixi

Nov 09, 2020 pm 05:24 PM

ページングクエリ

mysql ビデオチュートリアル列では、数百億のデータのページングクエリを紹介します。

数百億のデータがテーブルに分割された後のページングクエリを理解する

#事業規模がある程度の規模に達すると、タオバオの1日の注文量は5,000万件を超え、美団の1日の注文量は5,000万件を超えます。注文数は3,000万件を超えています。データベースが大規模なデータ負荷に直面している場合、サブデータベースとテーブルのサブ操作が必要になります。データベースがテーブルに分割された後、一部の通常のクエリで問題が発生する可能性があります。最も一般的なのはページングクエリです。通常、シャーディングテーブルのフィールドのことを shardingkey と呼びます。たとえば、注文テーブルではユーザー ID が shardingkey として使用されます。では、クエリ条件にユーザー ID が含まれていない場合にページングを行うにはどうすればよいでしょうか?たとえば、シャーディングキーがない場合、どのようにしてより多くの多次元クエリを実行できるでしょうか?

一意の主キー

一般に、データベースの主キーは自動的にインクリメントされるため、テーブル分割後の主キーの競合の問題は避けられません。最も簡単な方法は、次の方法です。ユニークなビジネスこのフィールドは唯一の主キーとして機能します。たとえば、注文テーブルの注文番号はグローバルに一意である必要があります。

一意の ID を生成する一般的な分散方法は数多くありますが、最も一般的なものは Snowflake アルゴリズム、Didi Tinyid、Meituan Leaf です。スノーフレークアルゴリズムを例にとると、1 ミリ秒以内に複数の ID を生成できます。

最初のビット

は使用されず、デフォルトは0です。41桁のタイムスタンプはミリ秒単位で正確で、69年に対応でき、10桁は機能します。マシン ID の上位 5 桁はデータセンター ID、下位 5 桁はノード ID、12 桁のシリアル番号 各ノードはミリ秒ごとに蓄積され、合計は 2^12 に達することがあります。 4096 ID。

パーティション化

最初のステップは、テーブルを分割した後の順序番号が一意であることを確認することです。次に、テーブルの分割の問題を考えてみましょう。まず、サブテーブル自体の業務量と増分に基づいて、サブテーブルのサイズを検討します。

たとえば、当社の 1 日あたりの注文量は現在 100,000 件ですが、1 年後には 1 日あたり 100 万件に達すると推定されています。ビジネス属性に応じて、通常は半年以内に注文のクエリをサポートします。半年を超える注文はアーカイブが必要です。

したがって、半年間で 1 日あたり 100 万件の注文に基づくと、個別のテーブルを使用しない場合、注文量は 100 万件に達します。たとえ RT の時間を処理できたとしても、それを受け入れることはできません。経験によれば、1 つのテーブルの数が数百万であればデータベースに負荷はかからないため、テーブルを 256 個のテーブル (1 億 8,000 万/256 ≈ 700,000) に分割するだけで十分です。 512 のテーブルに分割することもできます。次に、ビジネス量がさらに 10 倍増加して 1 日あたり 1,000 万件の注文になった場合、サブテーブル 1024 がより適切な選択となることを考えてください。

半年以上にわたってテーブルを分割し、データをアーカイブした結果、単一テーブル内の 700,000 データは、ほとんどのシナリオに十分に対応できるようになりました。次に、注文番号をハッシュし、256 の剰余を取得して、それがどのテーブルに該当するかを決定します。

まあ、主キーは注文番号のみなので、過去に主キーIDを元に書いたクエリは使えません。これには履歴が必要です。 . クエリ機能の変更。でも、これは問題ないですよね? 注文番号で確認するように変更すれば大丈夫です。これはどれも問題ではありません。問題はタイトルにあるとおりです。

C 側クエリ

長々と話してようやく本題に到達したのですが、テーブル分割後のクエリとページングクエリの問題をどうやって解決するのでしょうか？

まず、シャーディングキーを使用したクエリについて説明します。たとえば、注文番号によるクエリです。何をしても、クエリ対象の特定のテーブルを直接見つけることができます。明らかに問題はありません。クエリで。

シャーディングキーではなく、上記の例で注文番号がシャーディングキーとして使用されている場合、APP や小規模なプログラムは通常、ユーザー ID を通じてクエリされます。注文番号を通して?多くの企業の注文テーブルでは、ユーザー ID をシャーディングキーとして直接使用します。これは非常にシンプルで、直接確認できます。では、注文番号はどうすればよいのでしょうか? 非常に簡単な方法は、ユーザー ID 属性を注文番号に追加することです。非常に単純な例を挙げると、元の 41 桁のタイムスタンプを使い切ることはできないと考えます。ユーザー ID は 10 桁です。注文番号生成ルールにはユーザー ID が含まれています。特定のテーブルに入るとき、10 桁のユーザー注文番号のIDハッシュを使用し、注文番号やユーザーIDに関わらずクエリの効果が同じになるように法を計算します。

もちろん、この方法は一例であり、具体的な注文番号の生成ルール、桁数、要素を含めるなどの具体的な内容は、自社のビジネスや実装メカニズムに応じて決定されます。

わかりました。注文番号またはユーザー ID をシャーディングキーとして使用する場合は、上記の 2 つの方法に従って問題を解決できます。次に、別の質問があります。注文番号でもユーザー ID クエリでもない場合はどうすればよいですか?最も直感的な例は、販売者側またはバックエンドからのクエリです。販売者側は、販売者または販売者の ID をクエリ条件として使用します。バックグラウンドでのクエリ条件は、私が遭遇したいくつかのバックグラウンドクエリ条件のように、より複雑になる場合があります。数十個ある可能性があります。確認するにはどうすればよいですか? ? ?心配しないでください。B サイドとバックエンドの複雑なクエリについては個別に説明します。

実際には、実際のトラフィックのほとんどはユーザー側の C 側から来ているため、基本的にユーザー側の問題は解決されます。この問題はほとんど解決され、残りはマーチャントから来ます。売り手側、B側、バックエンドサポート運用業務クエリトラフィックはそれほど多くないため、この問題は簡単に解決できます。

もう一方のサイドクエリ

B サイドの非シャーディングキークエリを解決するには 2 つの方法があります。

二重書き込み. 二重書き込みとは、注文データが2部に保存されることを意味します。C面とB面に1部ずつ保存されます。C面には注文番号が使用できます。ユーザー ID をシャーディングキーとして使用します。B 側は販売者の販売者の ID をシャーディングキーとして使用できます。クラスメイトの中には、二重に書いてもパフォーマンスに影響しないのではないかと言う人もいます。 B サイドではわずかな遅延が許容されるため、非同期メソッドを使用して B サイドの注文を行うことができます。考えてみてください。タオバオで何かを購入して注文した場合、販売者が注文メッセージを受け取るのが 1 ～ 2 秒遅れても問題ありませんか?注文の受け取りが 1 ～ 2 秒遅れることは、注文した持ち帰り販売店に大きな影響を及ぼしますか?

これは解決策です。別の解決策は、 オフラインデータウェアハウスまたは ES クエリを使用することです。注文データがデータベースにドロップされた後、 binlog または MQ メッセージを使用する場合、メッセージはすべてデータウェアハウスまたは ES にデータを同期する形式になっており、この種のクエリ条件ではサポートされる桁数は非常に単純です。この方法では確かにわずかな遅延が発生しますが、この制御可能な遅延は許容範囲です。

データを確認する必要がある運用、ビジネス、製品などの管理バックエンドでのクエリの場合、当然、複雑なクエリ条件が必要になります。これは、次の方法でも実行できます。 ESとかデータウェアハウスとか。このソリューションを使用せず、シャーディングキーを使用せずにページングクエリを実行する場合、テーブル全体をスキャンして集計データをクエリし、手動でページングを実行することしかできませんが、この方法で得られる結果は限られています。

たとえば、256 個のシャードがある場合、クエリを実行するときにすべてのシャードを周期的にスキャンし、各シャードから 20 個のデータを取得し、最後にデータを集計して手動でページングすると、完全な量のデータ。

概要

データベースとテーブルのパーティショニング後のクエリの問題は、経験豊富な学生には実際に知られていますが、ほとんどの学生はまだこの問題に取り組んでいない可能性があると思います。データベースやテーブルについてはまだ構想段階かもしれませんが、面接で質問されても経験がないので何をすればいいのかわからず戸惑っています。

サブデータベースとサブテーブルは、既存の業務量と将来の増加に基づいて最初に判断されます。たとえば、Pinduoduo の 1 日あたりの注文量が 5,000 万件の場合、半年分のデータはスコアは 4096 テーブルですよね。でも、実際の操作は同じです。あなたのビジネスでは、スコアが 4096 である必要はありません。ビジネスに基づいて合理的な選択をしてください。

シャーディングキーに基づくクエリは簡単に解決できます。シャーディングキー以外のクエリは、データの二重コピー、データウェアハウス、ESをドロップすることで解決できます。もちろん、分割後のデータ量が少なければ、、インデックスを作成してテーブル全体をスキャンしてクエリを実行することは問題ありません。

関連する無料学習の推奨事項: mysql ビデオチュートリアル

以上が数百億のデータがテーブルに分割された後のページングクエリを理解するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7722

Java チュートリアル

1642

CakePHP チュートリアル

1396

Laravel チュートリアル

1289

PHP チュートリアル

1233

Related knowledge

PHP データベース接続を使用してページングクエリを実装する方法 Sep 08, 2023 pm 02:28 PM

PHP データベース接続を使用してページングクエリを実装する方法 Web アプリケーションを開発する場合、データベースにクエリを実行してページング表示を実行することがよくあります。一般的に使用されるサーバー側スクリプト言語として、PHP には強力なデータベース接続機能があり、ページングクエリを簡単に実装できます。この記事では、PHP データベース接続を使用してページングクエリを実装する方法を詳しく紹介し、対応するコード例を添付します。データベースの準備開始する前に、クエリ対象のデータを含むデータベースを準備する必要があります。ここでは MySQL データベースを例として取り上げます。

PHP と PDO: ページングクエリを実行してデータを表示する方法 Jul 29, 2023 pm 04:10 PM

PHP と PDO: ページ内のデータをクエリして表示する方法 Web アプリケーションを開発する場合、ページ内のデータをクエリして表示することは非常に一般的な要件です。ページングにより、一度に一定量のデータを表示できるため、ページの読み込み速度とユーザーエクスペリエンスが向上します。 PHP では、PHP データオブジェクト (PDO) ライブラリを使用して、ページングクエリとデータの表示の機能を簡単に実現できます。この記事では、PHP で PDO を使用してページごとにデータをクエリおよび表示する方法と、対応するコード例を紹介します。 1. データベースとデータテーブルを作成する

Go 言語を使用して高パフォーマンスの MySQL データページングクエリを作成する方法 Jun 17, 2023 am 09:09 AM

インターネットの急速な発展に伴い、データ処理はエンタープライズアプリケーション開発における重要なスキルになりました。 MySQL データベースは、多くのアプリケーションで最も一般的に使用されるデータストアの 1 つです。 MySQL では、データページングクエリは一般的なデータ取得操作です。この記事では、Go 言語を使用して高パフォーマンスの MySQL データページングクエリを実装する方法を紹介します。 1. データページングクエリとは何ですか?データページングクエリは、一般的に使用されるデータ取得テクノロジであり、ユーザーは一度にすべてを読み込むことなく、ページ上の少量のデータのみを参照できます。

ページ分割されたクエリのために PHP で MongoDB を使用する方法 Jul 07, 2023 pm 09:28 PM

PHP がページ分割されたクエリに MongoDB を使用する方法の概要: MongoDB は大量のドキュメントデータを保存するためによく使用される非リレーショナルデータベースですが、PHP は一般的なサーバーサイドスクリプト言語です。この記事では、PHPを使用してMongoDBに接続し、ページングクエリ機能を実装する方法を紹介します。ステップ 1: MongoDB 拡張機能をインストールする. PHP で MongoDB を操作するには、MongoDB 拡張機能をインストールする必要があります。 MongoDB 拡張機能は、次のコマンドを使用してインストールできます。 p

ThinkPHP6 で MySQL を使用してページングクエリを実行する方法 Jun 20, 2023 pm 02:01 PM

インターネットの急速な発展に伴い、Web アプリケーションの開発はますます複雑になっています。ページングクエリは、Web アプリケーションの一般的な機能の 1 つです。 ThinkPHP6 は、開発者がアプリケーションを迅速に開発できるようにする Web フレームワークです。この記事では、ThinkPHP6 で MySQL を使用してページ分割されたクエリを実行する方法について説明します。まず、ThinkPHP6 でデータベースを作成する必要があります。 MySQL でデータベースを作成するステートメントは次のとおりです。 CREATEDATABASE

PHP および Oracle データベースのページングクエリスキル Jul 11, 2023 pm 11:09 PM

PHP および Oracle データベースのページングクエリ手法動的 Web ページを開発する場合、大量のデータを表示する必要がある場合は、ページングクエリを実行する必要があります。ページ分割されたクエリは、ユーザーが簡単に参照して移動できるように、データを小さなページに分割する手法です。この記事では、PHP と Oracle データベースを使用してページ分割されたクエリを実装する方法について説明し、関連するコード例を示します。 1. 準備開始する前に、PHP と Oracle データベースがインストールおよび設定されていることを確認する必要があります。まだなら

thinkormを使ってページングクエリ機能を簡単に実装する方法 Jul 31, 2023 pm 10:41 PM

thinkorm を使用してページングクエリ機能を簡単に実装する方法の概要: Web サイトやアプリケーションを開発する場合、ページ上にデータの一部を表示し、ページめくり機能を提供するために、データベース内のデータに対してページングクエリを実行する必要があることがよくあります。。この記事では、thinkorm フレームワークを使用してページングクエリ機能を簡単に実装する方法を紹介し、関連するコード例を示します。ステップ 1: thinkorm をインストールするまず、プロジェクトに thinkorm フレームワークをインストールする必要があります。次のコマンドを使用してインストールできます。

MySql ページングクエリ: 大規模なデータベースにおけるページングのパフォーマンスの問題に対処する方法 Jun 15, 2023 pm 03:28 PM

最新のアプリケーションでは、ほとんどのデータをページに表示する必要があります。アプリケーションが大量のデータを処理する必要がある場合、サーバーとデータベースに負荷がかかり、クエリに時間がかかるようになります。 Mysql は現在最も人気のあるリレーショナルデータベースの 1 つであり、この記事では Mysql ページングクエリのパフォーマンスを最適化する方法について説明します。ページングの原理最適化を始める前に、まずページングの原理を理解する必要があります。ページングクエリの主な原理は、テーブルデータを複数のページに分割し、データを 1 つずつクエリすることです。たとえば、必要な場合は、

See all articles

数百億のデータがテーブルに分割された後のページング クエリを理解する

mysql ビデオ チュートリアル 列では、数百億のデータのページング クエリを紹介します。

一意の主キー

長々と話してようやく本題に到達したのですが、テーブル分割後のクエリとページングクエリの問題をどうやって解決するのでしょうか？

もう一方のサイド クエリ

概要

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック

数百億のデータがテーブルに分割された後のページングクエリを理解する

mysql ビデオチュートリアル列では、数百億のデータのページングクエリを紹介します。

もう一方のサイドクエリ