この記事は最初に InfoQ 中国語ステーション に掲載されました。 著者: Ming Ling (dragon)、Fenng。 注: 転載したい友人は、この記事の最初の著者に注意してください。
この記事は、ドラゴンの友人がディスカッションのためにメールを送った後に書いたものです。 DB またはアプリケーションでの並べ替えは非常に興味深いトピックであり、Dragon 氏は最初のメールでそれを非常にうまくまとめており、いくつかの提案を追加しました。さあ、それをアップしてみんなと共有しましょう。この記事は InfoQ 中国語ステーション にも投稿されました。
Q: PHP でソートを実行する方が MYSQL でソートするよりも優れている理由を挙げてください。 MYSQL でソートを行う必要がある例をいくつか挙げてください。
A: 一般的に、実行効率は CPU、メモリ、ハードディスクなどの負荷条件を考慮する必要があります。MYSQL サーバーと PHP サーバーが最適な環境で構成されていると仮定します。したがって、システムのスケーラビリティ (Scalability) とユーザーが認識するパフォーマンス (User-perceived Performance) が私たちが追求する主な目標です。実際の動作では、MYSQL のデータは HASH テーブルや BTREE などのメモリに保存されることが多く、その動作速度は非常に高速です。同時に、多くのアプリケーションでは INDEX が事前にソートを実行しています。最初の選択。アプリケーション層 (PHP) での並べ替えもメモリ内で実行する必要があります。MYSQL と比較すると、次のような利点があります。
1. Web サイト全体のスケーラビリティと全体的なパフォーマンスを考慮すると、アプリケーション層 (PHP) でソートすることでデータベースの負荷が明らかに軽減され、Web サイト全体のスケーラビリティが向上します。実際、データベース内でのソートのコストは非常に高く、メモリと CPU を消費します。多くの同時ソートがある場合、DB は簡単にボトルネックに達します。
- 2. アプリケーション層 (PHP
- ) と MYSQL の間にデータ中間層があり、それが適切に活用されていれば、PHP の利点がさらに高まります。
3. PHP のメモリ内データ構造は、特定のアプリケーション向けに特別に設計されており、データベースよりも簡潔で効率的です。
- 4. PHP はデータの災害復旧の問題を考慮する必要がなく、この部分の操作損失を軽減できます。
- 5. PHP にはテーブル ロックの問題はありません。
- 6. MYSQL では並べ替え、リクエストと結果の返しもネットワーク接続を介して実行する必要がありますが、PHP では並べ替え後に直接返すことができるため、ネットワーク IO が削減されます。
-
実行速度に関しては、アプリケーションの設計に問題があり、不要なネットワーク IO が大量に発生しない限り、その差は大きくはありません。また、アプリケーション層はPHPのキャッシュ設定に注意する必要があり、これを超えると内部エラーが報告されますので、アプリケーションに応じてキャッシュを評価または調整する必要があります。具体的な選択は、特定のアプリケーションによって異なります。
PHP でソートをより適切に実行できる状況をいくつかリストします
:
1. データ ソースは MYSQL にありませんが、ハードディスク、メモリ、またはネットワークからのリクエストに存在します。
- 2. データは MYSQL に保存されており、量は多くなく、対応するインデックスがありません。この時点では、データを取り出して PHP でソートする方が高速です。
- 3. データ ソースは複数の MYSQL サーバーからのものです。現時点では、複数の MYSQL からデータを取得して PHP で並べ替える方が高速です。
- 4. MYSQL に加えて、ハードディスク、メモリ、ネットワークからのリクエストなどの他のデータ ソースも存在します。現時点では、これらのデータを MYSQL に保存して並べ替えるのは適切ではありません。 🎜>
- MYSQL でソートを実行する必要があるインスタンスをいくつかリストします:
1. このソートされたインデックスはすでに MYSQL に存在します。
2. MYSQL のデータ量は多く、結果セットにはその非常に小さなサブセットが必要です。たとえば、データが 1,000,000 行ある場合は、上位 10 行を取得します。
3. さまざまなサービスに提供できる統計集計など、1 つのソートと複数の呼び出しが必要な状況では、MYSQL でのソートが推奨されます。さらに、ディープ データ マイニングの場合、通常のアプローチでは、アプリケーション層でソートなどの複雑な操作を完了し、その結果を MYSQL に保存して、何度でも簡単に使用できるようにします。
- 4. データソースがどこから来たとしても、データ量が一定の規模に達すると、その時点で占有されているメモリ/キャッシュのため、PHP での並べ替えには適さなくなります。コピー、インポート、または MYSQL に保存する必要があり、INDEX 最適化を使用する方が PHP
- よりも優れています。ただし、そのような操作は Java または C で処理する方がよいでしょう。 [大規模なデータ セットの集約または要約に似た一部のデータでは、クライアント側での並べ替えが利益と損失を上回ります。もちろん、検索エンジンと同様のアイデアを使用して、同様のアプリケーション状況を解決することもできます。 ]
-
-
Web サイトの全体的な検討には、人員とコストを考慮する必要があります。 Web サイトのサイズや負荷が小さく、人手が限られている場合 (人員や機能が制限される可能性があります)、アプリケーション層 (PHP) でのソートには多くの開発とデバッグ作業が必要となり、時間がかかります。損失に見合ったものであれば、DB で処理する方が良いでしょう。大規模な Web サイトの場合、電気代とサーバーのコストは非常に高くなります。システム アーキテクチャを慎重に計画することで、現時点でアプリケーション層 (PHP) が可能であれば、コストを大幅に節約できます。ビジネス ニーズは、可能な限りアプリケーション層で実装される必要があります。