休暇前に、PG China コミュニティと協力して、D-SMART を使用して PG データベースを運用および保守する方法についてオンライン ライブ ブロードキャストを実施しました。金融業界のクライアントの 1 人がたまたま私の紹介を聞いてくれました。チャットに電話しました。チャットしましょう。彼らはデータベース Xinchuang を選択し、いくつかの国内データベースを試しましたが、最終的に TDSQL を選択する予定です。そのとき少し驚いたのは、2020年から国内データベースを選定していたのですが、TDSQLを使った後の初期体験があまり良くなかったようです。その後のやり取りの結果、彼らは TDSQL の分散データベースを使い始めたばかりで、研究開発の要件が高すぎることがわかったので、全員が TDSQL の集中型 MYSQL インスタンスを選択したことを知りました。 。データベース クラウド全体のノード数も、当初の数十から数十に拡大しました。
偶然にも、昨日、データベース Xinchuang の選択について WeChat で別の金融顧客とチャットしましたが、最終的に彼らは TDSQL を選択しました。別の顧客と同様に、彼らも TDSQL の MYSQL 集中型データベース インスタンスを選択しました。現在、数十のデータベースを移行していますが、そのほとんどは数十 GB から数百 GB の小規模なデータベースです。彼らは、小規模なデータベースを TDSQL クラウド プラットフォームに直接移行することが非常に便利であると感じており、TDSQL のデータベース クラウド管理プラットフォームと運用保守ツールは、基本的に日常の運用保守ニーズを満たすことができます。
コミュニケーションを通じて、2 人のお客様が TDSQL を選んだのは、TDSQL がデータベースとして優れているからではないと感じました (TDSQL は実際にはデータベースではなく、データベース クラウド プラットフォーム ソリューションです。TDSQL の将来の可用性については、次のとおり書きます)詳細な紹介) を参照してください) が、そのデータベース クラウド管理プラットフォームは、多数の小規模なデータベース インスタンスの管理に非常に優れており、ユーザーはデータベース テクノロジーからではなく、使いやすさから選択しており、信頼性を考慮して考慮されています。
顧客がTDSQLを選ぶ理由から、PGデータベースの運用保守について見ていきましょう。一般的に PG データベースの運用と保守について話すことは、非常に大きなトピックです。なぜなら、顧客ごとに独自の特殊なアプリケーション シナリオがあり、PG データベースの運用と保守の管理方法も大きく異なるためです。さらに複雑なのは、TDSQL を選択した前述の 2 人の顧客とは異なり、PG Database には小規模なデータベースと非常に大規模なデータベース システムの両方があることです。一部の顧客は、Xinchuang を置き換える際に Oracle データベースを 1 対 1 で置き換えますが、多くのデータベースのホット データは数 TB を超えます。規模が大きく異なり、運用および保守要件が異なるアプリケーション シナリオに直面すると、運用および保守ツールは、大きく異なるアプリケーション シナリオに適応するように慎重に設計する必要があります。
中国における PG データベースのアプリケーションは、過去 2 年間で急速に発展しました。また、多くの国内データベースも PG オープンソース プロジェクトに基づいて開発されており、アプリケーションや運用保守の点で非常に似ているため、これらは PG データベース製品として分類されます。
現在の国内データベースでは、多くの製品が研究開発の出発点として PG Community Edition コードに基づいており、一部の製品はオープン ソースの openGauss に基づいていますプロジェクト。これらのデータベースの基本的な機能は、コミュニティ バージョンの PG データベースと似ていますが、ある程度拡張されています。ただし、使用、運用、メンテナンスの点では、多くの機能はコミュニティ バージョンの PG と非常に似ています。
PG に直接関連するデータベース製品もいくつかありますが、そのほとんどは PG の分散ソリューション PGXL/PGXC または CITUS に基づいています。たとえば、Tencent の TBASE、NTU General の GBASE 8C 分散版、AsiaInfo の ANTDB、Xugu Database などです。ここでは詳しくリストしません。これらのデータベースのインスタンスも PG データベースであり、特定のインスタンスも PG データベース インスタンスとみなすことができますが、分散データベースを運用および保守する場合は、クラスター全体とネットワークの問題にさらに注意を払う必要があります。その差は依然として大きい。
要約すると、PG データベースの運用と保守の要件は、日常監視、障害警告、自動検査、パフォーマンスの最適化、障害診断の 5 つの側面に分かれています。
一部の企業ではすでに一部のコア システムを PG データベースに移行しており、これらのシステムでは毎日の監視が必要です。したがって、データベース運用保守ツールに必要な最も基本的な機能は監視機能であり、運用保守ツールを通じてデータベースインスタンス全体の稼働状況を随時把握することができます。 D-SMART は、ヘルス モデルを通じてデータベースの実行ステータスを表示します。さらに、いくつかの重要な日(会社の年末決算、国慶節などの特別な勤務など)に勤務する必要がある場合は、主要な勤務をサポートできるツールも必要です。システム。
D-SMARTでは、「監視センター」、「日常点検センター」、「アラームセンター」、「性能最適化センター」、「レポートセンター」、「キャパシティ管理センター」、「」を一元的に組み合わせた機能を提供します。 「セキュリティ センター」と「ツール センター」は、さまざまなユーザーやさまざまなアプリケーション シナリオのユーザーのニーズを満たすことができます。
D-SMARTでは、日常監視機能として「今日のかんばん」「My監視」「主要SQL監視」の3つの主要な運用・保守監視ツールを提供しています。現在のかんばんでは、ユーザーが監視するデータベースの包括的な情報を一元的に表示でき、「マイ モニタリング」を使用すると、ユーザーは従来の監視方法を使用して、主要なエスコート監視のために監視する指標を定義できます。 「Key SQL Monitoring」は、企業の基幹業務システム向けに提供される専用の監視ツールです。基幹業務システムの主要なSQLに問題が発生した場合(実行速度の低下、実行計画の変更など)、タイムリーなアラームを生成し、基幹業務の安全な運用を確保します。
小規模なデータベース インスタンスが多数ある場合、包括的な監視は現実的ではありません。十数人からなるチームが数百または数千のデータベース インスタンスを運用および保守する必要がある場合、これらのデータベースを包括的に監視する必要はなく、また不可能です。したがって、この運用および保守シナリオでは、大量の監視作業を自動タスクに変換し、監視システムによって自動的に完了できるようにする必要があります。
「データベース日常点検」は、毎日深夜にデータベースの稼働データと一部のルールを自動分析し、簡潔かつ包括的な日次点検概要レポートを作成する、非常に有効な自動運用保守ツールです。運用および保守担当者は、これらのレポートを読むことで、運用および保守している何百ものデータベース インスタンスに存在する一般的な問題について知ることができるため、特定のデータベース インスタンスに対応する変更を今日中に行う必要があるかどうかを判断できます。近い将来に。
多数の小規模なデータベース インスタンスを運用および保守する必要がある場合、早期に警告することが非常に困難になります。従来の「ベースラインアラーム」の効果は非常に役に立たなくなりました。データベース インスタンスのダウンタイムに加えて、他の早期警告を正確に行うことは困難です。大量の警報情報があれば、早期警報は無意味になります。そのため、故障モデルに基づく「運用・保守経験アラーム」が特に重要となっています。専門家の経験と過去の経験に基づいて構築された複雑なルールにより、より正確な早期警告を提供できるだけでなく、運用および保守担当者がより迅速に問題を特定し、アラームが生成された後に隠れた危険を排除することもできます。
「データベース検査」は、ほとんどの DBA が非常に役に立たないと考える機能です。主な問題は、この作業を実行する必要があることですが、本当に効果的な検査を行うには、多数の専門 DBA の参加と、繰り返しの作業が多いため、全体的に価格/パフォーマンスの比率は高くありません。一方、包括的で高品質な検査は、システムに隠れた危険性を発見し、発生前に防止するのに役立ちます。この矛盾に対して、高品質な自動検査が実現できれば、問題は簡単に解決できます。数か月前、私たちはユーザーによるリモート検査の実施を支援しました。ユーザーは、D-SMART によって収集された監視データを当社の研究所に送信しました。当社のデータベース専門家は、リモート データによって生成された検査レポートを使用して、約 30 のデータベース システムの検査を実施しました。リモート コンサルテーションを実施し、ユーザーがさまざまな種類の 200 以上の問題を発見するのを支援しましたが、この作業にかかる時間はわずか 2 人日未満でした。自動化によってデータベースの検査を効率化できれば、検査作業はそれほど無駄ではなくなります。
検査に加えて、セキュリティ監査、容量監査、SQL 監査などの一部の監査作業も非常に重要です。これらの監査は非常に専門的なスキルと多大な作業負荷を必要とするため、多数のデータベース インスタンスを前にすると、検査と同様に役に立たなくなります。 。ただし、これらのタスクが自動化ツールによって自動的に完了できれば、非常に重要な役割を果たすことができます。
実際には、これらの運用および保守の監視タスクに加えて、多数のデータベース インスタンス管理タスクと多くの自動化された操作が DBA によって非常に必要とされており、これが、前述の 2 つの顧客が選ばれた主な理由でもあります。最初は TDSQL を選択しました。多数のデータベースインスタンスを管理するにはデータベースクラウド基盤が必須ですが、これらの自動管理機能自体が非常に複雑であり、企業の特性に応じた独自のデータベースクラウド基盤を構築すること自体が大プロジェクトとなります。もちろん、エンタープライズ クラウド プラットフォームの RDS サービスがデータベース アプリケーションのニーズを満たすことができる場合は、クラウド プラットフォームの RDS を直接使用するだけで十分です。もちろん、現在の情報イノベーションの需要に直面して、企業の RDS はオープンソースの MYSQL/PG データベースをサポートするだけでなく、国内のデータベース製品もサポートする必要があります。
以上がPG データベースの運用および保守ツールはどのような機能をカバーする必要がありますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。