Überwachung und Diagnose waren schon immer zwei sehr wichtige Verbindungen beim Betrieb und der Wartung von Datenbanken. Im traditionellen Betriebs- und Wartungsmodell sind Überwachung und Diagnose auf den Menschen ausgerichtet, daher muss sich die Erfassung von Indikatoren und Daten auch auf den Menschen konzentrieren.
Überwachungsdaten müssen von Menschen eingesehen werden. Durch menschliche Betrachtung können wir Anomalien in den Überwachungsdaten oder Bereiche finden, die einer Wachsamkeit bedürfen. Datenbankadministratoren verschiedener Ebenen können anhand der Daten unterschiedliche Risikostufen erkennen. Da es von Menschen eingesehen werden muss, sollten nicht zu viele Indikatoren angezeigt werden, da sonst das Überwachungspersonal geblendet wird. Tatsächlich ist die Anzahl der Schlüsselindikatoren im obigen Bild zu groß, als dass man sie überwachen könnte.
Für eine Überwachung, die auf Menschen basiert, ist eine kurze und intuitive Anzeige der Indikatoren unbedingt erforderlich. Bei Datenbanken kann eine manuelle Überwachung besser erreicht werden, wenn man sich nur auf drei oder fünf Schlüsselindikatoren konzentriert. Einer meiner Finanzkunden achtet nur auf den aktiven Mitgliedschaftsindikator für das Kernsystem. Es gibt einen Monitor, der diesen Indikator jederzeit im Auge behält. Sobald eine Anomalie auftritt, klickt er zur Diagnoseanalyse.
Dies ist eine Seite zur Überwachung historischer Indikatordaten, die an ihre Bedürfnisse angepasst wird. Sobald die Anzahl der aktiven Sitzungen den Standard überschreitet, klicken Sie zur Diagnose. Auf dieser Seite stellen wir ein Tool zur „Problemanalyse“ zur Verfügung.
Problemanalysetools können Probleme im System (aktuelle Probleme oder historische Probleme) basierend auf Zeitfenstern analysieren, während Tools zur Analyse wartender Ereignisse Datenbankadministratoren dabei unterstützen können, die mögliche Leistung im System aus der Perspektive wartender Ereignisse zu analysieren .
Egal was passiert, der Zweck der Überwachung besteht darin, die Arbeit des DBA zu erleichtern, den Menschen zu dienen und den Menschen in den Mittelpunkt zu stellen. Einige Freunde sind möglicherweise nicht damit einverstanden und denken, dass die Überwachung auch automatisiert werden kann, beispielsweise durch Basisalarme. Tatsächlich ist der Basisalarm ähnlich. Der Basisalarm kann Ihnen beispielsweise per SMS mitteilen, dass die Anzahl der aktiven Sitzungen abnormal ist. Wenn die Basisalarmvorlage jedoch zu viele Indikatoren festlegt, wird die Verarbeitung von Alarmstürmen sehr mühsam. Ungenaue Alarme lassen die Alarmfunktion nutzlos erscheinen.
Auch bei der traditionellen Diagnose steht der Mensch im Mittelpunkt. Wenn ein Problem mit dem System auftritt, werden verschiedene Informationen im System gesucht und analysiert. Diese Analyse stützt sich stark auf die persönlichen Fähigkeiten des DBA. Wenn Benutzer ein großes Problem haben, hoffen sie immer, dass hochrangige Experten so schnell wie möglich vor Ort sind, um sich darum zu kümmern.
Mit der Entwicklung der Unternehmensdigitalisierung werden die Kosten für dieses menschenzentrierte Überwachungs- und Diagnosemodell immer höher und Experten sind immer weniger bereit, an vorderster Front zu sitzen. Daher ist die Einsparung von Arbeitskosten und die Einsparung von Zeit für Experten zu einer sehr wichtigen Anforderung beim Betrieb und der Wartung von Datenbanken geworden. Tatsächlich sind mit der Entwicklung der Hardware die Kosten für die Datenerfassung, -speicherung und -berechnung sehr niedrig geworden. Daher ist es in modernen Datenbanküberwachungssystemen nicht mehr kostenintensiv, umfassendere Überwachungsdaten zu sammeln und zu speichern.
Wenn die täglich gesammelten Daten umfangreich genug sind, werden automatisierte Diagnose und Ferndiagnose möglich. Die für die Diagnose erforderlichen Daten befinden sich bereits in der offline gesammelten Datenbank. Die meisten Diagnosetools müssen nicht mehr vorübergehend Daten aus der Datenbankinstanz sammeln. Wenn dann eine Anomalie in der Datenbank auftritt, kann das automatische Diagnosetool ohne Risiko im Hintergrund verwendet werden . Führen Sie eine automatisierte Analyse durch.
Das hier erwähnte „Kein Risiko“ bedeutet, dass die automatisierte Diagnosearbeit selbst kein Risiko für die Datenbankinstanz mit sich bringt. Wenn es notwendig ist, während der automatisierten Diagnose vorübergehend einige Daten aus der Datenbank zu sammeln, und wenn diese Sammlung selbst riskant ist, dann kann dies eine Maßnahme sein, um die Verletzung einer Datenbankinstanz, die bereits fehlerhaft ist, noch schlimmer zu machen. Wir haben einmal ein Tool zur automatischen Diagnose und Analyse der Fragmentierung gemeinsam genutzter Pools entwickelt, das zur Analyse von KGH-Daten erforderlich war. Dieses Tool hat einmal die Datenbank gestört. Daher werden wir im Hinblick auf die automatisierte Erfassung von Indikatoren und die automatisierte Diagnose unser Bestes tun, um das Auftreten solcher Risiken zu vermeiden.
Um all dies zu erreichen, sind Daten die wichtigste Grundlage für die Überwachung und Diagnoseautomatisierung. Tatsächlich enthalten der Indikatorensatz und die Datenerfassung selbst beim automatisierten Datenbankbetrieb und -wartung umfangreiches Betriebs- und Wartungswissen. Welche Indikatoren von einer bestimmten Datenbank erfasst werden sollten und wie Datenbankindikatoren ohne Risiko besser erfasst werden können, ist ein sehr wertvolles Betriebs- und Wartungswissen.
In diesem Jahr werden wir die Indikatorsätze von Oracle, Mysql, Postgresql, Dameng, Jincang und anderen Datenbanken in D-SMART öffnen. Wir hoffen auch, dass sich alle uns anschließen können, um diesen Open-Source-Indikatorsatz gemeinsam zu bereichern und zu verbessern.
Das obige ist der detaillierte Inhalt vonVon der Überwachung bis zur Diagnose: die Macht der Daten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!