MySQL Multidimensional Data Warehouse Guide ist ein praktisches Buch. Sie werden die MySQL-Datenbank verwenden, aber in diesem Buch geht es nicht um MySQL. Dieses Buch behandelt keine Probleme mit der Hardwarearchitektur. Dieses Buch befasst sich hauptsächlich mit der Design- und Entwicklungstechnologie von Data Warehouse. Willkommen beim mehrdimensionalen MySQL-Data-Warehouse-Leitfaden.
Empfohlene Kurse: MySQL-Tutorial
Data Warehouse kann Informationen durch die Integration verschiedener Datenquellen vereinheitlichen, einschließlich aktueller Geschäftsabläufe und Managementinformationen Systeme sowie verschiedene externe Informationsquellen. Diese Quelldaten werden integriert, bereinigt, transformiert, und wenn Daten direkt aus diesen Datenquellen gelesen werden müssen, werden die Daten betriebsfreundlicher in einem Data Warehouse gespeichert.
Die Art und Weise, wie Daten in einem Data Warehouse strukturiert sind, ermöglicht Ihnen die Speicherung aktueller und historischer Daten. Aktuelle Daten sind für tatsächliche Transaktionsaktivitäten erforderlich und liegen in der Regel in regelmäßigen Abständen in Papierform (z. B. einem gedruckten Bericht) oder einem Online-Bericht vor. Historische Daten, die oft nicht so einfach zu verwenden sind, können Geschäftsinformationen liefern, die auf punktuellen Analysen wie Tracking, Inferenzanalyse und Vergleich basieren, die alle für langfristige Planung und strategische Marktentscheidungen wichtig sind.
Wie man Informationen aus mehreren Informationsquellen integriert, regelmäßig Speicher ansammelt, effektive Nachfragedesign- und Entwicklungstechnologien verwendet, die sich alle stark von der Technologie unterscheiden, die in Transaktionsmanagement-Informationssystemen verwendet wird. In diesem Buch geht es um das Design und die Entwicklungstechniken für Data Warehouses. Es behandelt die meisten technischen Probleme beim Aufbau eines Data Warehouses. Noch wichtiger ist, dass dieses Buch eine leicht verständliche Anleitung für die Entwicklung eines praktischen Data Warehouse bietet.
Anwendungsbereich dieses Buches
MySQL Multidimensional Data Warehouse Guide ist ein praktisches Buch. Sie werden die MySQL-Datenbank verwenden, aber in diesem Buch geht es nicht um MySQL. Dieses Buch behandelt keine Probleme mit der Hardwarearchitektur.
Dieses Buch befasst sich hauptsächlich mit der Design- und Entwicklungstechnologie von Data Warehouse. Dabei geht es nicht um das Management von Entwicklungsprojekten, die Theorie und damit verbundene technische Fragen, wie etwa die Leitung der Entwicklung.
Dieses Buch zeigt anhand eines Beispiels der Data-Warehouse-Entwicklung, wie die Technologie angewendet wird. Stellen Sie Datenmodelle und SQL-Skripte bereit, die für die tatsächliche Data Warehouse-Entwicklung geeignet sind. Diese Skripte wurden auf der Windows XP Professional SP2-Plattform mit MySQL-Version 5.0.21 getestet.
Darüber hinaus werden in diesem Buch nicht mehr insbesondere die folgenden Themen behandelt:
Das Konzept des Data Warehouse
SQL
MySQL-Datenbank
Für Leute, die dieses Buch lesen:
Data Warehouses werden in einer Vielzahl von Organisationen und Unternehmen verwendet, von Regierungsbehörden, gemeinnützigen Organisationen bis hin zu Schulen, von der Fertigung bis zu Einzelhandelsgeschäften, von Finanzinstituten bis hin zu Gesundheitseinrichtungen. vom Traditionsunternehmen bis zum Internethändler.
Dieses Buch richtet sich in erster Linie an Data Warehouse-Entwickler. Aber auch IT-Manager und andere IT-Experten, insbesondere diejenigen, die sich für MIS (Business Reporting) und DSS (Entscheidungsunterstützungsanwendungen) interessieren, werden dieses Buch gleichermaßen nützlich finden. Im Allgemeinen richtet sich dieses Buch an diejenigen, die an der Aufbereitung von Daten für analytische Anwendungen beteiligt sind, und an diejenigen, die Informationen wie gedruckte Berichte und Online-Berichte übermitteln müssen.
Dieses Buch ist auch für Data-Warehouse-Einsteiger geeignet. Es wird denjenigen schnell und direkt helfen, die sich auf die Entwicklung ihres ersten Data Warehouse vorbereiten.
Lehrer und Schüler können dieses Buch als Lehrbuch verwenden, um ihr Verständnis der Prinzipien und Konzepte von Data Warehouses zu verdeutlichen. Die meisten Kapitel können für Laborübungen angepasst werden.
Vorbereitete Fähigkeiten
Dieses Buch ist nicht für IT-Neulinge gedacht. Um dieses Buch effektiver nutzen zu können, müssen die Leser über Erfahrung in der Systementwicklung verfügen. Vorkenntnisse im Aufbau eines Data Warehouses sind jedoch nicht erforderlich.
Wer die Beispiele in diesem Buch üben muss, muss über praktische Kenntnisse in RDBMS (relationales Datenbankverwaltungssystem) und SQL verfügen.
Was Sie von diesem Buch bekommen können
Sie werden in der Lage sein, Ihre Daten anhand eines Beispiels zu verfeinern, eines Data Warehouse, das ursprünglich Geschäftsverkaufsdaten speicherte, und das Lagerwissen praktisch anzuwenden Fähigkeiten. Bei diesem Beispiel handelt es sich um eine abgespeckte Version eines tatsächlichen Data Warehouse, dessen Prototypen in vielen Geschäftsarten zu finden sind.
Sie werden die in diesem Buch vorgestellten Techniken verwenden, um das vertriebsbezogene Data Warehouse in diesem Beispiel Schritt für Schritt auf Basis der MySQL-Datenbank zu entwickeln. Bei diesen Techniken handelt es sich um Zerlegungstechniken für Probleme, die bei der allgemeinen Entwicklung von Data Warehouses auftreten. Wenn Sie diesen Artikel ausfüllen und alle Übungen absolvieren, sammeln Sie relevante Berufserfahrung und sind darauf vorbereitet, Ihr erstes reales Data-Warehouse-Projekt zu übernehmen.
Kapitelübersicht
Dieses Buch enthält 25 Kapitel und einen Anhang. Alle Kapitel sind in vier Teile gegliedert. Der erste Teil behandelt die Grundlagen des Data Warehousing. Der zweite Teil beschreibt die Migration von Rohdaten zum Data Warehouse. In Teil 3 wird erläutert, wie die Entwicklung von Data Warehouses gesteuert werden kann. Der vierte Teil umfasst einige fortgeschrittene mehrdimensionale Techniken. Die folgenden Abschnitte geben eine Vorschau auf jedes Kapitel.
Teil 1 Grundprinzipien
Teil 1 behandelt die Grundprinzipien des mehrdimensionalen Data Warehouse und besteht aus vier Kapiteln.
Kapitel 1, „Grundkomponenten“, stellt das Sternschema vor (ein Datenbankschema mit einer Faktentabelle, die von mehreren Dimensionstabellen umgeben ist) und erläutert die Grundkomponenten des Schemas.
Kapitel 2, „Dimensionsverlauf“, stellt die Verwendung von Proxy-Schlüsseln vor, um historische Aufzeichnungen von Dimensionselementen zu verwalten.
Kapitel 3, „Maßadditivität“, behandelt eines der wichtigsten Merkmale dimensionaler Data Warehouses, nämlich die Additivität von Kennzahlen, die in Data Warehouse-Faktentabellen gespeichert sind.
Kapitel 4, „Dimensionsabfrage“, stellt eine SQL-Abfrage vor, die am besten für Sternschemata geeignet ist. Mit der Dimensionsabfrage kann nachgewiesen werden, ob ein dimensionales Data Warehouse über die beiden grundlegendsten Designindikatoren verfügt: einfach und effizient.
Teil 2: Extraktion, Transformation und Laden
Alle 5 Kapitel dieses Artikels befassen sich mit Datenintegration, Faktentabellen und Dimensionstabellen.
Kapitel 5, „Quellendatenextraktion“, stellt die Extraktion verschiedener Datentypen vor.
Kapitel 6 „Importieren von Zeitdimensionen“ behandelt die drei gängigsten Techniken zum Laden von Zeitdimensionen.
Kapitel 7, „Erstimport“ und Kapitel 8, „Periodischer Import“ umfassen zwei Arten von Importtechniken, anfängliche und periodische.
Kapitel 9, „Periodischer Importplan“, bietet als Zusammenfassung des zweiten Artikels eine erweiterte Anleitung zur Verwendung des Windows Task-Managers zur Implementierung eines regelmäßigen Importplans.
Teil 3: Wachstum
Teil 3 stellt verschiedene Verarbeitungstechnologien vor, die sich hauptsächlich mit verwandten Problemen befassen, die im Wachstumsprozess eines erfolgreichen mehrdimensionalen Data Warehouse auftreten. Dieser Teil besteht aus zehn Kapiteln.
Kapitel 10, „Hinzufügen eines Felds“, erläutert die technischen Probleme beim Hinzufügen eines Felds zu einer Tabelle in einem vorhandenen Data Warehouse.
Kapitel 11, „On-Demand-Laden“ befasst sich mit der On-Demand-Ladetechnologie.
Kapitel 12, „Dimensionstabellen-Teilmenge“, stellt verwandte Technologien vor, um Benutzern bei der Bewältigung von Problemen mit Dimensionstabellen-Teilmengen zu helfen.
Kapitel 13, „Dimensionsrollenspiel“, über die mehrfache Verwendung derselben Dimension in einer Faktentabelle.
Kapitel 14, „Snapshot“ ermöglicht Ihnen die Bereitstellung schneller Leistungsabfragen, wenn Sie Daten zusammenfassen müssen.
Kapitel 15, „Nur Dimensionshierarchie“ und Kapitel 16, „Mehrere Pfade und unregelmäßige Dimensionshierarchien“ befassen sich mit einfachen und mehrpfadigen Dimensionstechniken, die dementsprechend Menschen bei der Aggregation und Drill-Analyse helfen.
Kapitel 17, „Dimensionalitätsreduktion“, zeigt, wie Techniken zur Dimensionsreduktion verwendet werden, um die Komplexität eines Data Warehouse-Schemas zu reduzieren.
Kapitel 18, „Garbage-Dimension“, befasst sich mit der Technologie der Garbage-Dimension, d. h. Daten, die scheinbar irrelevant sind, aber häufig von Benutzern analysiert werden müssen, werden auf dimensionale Weise organisiert.
Kapitel 19, „Mehrere Sternschemata“ zeigt, wie man dem Schema mehrere Sternschemata hinzufügt.
Teil 4: Fortschrittliche Technologie
Enthält sechs Kapitel.
Kapitel 20, „Unvollständige Datenquellen“, stellt den Umgang mit Datenquellen in Data Warehouses vor, deren Strukturen nicht direkt auf Zieltabellen abgebildet werden können.
Kapitel 21, „Faktentabelle ohne Fakten“, hilft Ihnen bei der Erstellung von Hilfsdaten zur Analyse für Kunden, einer Faktentabelle ohne Faktenfelder. Diese Daten können nicht direkt aus der Datenquelle gemessen werden.
Kapitel 22, „Late Facts“, enthält eine Technik zum Umgang mit Situationen, in denen ein bestimmter Fakt in der Datenquelle nicht vor der geplanten Ladezeit generiert wird.
Kapitel 23, „Externe Datenquellen und Dimensionszusammenführung“, enthält zwei Themen: Techniken zur Verarbeitung externer Datenquellen und wie man verstreute Attribute in mehreren Dimensionen zu einer Dimension zusammenführt.
Kapitel 24, „Kumulative Maße“, erörtert zwei verwandte Themen: die Nichtadditivität rechnerischer Maße und kumulativer Maße.
Kapitel 25, „Segmentierte Dimension“, beschreibt eine Technik, die Benutzern helfen kann, Datenanalysen für Attribute mit kontinuierlichen Werten durchzuführen.
Anhang
Anhang a, „Formatdatei-Datenquelle“, stellt vor, wie die Formatdatei-Datenquelle in den Beispielen in diesem Buch verwendet wird.
Die Verwendung von MySQL, der beliebtesten Open-Source-Datenbanksoftware, für Data-Warehouse-Anwendungen. Vor diesem Buch wurde die Erstellung eines mehrdimensionalen Data-Warehouse noch nie vorgestellt. Zu den Themen gehören Star-Schema-Modellierung, Datenladen (Datenextraktion, -transformation und -laden: etl), Testvalidierung und mehrdimensionale Abfragen. Dieses Buch verwendet von Anfang bis Ende ein praktisches, relativ rationalisiertes reales Projekt. Sein umfassendes, zugängliches Schreibformat stellt Programmierern, die Data Warehouses erstellen müssen, relevante Beispiele und Informationen zur Verfügung.
Über den Autor
Djoni Darmawikarta arbeitete einst für IBM und ist heute technischer Experte im Data Warehouse- und Business Intelligence-Team einer kanadischen Versicherungsgesellschaft. Lebt derzeit in Toronto, Ontario
Das obige ist der detaillierte Inhalt vonWas ist der mehrdimensionale MySQL-Data-Warehouse-Leitfaden?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!