Die Datenschicht für die ETL-Verarbeitung von Daten ist: Datenladeschicht. ETL ist der Prozess des Ladens von Geschäftssystemdaten nach der Extraktion, Bereinigung und Konvertierung in das Data Warehouse. Der Zweck besteht darin, verstreute, unordentliche und nicht standardmäßige Daten im Unternehmen zu integrieren, um eine analytische Grundlage für Unternehmensentscheidungen bereitzustellen.
Die Betriebsumgebung dieses Tutorials: Windows 10-System, Dell G3-Computer.
Die Datenschicht für die ETL-Verarbeitung von Daten ist: Datenladeschicht.
ETL (Extract-Transform-Load, Data Warehouse-Technologie) ist der Prozess des Extrahierens (Extrahierens), Bereinigens und Transformierens (Transformierens) der Daten des Geschäftssystems und des anschließenden Ladens (Ladens) in das Data Warehouse besteht darin, die Daten im Unternehmen zu transformieren. Die Integration verstreuter, ungeordneter und nicht standardisierter Daten stellt eine wichtige Grundlage für die Entscheidungsfindung im Unternehmen dar. ETL ist ein wichtiges Bindeglied in BI-Projekten.
Beschreibung jeder Schicht des Data Warehouse:
1. Datenladeschicht: ETL (Extract-Transform-Load)
2. Datenoperationsschicht: ODS (Operational Data Store)
3 : DW (Data Warehouse)
Datendetailschicht: DWD (Data Warehouse Detail)
Mittlere Datenschicht: DWM (Data WareHouse Middle)
Datendienstschicht: DWS (Data WareHouse Service)
4, Datenanwendungsschicht: APP (Anwendung)
5. Dimensionsoberflächenschicht: DIM (Dimension)
Vorteile der Schichtung:
Klare Datenstruktur: Jede Datenschicht hat ihren Umfang und ihre Verantwortlichkeiten. Bei der Verwendung von Tabellen ist es einfacher zu finden und zu verstehen.
Reduzieren Sie wiederholte Entwicklungen: Standardisieren Sie die Datenschichtung und entwickeln Sie einige gemeinsame Daten der mittleren Ebene, wodurch große wiederholte Berechnungen reduziert werden können.
Einheitliches Datenkaliber: Durch die Datenschichtung werden einheitliche Daten bereitgestellt Export und einheitliches Kaliber für externe Ausgabedaten
Vereinfachung komplexer Probleme: Teilen Sie komplexe Aufgaben in mehrere Schritte auf, um sie abzuschließen, und jede Ebene verarbeitet nur einen einzigen Schritt, was relativ einfach und leicht verständlich ist. Wenn es ein Problem mit den Daten gibt, müssen Sie nicht alle Daten reparieren, sondern einfach mit der Reparatur beim problematischen Schritt beginnen.
Ausnahmen in Originaldaten schützen: Es ist nicht erforderlich, das Unternehmen einmal zu ändern, bevor erneut auf die Daten zugegriffen werden kann.
Weitere Informationen zu diesem Thema finden Sie in der Rubrik „FAQ“!
Das obige ist der detaillierte Inhalt vonWas ist die Datenschicht für die ETL-Datenverarbeitung?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!