Dieser Blogbeitrag führt Sie durch den Aufbau einer Wetterdatenanalyse-Pipeline mithilfe der OpenWeatherMap-API und AWS-Services. Die Pipeline ruft Wetterdaten ab, speichert sie in S3, katalogisiert sie mit AWS Glue und ermöglicht Abfragen mit Amazon Athena.
Projektübersicht
Dieses Projekt erstellt eine skalierbare Datenpipeline zum Abrufen von Wetterdaten aus mehreren Städten, zum Speichern in AWS S3, zum Katalogisieren über AWS Glue und zum Ermöglichen von Abfragen mit Amazon Athena.
Erste Architektur und Architekturdiagramme
Projektstruktur und Voraussetzungen
Bevor Sie beginnen, stellen Sie sicher, dass Sie Folgendes haben:
Einrichtungsanleitung
Das Repository klonen:
<code class="language-bash">git clone https://github.com/Rene-Mayhrem/weather-insights.git cd weather-data-analytics</code>
Erstellen Sie eine .env
-Datei: Erstellen Sie eine .env
-Datei im Stammverzeichnis mit Ihren AWS-Anmeldeinformationen und Ihrem API-Schlüssel:
<code>AWS_ACCESS_KEY_ID=<your-access-key-id> AWS_SECRET_ACCESS_KEY=<your-secret-access-key> AWS_REGION=us-east-1 S3_BUCKET_NAME=<your-s3-bucket-name> OPENWEATHER_API_KEY=<your-openweather-api-key></code>
Erstellen Sie cities.json
: Erstellen Sie eine cities.json
Auflistung der Städte:
<code class="language-json">{ "cities": [ "London", "New York", "Tokyo", "Paris", "Berlin" ] }</code>
Docker Compose: Erstellen und ausführen:
<code class="language-bash">docker compose run terraform init docker compose run python</code>
Nutzung
Infrastruktur überprüfen:Überprüfen Sie, ob Terraform die AWS-Ressourcen (S3, Glue-Datenbank, Glue-Crawler) in der AWS-Konsole erstellt hat.
Daten-Upload überprüfen:Bestätigen Sie, dass das Python-Skript Wetterdaten (JSON-Dateien) über die AWS-Konsole in Ihren S3-Bucket hochgeladen hat.
Glue-Crawler ausführen: Der Glue-Crawler sollte automatisch ausgeführt werden; Überprüfen Sie die Ausführung und Datenkatalogisierung in der Glue-Konsole.
Abfrage mit Athena:Verwenden Sie die AWS-Managementkonsole, um auf Athena zuzugreifen und SQL-Abfragen für die katalogisierten Daten auszuführen.
Schlüsselkomponenten
Fazit
Dieser Leitfaden hilft Ihnen beim Aufbau einer skalierbaren Wetterdatenanalyse-Pipeline mit AWS und OpenWeatherMap. Die Pipeline kann problemlos um weitere Städte oder Datenquellen erweitert werden.
Das obige ist der detaillierte Inhalt vonAufbau einer Wetterdatenanalyse-Pipeline mit AWS und OpenWeatherMap API. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!