Zeitreihendaten sind in zahlreichen Branchen allgegenwärtig, doch während Zeitreihenprognosen große Aufmerksamkeit erhalten, wird die Zeitreihenklassifizierung oft übersehen. Dieser Artikel bietet eine umfassende Einführung in die Zeitreihenklassifizierung, untersucht ihre realen Anwendungen, überprüft verschiedene Methoden und demonstriert einige dieser Techniken in einem Python-basierten Klassifizierungsprojekt. Fangen wir an!
Zeitreihenklassifizierung verstehen
Die Zeitreihenklassifizierung ist eine überwachte maschinelle Lerntechnik, bei der ein oder mehrere über die Zeit gemessene Merkmale verwendet werden, um eine Kategorie zuzuweisen. Das Ziel besteht darin, die Zeitreihe zu kennzeichnen, anstatt zukünftige Werte vorherzusagen.
Reale Anwendungen der Zeitreihenklassifizierung
Die Klassifizierung von Zeitreihen findet häufig Anwendung, insbesondere bei Sensordaten. Zu den wichtigsten Anwendungen gehören:
Diese vielfältigen Anwendungen unterstreichen die Bedeutung der Zeitreihenklassifizierung in verschiedenen Bereichen.
Übersicht über Zeitreihenklassifizierungsmodelle
Es gibt zahlreiche Ansätze zur Zeitreihenklassifizierung. Dieser Abschnitt bietet einen kurzen Überblick über die einzelnen Themen. Ausführlichere Erklärungen finden Sie in diesem speziellen Leitfaden [Link zum Leitfaden, falls verfügbar].
1. Distanzbasierte Modelle: Diese Modelle nutzen Distanzmetriken (z. B. die euklidische Distanz), um Proben zu klassifizieren. Dynamic Time Warping (DTW) bietet einen robusteren Ansatz, der Serien unterschiedlicher Länge berücksichtigt und leicht phasenverschobene Muster verarbeitet. Beispiele hierfür sind K-Nearest Neighbors (KNN) und ShapeDTW.
2. Wörterbuchbasierte Modelle: Diese Modelle kodieren Serienmuster mithilfe von Symbolen und nutzen die Symbolhäufigkeit zur Klassifizierung. Beispiele hierfür sind BOSS, WEASEL, TDE und MUSE.
3. Ensemble-Methoden: Hierbei handelt es sich nicht um Modelle selbst, sondern um Frameworks, die mehrere Basisschätzer für eine verbesserte Vorhersage kombinieren. Ein wesentlicher Vorteil ist ihre Fähigkeit, multivariate Daten mithilfe univariater Modelle (z. B. Bagging) zu verarbeiten. Beispiele hierfür sind Bagging, Weighted Ensemble und Time Series Forest.
4. Merkmalsbasierte Methoden: Diese Methoden extrahieren Merkmale aus Zeitreihen (z. B. zusammenfassende Statistiken, Catch22, Matrixprofil, TSFresh), die dann zum Trainieren eines Klassifikators verwendet werden.
5. Intervallbasierte Modelle: Diese extrahieren mehrere Intervalle aus Zeitreihen, berechnen Features mit den oben genannten Methoden und trainieren dann einen Klassifikator. Beispiele hierfür sind RISE, CIF und DrCIF.
6. Kernelbasierte Modelle: Diese Modelle verwenden Kernelfunktionen, um Zeitreihen zur einfacheren Klassifizierung einem höherdimensionalen Raum zuzuordnen. Beispiele hierfür sind Support Vector Classifier (SVC), Rocket und Arsenal (ein Ensemble von Rocket).
7. Shapelet-Klassifikator: Dieser Klassifikator identifiziert und verwendet Shapelets (unterscheidende Teilsequenzen) für die Klassifizierung basierend auf Distanzvergleichen.
8. Meta-Klassifikatoren: Diese kombinieren verschiedene Methoden für eine robuste Klassifizierungsleistung. HIVE-COTE, das TDE, Shapelet, DrCIF und Arsenal kombiniert, ist ein Beispiel, obwohl es rechenintensiv ist.
Die Wahl der Methode hängt von Faktoren wie Dateneigenschaften, Rechenressourcen und gewünschter Genauigkeit ab.
Praktisches Zeitreihenklassifizierungsprojekt (Python)
In diesem Abschnitt werden einige der oben genannten Techniken auf den BasicMotions-Datensatz [Link zum Datensatz] angewendet, der Beschleunigungsmesser- und Gyroskopdaten von Personen umfasst, die verschiedene Aktivitäten ausführen (Stehen, Gehen, Laufen, Badminton).
Einrichtung:
<code class="language-python">import pandas as pd import numpy as np import matplotlib.pyplot as plt from sktime.datasets import load_basic_motions from sklearn.model_selection import GridSearchCV, KFold</code>
Datenladen:
<code class="language-python">X_train, y_train = load_basic_motions(split='train', return_type='numpy3D') X_test, y_test = load_basic_motions(split='test', return_type='numpy3D')</code>
Datenvisualisierung (Beispiel für den Vergleich von Gehen und Badminton):
<code class="language-python"># ... (Visualization code as provided in the original article) ...</code>
KNN-Klassifizierung:
<code class="language-python"># ... (KNN code as provided in the original article) ...</code>
Abpacken mit WEASEL:
<code class="language-python"># ... (Bagging with WEASEL code as provided in the original article) ...</code>
Bewertung:
<code class="language-python"># ... (Evaluation code as provided in the original article) ...</code>
Fazit
Dieser Artikel bietet eine Einführung in die Zeitreihenklassifizierung und behandelt deren Anwendungen und verschiedene Methoden. Das Praxisprojekt demonstrierte die Anwendung von KNN und das Absacken mit WEASEL. Die weitere Erforschung dieses Bereichs wird gefördert.
Nächste Schritte
Um weiter zu lernen, sollten Sie die im Originalartikel erwähnten Ressourcen erkunden, einschließlich eines Leitfadens zu Zeitreihenklassifizierungsmethoden und eines Kurses zu diesem Thema.
Referenzen
Das obige ist der detaillierte Inhalt vonDie vollständige Einführung in die Zeitreihenklassifizierung in Python. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!