Les données de séries chronologiques sont omniprésentes dans de nombreux secteurs, mais si les prévisions de séries chronologiques reçoivent une attention considérable, la classification des séries chronologiques est souvent négligée. Cet article fournit une introduction complète à la classification des séries chronologiques, explorant ses applications réelles, passant en revue diverses méthodes et démontrant certaines de ces techniques dans un projet de classification basé sur Python. Commençons !
Comprendre la classification des séries chronologiques
La classification des séries temporelles est une technique d'apprentissage automatique supervisé dans laquelle une ou plusieurs caractéristiques, mesurées au fil du temps, sont utilisées pour attribuer une catégorie. L'objectif est d'étiqueter les séries chronologiques plutôt que de prédire les valeurs futures.
Applications réelles de la classification des séries chronologiques
La classification des séries chronologiques est largement utilisée, en particulier avec les données de capteurs. Les applications clés incluent :
Ces diverses applications soulignent l'importance de la classification des séries chronologiques dans divers domaines.
Aperçu des modèles de classification des séries chronologiques
De nombreuses approches existent pour la classification des séries chronologiques. Cette section propose un bref aperçu de chacun, avec des explications plus détaillées disponibles dans ce guide dédié [lien vers le guide, si disponible].
1. Modèles basés sur la distance : Ces modèles utilisent des mesures de distance (par exemple, la distance euclidienne) pour classer les échantillons. Dynamic Time Warping (DTW) offre une approche plus robuste, s'adaptant à des séries de longueurs variables et gérant des modèles légèrement déphasés. Les exemples incluent les K-voisins les plus proches (KNN) et ShapeDTW.
2. Modèles basés sur un dictionnaire : Ces modèles codent des modèles de séries à l'aide de symboles et exploitent la fréquence des symboles pour la classification. Les exemples incluent BOSS, WEASEL, TDE et MUSE.
3. Méthodes d'ensemble : Ce ne sont pas des modèles eux-mêmes mais plutôt des cadres combinant plusieurs estimateurs de base pour une prédiction améliorée. Un avantage clé réside dans leur capacité à gérer des données multivariées à l’aide de modèles univariés (par exemple, l’ensachage). Les exemples incluent l'ensachage, l'ensemble pondéré et la forêt de séries chronologiques.
4. Méthodes basées sur les fonctionnalités : Ces méthodes extraient des fonctionnalités de séries chronologiques (par exemple, statistiques récapitulatives, Catch22, profil matriciel, TSFresh) qui sont ensuite utilisées pour former un classificateur.
5. Modèles basés sur des intervalles : Ceux-ci extraient plusieurs intervalles de séries chronologiques, calculent les caractéristiques à l'aide des méthodes mentionnées ci-dessus, puis entraînent un classificateur. Les exemples incluent RISE, CIF et DrCIF.
6. Modèles basés sur le noyau : Ces modèles utilisent des fonctions de noyau pour mapper les séries chronologiques à un espace de dimension supérieure afin de faciliter la classification. Les exemples incluent Support Vector Classifier (SVC), Rocket et Arsenal (un ensemble de Rocket).
7. Classificateur Shapelet : Ce classificateur identifie et utilise des shapelets (sous-séquences discriminantes) pour une classification basée sur des comparaisons de distance.
8. Méta classificateurs : Ceux-ci combinent diverses méthodes pour des performances de classification robustes. HIVE-COTE, combinant TDE, Shapelet, DrCIF et Arsenal, en est un exemple, même si cela coûte cher en termes de calcul.
Le choix de la méthode dépend de facteurs tels que les caractéristiques des données, les ressources informatiques et la précision souhaitée.
Projet pratique de classification de séries chronologiques (Python)
Cette section applique certaines des techniques susmentionnées à l'ensemble de données BasicMotions [lien vers l'ensemble de données], comprenant des données d'accéléromètre et de gyroscope d'individus effectuant diverses activités (debout, marche, course, badminton).
Configuration :
<code class="language-python">import pandas as pd import numpy as np import matplotlib.pyplot as plt from sktime.datasets import load_basic_motions from sklearn.model_selection import GridSearchCV, KFold</code>
Chargement des données :
<code class="language-python">X_train, y_train = load_basic_motions(split='train', return_type='numpy3D') X_test, y_test = load_basic_motions(split='test', return_type='numpy3D')</code>
Visualisation des données (exemple comparant la marche et le badminton) :
<code class="language-python"># ... (Visualization code as provided in the original article) ...</code>
Classification KNN :
<code class="language-python"># ... (KNN code as provided in the original article) ...</code>
Ensachage avec WEASEL :
<code class="language-python"># ... (Bagging with WEASEL code as provided in the original article) ...</code>
Évaluation :
<code class="language-python"># ... (Evaluation code as provided in the original article) ...</code>
Conclusion
Cet article fournit une introduction à la classification des séries chronologiques, couvrant ses applications et ses diverses méthodes. Le projet pratique a démontré l'application du KNN et de l'ensachage avec WEASEL. Une exploration plus approfondie de ce domaine est encouragée.
Prochaines étapes
Pour continuer à apprendre, pensez à explorer les ressources mentionnées dans l'article original, notamment un guide sur les méthodes de classification des séries temporelles et un cours sur le sujet.
Références
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!