L'extraction de fonctionnalités est le processus de réduction de la dimensionnalité des données. Grâce à l'optimisation, elle réduit la quantité de données originales et améliore la convivialité des données. Le traitement de grands ensembles de données nécessite des ressources informatiques importantes, et l'extraction de caractéristiques peut réduire efficacement la quantité de données à traiter tout en décrivant avec précision l'ensemble de données d'origine.
L'extraction de caractéristiques est le processus de conversion de données brutes en caractéristiques numériques, en conservant les informations clés. Après traitement, des résultats plus précis peuvent être obtenus.
Contrairement à la sélection de fonctionnalités, qui conserve un sous-ensemble des fonctionnalités d'origine, l'extraction de fonctionnalités crée des fonctionnalités entièrement nouvelles.
L'extraction de fonctionnalités peut être effectuée manuellement ou automatiquement.
L'extraction manuelle de fonctionnalités nécessite d'identifier et de décrire les fonctionnalités pertinentes pour un problème spécifique et de mettre en œuvre des méthodes pour extraire ces fonctionnalités.
L'extraction automatique de caractéristiques implique l'utilisation d'algorithmes spécialisés ou de réseaux profonds pour extraire automatiquement des caractéristiques de signaux ou d'images sans intervention humaine.
Après des recherches, ingénieurs et scientifiques ont développé des méthodes d'extraction de caractéristiques pour les images, les signaux et le texte.
L'extraction de fonctionnalités est utile lorsque vous devez réduire la quantité de ressources nécessaires au traitement sans perdre d'informations importantes. L'extraction de fonctionnalités peut également réduire la quantité de données redondantes pour une analyse donnée, ce qui peut augmenter la vitesse des étapes d'apprentissage automatique et de généralisation.
L'extraction de fonctionnalités a également les fonctions suivantes :
1. Autoencoder
Le but de l'autoencodeur est d'apprendre un codage efficace des données dans un apprentissage non supervisé. L'extraction de fonctionnalités est utilisée pour identifier les fonctionnalités clés des données à coder en apprenant du codage de l'ensemble de données d'origine pour dériver de nouvelles fonctionnalités.
2. Sac de mots
Sac de mots est une technologie de traitement du langage naturel qui extrait les mots utilisés dans des phrases, des documents, des sites Web, etc. et les classe par fréquence d'utilisation. Cette technique peut également être appliquée au traitement d'images.
3. Traitement d'image
Les algorithmes sont utilisés pour détecter des caractéristiques telles que des formes, des bords ou des mouvements dans des images ou des vidéos numériques. Avec l’essor du deep learning, l’extraction de caractéristiques est principalement utilisée pour le traitement des données d’image.
L'extraction de caractéristiques à partir de données d'image implique de représenter les parties clés de l'image sous la forme de vecteurs de caractéristiques compacts. Dans le passé, cela était réalisé grâce à des algorithmes spécialisés de détection de fonctionnalités, d’extraction de fonctionnalités et de correspondance de fonctionnalités. De nos jours, avec l’application du deep learning dans l’analyse d’images et de vidéos, associée à l’amélioration des capacités des algorithmes, l’étape d’extraction des caractéristiques a été ignorée.
Cependant, quelle que soit la méthode utilisée, les applications de vision par ordinateur telles que l'enregistrement d'images, la détection et la classification d'objets et la récupération d'images basée sur le contenu nécessitent une représentation efficace des caractéristiques de l'image.
La formation au machine learning ou au deep learning directement à l'aide de signaux bruts produit souvent de mauvais résultats en raison des débits de données élevés et de la redondance des informations. En identifiant d'abord les caractéristiques les plus discriminantes d'un signal grâce à l'extraction de caractéristiques, ces caractéristiques peuvent être plus facilement utilisées par les algorithmes d'apprentissage automatique ou d'apprentissage profond.
Lors de l'analyse des signaux et des données des capteurs, vous pouvez appliquer des mesures d'impulsion et de transition, mesurer le rapport signal/bruit (SNR), estimer l'entropie spectrale et l'aplatissement et calculer les spectres de puissance pour l'extraction de caractéristiques.
Les transformations temps-fréquence, telles que la transformée de Fourier à court terme (STFT), peuvent être utilisées comme représentation de signal des données d'entraînement dans les modèles d'apprentissage automatique et d'apprentissage profond. Par exemple, les réseaux de neurones convolutifs (CNN) sont couramment utilisés sur les données d'image et peuvent apprendre avec succès des représentations de signaux 2D renvoyées par des transformations temps-fréquence.
D'autres conversions temps-fréquence peuvent également être utilisées, en fonction de l'application spécifique. Par exemple, la transformée à Q constant (CQT) fournit une distribution de fréquences espacées de manière logarithmique ; la transformée en ondelettes continue (CWT) est souvent efficace pour identifier les transitoires courts dans les signaux non stationnaires.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!