Introduction
Bonjour, aujourd'hui, nous allons démystifier l'ingénierie des fonctionnalités. Cela semble être un sujet difficile à aborder, mais j'espère qu'à la fin de cet article, vous en comprendrez au moins les bases.
De Wikipédia, l'Feature Engineering est une méthode d'apprentissage automatique qui utilise des données pour créer de nouvelles variables qui ne sont pas incluses dans l'ensemble d'entraînement.
Il peut générer de nouvelles fonctionnalités pour l’apprentissage supervisé et non supervisé.
Rend les transformations de données plus faciles et plus rapides tout en améliorant la précision du modèle.
Techniques d'ingénierie des fonctionnalités
-
Data Cleaning : il s'agit de ranger vos données. Vous corrigez les informations manquantes, corrigez les erreurs et supprimez toute incohérence.
-
Transformation des données : il s'agit d'un remodelage ou d'un ajustement des données. Exemple : réduire de grands nombres ou normaliser les données afin qu'elles correspondent à une certaine plage.
Le facteur important est d'effectuer ces modifications sans altérer la signification des données.
-
Extraction de fonctionnalités : c'est ici que nous explorons les données existantes et créons de nouvelles fonctionnalités qui peuvent offrir de nouvelles informations. Cela rend le modèle plus simple et plus rapide sans perdre de détails utiles.
-
Sélection des fonctionnalités : consiste à sélectionner les éléments de données les plus étroitement liés à votre prédiction cible. Cela élimine les informations inutiles, rendant le modèle plus ciblé.
-
Itération des fonctionnalités : tout est question d'essais et d'erreurs. Le processus d'ajout ou de suppression de certaines fonctionnalités, de tester leur impact sur le modèle et de conserver celles qui améliorent les performances du modèle.
Types de fonctionnalités dans l'apprentissage automatique
-
Caractéristiques numériques : Ce sont des nombres qui peuvent être mesurés, qui sont de nature simple et continue. Exemple : l'âge.
-
Caractéristiques catégorielles : celles-ci sont catégoriques. Exemple, la couleur des yeux.
-
Fonctionnalités des séries chronologiques : données enregistrées au fil du temps. Exemple; Actions.
-
Fonctionnalités de texte : ce sont des fonctionnalités constituées de mots ou de texte. Exemple : Avis clients
Conclusion
J'espère avoir bien expliqué les termes, je pense que ce sont les quelques choses que vous devez savoir en théorie en tant que débutant. La prochaine fois que nous discuterons de l'ingénierie des fonctionnalités, ce sera dans des termes plus pratiques.
À la prochaine fois !
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!