Pour les valeurs manquantes, il existe essentiellement des méthodes telles que la suppression, le remplissage et la reconstruction de variables, mais comment les opérations spécifiques sont-elles effectuées ? Par exemple, lorsque vous ne connaissez pas la signification de chaque champ :
1. Comment déterminer que le champ n'a rien à voir avec le modèle et quelle proportion de valeurs manquantes peut être supprimée avant de pouvoir être supprimée ?
2. Quand la valeur manquante est-elle considérée comme un statut utile ?
3. Quand le remplissage des données est-il requis ?
Il existe encore de nombreuses méthodes.
J'ai trouvé quelques liens, ci-joints, qui devraient vous être utiles.
Certaines fonctionnalités de l'ensemble d'entraînement contiennent des valeurs manquantes. Comment les gérer
Comment déterminer si les valeurs manquantes sont manquantes de manière aléatoire ?
Veuillez me dire comment l'utiliser.