Maison > développement back-end > Tutoriel Python > Comment remplir efficacement les valeurs manquantes dans une colonne en utilisant les valeurs correspondantes d'une autre colonne dans pandas ?

Comment remplir efficacement les valeurs manquantes dans une colonne en utilisant les valeurs correspondantes d'une autre colonne dans pandas ?

DDD
Libérer: 2024-11-13 05:29:02
original
200 Les gens l'ont consulté

How to efficiently fill missing values in one column using corresponding values from another column in pandas?

Utiliser efficacement fillna() pour remplir les valeurs manquantes avec les valeurs correspondantes d'une autre colonne

Lorsque vous travaillez avec des données tabulaires, les valeurs manquantes sont un phénomène courant qui peut gêner l'analyse. La méthode pandas fillna() fournit une solution simple et efficace pour remplacer ces valeurs nulles par les valeurs souhaitées. Cependant, attribuer directement des valeurs spécifiques aux cellules manquantes via fillna() peut s'avérer inefficace et prendre beaucoup de temps, en particulier pour les grands ensembles de données.

Pour surmonter cette limitation, pandas propose une fonctionnalité puissante qui vous permet de remplir les valeurs manquantes avec éléments correspondants d’une autre colonne. Cette approche élimine le besoin d'itération manuelle sur chaque ligne, améliorant considérablement les performances et la maintenabilité.

Considérez l'exemple suivant dans lequel vous souhaitez remplir les valeurs manquantes dans la colonne « Cat1 » à l'aide des valeurs de la colonne « Cat2 ».

Avant :

Day Cat1 Cat2
1 cat mouse
2 dog elephant
3 cat giraf
4 NaN ant

Après :

Day Cat1 Cat2
1 cat mouse
2 dog elephant
3 cat giraf
4 ant ant

Avec la méthode fillna(), vous pouvez accomplir cette tâche en toute simplicité :

df['Cat1'].fillna(df['Cat2'])
Copier après la connexion

Ce code remplacera sans effort les valeurs manquantes dans « Cat1 » par les valeurs correspondantes de « Cat2 », préservant ainsi la structure des données et empêchant l'introduction de valeurs incorrectes ou incohérentes. Le DataFrame résultant contiendra des données complètes et cohérentes, prêtes pour une analyse ou un traitement ultérieur.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal