Comment puis-je remplir les valeurs manquantes dans une colonne avec les données d'une autre colonne dans Pandas ?

Linda Hamilton
Libérer: 2024-11-11 06:43:02
original
469 Les gens l'ont consulté

How can I Fill Missing Values in One Column with Data From Another Column in Pandas?

Utiliser la puissance de fillna() pour imputer les valeurs manquantes avec une colonne entière

Dans le domaine de la manipulation de données, il est souvent nécessaire imputer les valeurs manquantes pour garantir l’intégrité des données. Pandas, une bibliothèque polyvalente d'analyse de données, fournit la méthode fillna() pour gérer efficacement cette tâche. Cependant, étendre sa fonctionnalité pour remplir les valeurs manquantes avec une colonne entière nécessite une approche spécifique.

Les tentatives précédentes visant à remplir les valeurs manquantes dans une colonne avec les valeurs correspondantes d'une autre colonne impliquaient souvent une boucle ligne par ligne inefficace. Pour optimiser les performances et respecter les meilleures pratiques, une méthode alternative exploitant fillna() est essentielle.

Voici comment transmettre efficacement une colonne entière comme argument à fillna() :

import pandas as pd

# Create a DataFrame with missing values
df = pd.DataFrame({'Day': [1, 2, 3, 4],
                   'Cat1': ['cat', 'dog', 'cat', np.nan],
                   'Cat2': ['mouse', 'elephant', 'giraf', 'ant']})

# Fill missing values in Cat1 using values from Cat2
df['Cat1'].fillna(df['Cat2'], inplace=True)

# Display the imputed DataFrame
print(df)
Copier après la connexion

Ce code remplit avec succès la valeur manquante dans « Cat1 » sur la quatrième ligne avec « fourmi », extraite de la ligne correspondante dans « Cat2 ». Le DataFrame résultant présente des données complètes, garantissant leur validité pour une analyse ultérieure.

En tirant parti de la capacité de fillna() à accepter les arguments de colonne, vous pouvez imputer efficacement les valeurs manquantes avec les données d'une autre colonne en une seule opération. Cette approche améliore non seulement la qualité des données, mais optimise également l'efficacité des calculs, ce qui en fait un outil indispensable dans votre boîte à outils de gestion des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal