Lorsque vous travaillez avec des DataFrames pandas, il est courant de rencontrer des valeurs manquantes représentées par NaN (pas un nombre). La gestion de ces valeurs est cruciale pour garantir une analyse précise des données et éviter les erreurs. Cet article fournit un guide complet sur la façon de remplacer les valeurs NaN dans une colonne DataFrame.
Le DataFrame suivant contient une colonne nommée « Montant » avec des valeurs NaN :
Date Amount 67 2012-09-30 00:00:00 65211 68 2012-09-09 00:00:00 29424 69 2012-09-16 00:00:00 29877 70 2012-09-23 00:00:00 30990 71 2012-09-30 00:00:00 61303 72 2012-09-09 00:00:00 71781 73 2012-09-16 00:00:00 NaN 74 2012-09-23 00:00:00 11072 75 2012-09-30 00:00:00 113702 76 2012-09-09 00:00:00 64731 77 2012-09-16 00:00:00 NaN
La méthode la plus simple pour remplacer les valeurs NaN consiste à utiliser la méthode fillna(). Il permet de spécifier une valeur ou une fonction pour remplir les données manquantes :
df['Amount'] = df['Amount'].fillna(0)
Cela remplacera toutes les valeurs NaN dans la colonne "Montant" par 0.
Pour remplir les valeurs NaN avec des valeurs spécifiques, utilisez :
df['Amount'].fillna({NaN: 100})
Cela remplacera les valeurs NaN par 100.
Vous pouvez également remplir les valeurs NaN en fonction des valeurs d'autres colonnes :
df['Amount'].fillna(df['Amount'].mean())
Cela remplira les valeurs NaN avec le valeur moyenne de la colonne "Montant".
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!