Remplacement des NaN par des valeurs précédentes ou suivantes dans les DataFrames Pandas
Lorsque vous traitez des DataFrames Pandas, les données manquantes sont représentées sous forme de NaN (pas un nombre) peut poser un défi pour l’analyse des données. Une tâche courante consiste à remplacer ces NaN par des valeurs appropriées dérivées de données existantes. Une approche simple consiste à parcourir le DataFrame et à modifier explicitement les valeurs. Cependant, Pandas propose des solutions plus efficaces qui évitent l'utilisation de boucles.
Forward Filling (ffill)
Pour remplacer les NaN par la première valeur non-NaN au-dessus d'eux dans la même colonne, utilisez la méthode fillna avec l'option ffill (forward fill). Cette méthode propage la dernière observation valide aux observations valides suivantes.
import pandas as pd df = pd.DataFrame([[1, 2, 3], [4, None, None], [None, None, 9]]) df.fillna(method='ffill')
Sortie :
0 1 2 0 1 2 3 1 4 2 3 2 4 2 9
Considérations supplémentaires
df.fillna(method='ffill', inplace=True)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!