Suppression de lignes avec des valeurs NaN d'un DataFrame Pandas
Un DataFrame Pandas peut contenir des valeurs manquantes représentées par NaN. Cela peut poser des problèmes lors de la manipulation des données. Cet article explique comment supprimer efficacement les lignes où une colonne spécifique contient des valeurs NaN.
Problème :
Considérez le DataFrame suivant où nous voulons conserver uniquement les lignes où le ' La colonne EPS n'est pas NaN :
STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN
Solution :
Pour supprimer les lignes avec des valeurs NaN dans la colonne 'EPS', nous pouvons utiliser la fonction notna(). Cette fonction crée un masque booléen où True représente des valeurs non-NaN.
df = df[df['EPS'].notna()]
Cette opération sélectionnera uniquement les lignes où 'EPS' n'est pas NaN, ce qui donnera le DataFrame suivant :
STK_ID EPS cash STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN
En utilisant la fonction notna(), nous filtrons efficacement les lignes contenant des valeurs NaN dans la colonne spécifiée.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!