Suppression des lignes Pandas DataFrame avec des valeurs manquantes dans une colonne spécifique
Dans l'analyse des données, il est souvent nécessaire de gérer les valeurs manquantes. Une tâche courante consiste à supprimer les lignes contenant des valeurs manquantes dans une colonne particulière. Par exemple, considérons le DataFrame suivant :
STK_ID EPS cash STK_ID RPT_Date 601166 20111231 601166 NaN NaN 600036 20111231 600036 NaN 12 600016 20111231 600016 4.3 NaN 601009 20111231 601009 NaN NaN 601939 20111231 601939 2.5 NaN 000001 20111231 000001 NaN NaN
Pour obtenir un DataFrame avec uniquement des lignes où la colonne "EPS" n'est pas nulle, nous pouvons utiliser la méthode suivante :
df = df[df['EPS'].notna()]
Cette expression sélectionne toutes les lignes où la colonne "EPS" n'est pas nulle et attribue le résultat au nouveau DataFrame df. Le résultat est le suivant :
STK_ID EPS cash STK_ID RPT_Date 600016 20111231 600016 4.3 NaN 601939 20111231 601939 2.5 NaN
En utilisant la méthode notna(), nous pouvons filtrer efficacement les valeurs manquantes dans la colonne spécifiée et créer un DataFrame qui contient uniquement les lignes qui nous intéressent.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!