Suppression conditionnelle de lignes dans les DataFrames Pandas
Pour résoudre le problème soulevé dans la question sur la suppression de lignes basées sur une expression conditionnelle dans un DataFrame pandas , nous pouvons utiliser la méthode drop. Cette méthode nous permet de supprimer des lignes d'un DataFrame en fonction de critères spécifiques.
Par exemple, pour supprimer les lignes où la longueur de la chaîne dans une colonne particulière dépasse 2, nous pouvons utiliser le code suivant :
df = df.drop(df[df['column name'].str.len() > 2].index)
La fonction str.len() renvoie la longueur de chaque chaîne dans la colonne spécifiée, et nous appliquons la condition à chaque élément du DataFrame en utilisant le > opérateur. Les lignes où la condition est remplie sont ensuite supprimées.
De plus, si nous voulons supprimer plusieurs lignes en fonction de plusieurs conditions, nous pouvons utiliser les opérateurs au niveau du bit (| pour OR, & pour AND et ~ pour NOT) entre parenthèses pour regrouper nos conditions.
Par exemple, pour supprimer les lignes où les valeurs de la colonne « score » sont à la fois inférieures à 50 et supérieures à 20 :
df = df.drop(df[(df['score'] < 50) & (df['score'] > 20)].index)
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!