Suppression efficace des lignes DataFrame en fonction de la valeur de la colonne
Dans Pandas, la suppression des lignes en fonction d'une valeur de colonne spécifique peut être réalisée de plusieurs manières. L'une des approches les plus efficaces consiste à utiliser l'indexation logique.
Considérez le DataFrame suivant :
df = pd.DataFrame({ "daysago": [62, 83, 111, 139, 160, 204, 222, 245, 258, 275, 475, 504, 515, 542, 549, 556, 577, 589, 612, 632, 719, 733, 760, 790, 810, 934], "line_race": [11, 11, 9, 10, 10, 9, 8, 9, 11, 8, 5, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0], "rating": [56, 67, 66, 83, 88, 52, 66, 70, 68, 72, 65, 70, 64, 70, 70, -1, -1, -1, -1, -1, 69, -1, -1, -1, -1, -1], "rw": [1.000000, 1.000000, 1.000000, 0.880678, 0.793033, 0.636655, 0.581946, 0.518825, 0.486226, 0.446667, 0.164591, 0.142409, 0.134800, 0.117803, 0.113758, 0.109852, 0.098919, 0.093168, 0.083063, 0.075171, 0.048690, 0.045404, 0.039679, 0.034160, 0.030915, 0.016647], "wrating": [56.000000, 67.000000, 66.000000, 73.096278, 69.786942, 33.106077, 38.408408, 36.317752, 33.063381, 32.160051, 10.698423, 9.968634, 8.627219, 8.246238, 7.963072, -0.109852, -0.098919, -0.093168, -0.083063, -0.075171, 3.359623, -0.045404, -0.039679, -0.034160, -0.030915, -0.016647] })
Pour supprimer les lignes où la colonne line_race est égale à 0, nous pouvons utiliser ce qui suit ligne de code :
df = df[df["line_race"] != 0]
Cette expression crée un nouveau DataFrame qui inclut uniquement les lignes où la colonne line_race n'a pas la valeur 0. En utilisant l'indexation logique, nous évitons de créer une copie des données, ce qui peut constituer une amélioration significative des performances lorsque vous travaillez avec de grands ensembles de données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!