Supprimer des lignes d'un dataframe Pandas
Dans Pandas, nous rencontrons souvent le besoin de supprimer certaines lignes d'un dataframe, soit pour le nettoyage des données objectifs ou pour se concentrer sur des sous-ensembles spécifiques. Un moyen efficace d'y parvenir consiste à utiliser la fonction drop, qui nous permet de supprimer sélectivement des lignes en fonction de divers critères.
Pour démontrer le processus, considérons un dataframe df :
<code class="python">import pandas as pd df = pd.DataFrame({'sales': [2.709, 6.590, 10.103, 15.915, 3.196, 7.907], 'discount': [None, None, None, None, None, None], 'net_sales': [2.709, 6.590, 10.103, 15.915, 3.196, 7.907], 'cogs': [2.245, 5.291, 7.981, 12.686, 2.710, 6.459]}) print(df) </code>
Maintenant, supposons que nous souhaitions supprimer des lignes avec certains numéros de séquence, représentés par une liste, telle que [1, 2, 4]. Pour ce faire, nous pouvons utiliser la fonction drop comme suit :
<code class="python">indices_to_drop = [1, 2, 4]</code>
<code class="python">conditions_to_drop = df['sales'] > 10 df = df[~conditions_to_drop]</code>
En spécifiant le paramètre index dans drop, nous pouvons effectivement supprimer les lignes correspondant aux indices fournis, nous laissant avec le sous-ensemble souhaité :
<code class="python">df = df.drop(index=indices_to_drop) print(df)</code>
Dans ce cas, cela donnerait le dataframe suivant :
sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20061231 15.915 NaN 15.915 12.686 20070630 7.907 NaN 7.907 6.459
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!