Bestimmte Zeilen aus einem Pandas-Datenrahmen entfernen
Bei der Datenanalyse ist es häufig erforderlich, bestimmte Zeilen aus einem Datenrahmen zu entfernen. Pandas bietet eine unkomplizierte Methode, um diese Aufgabe zu erfüllen, wie im folgenden Beispiel gezeigt.
Stellen Sie sich einen Datenrahmen „df“ vor, der Verkaufsinformationen enthält:
<code class="python">df sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20060630 6.590 NaN 6.590 5.291 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459</code>
Zum Entfernen von Zeilen mit angegebenen Zeilennummern Für eine Liste (z. B. [1, 2, 4]) können wir die Funktion DataFrame.drop verwenden. Diese Funktion benötigt ein Indexargument, bei dem es sich um eine Reihe von zu löschenden Beschriftungen handeln kann. In diesem Fall erstellen wir eine Liste der Zeilennummern und konvertieren sie in eine Serie:
<code class="python">import pandas as pd row_numbers = [1, 2, 4] index_to_drop = pd.Series(row_numbers)</code>
Schließlich übergeben wir die index_to_drop-Serie an die DataFrame.drop-Funktion:
<code class="python">df = df.drop(index=index_to_drop)</code>
Der resultierende Datenrahmen enthält nur die Zeilen, die nicht in der Liste „row_numbers“ angegeben wurden:
<code class="python"> sales discount net_sales cogs STK_ID RPT_Date 600141 20060331 2.709 NaN 2.709 2.245 20061231 15.915 NaN 15.915 12.686 20070630 7.907 NaN 7.907 6.459</code>
Das obige ist der detaillierte Inhalt vonWie entferne ich bestimmte Zeilen aus einem Pandas-Datenrahmen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!