Zeilen beim CSV-Import mit Pandas überspringen
Beim Importieren von CSV-Daten mit Pandas ist es oft notwendig, Zeilen zu überspringen, die Sie nicht möchten in Ihre Analyse einzubeziehen. Allerdings kann die Mehrdeutigkeit rund um das Skirows-Argument verwirrend sein.
Die Syntax für Skiprows lautet wie folgt:
skiprows : list-like or integer Row numbers to skip (0-indexed) or number of rows to skip (int) at the start of the file.
Es stellt sich die Frage: Woher weiß Pandas, ob die erste Zeile übersprungen werden soll oder die Zeile mit Index 1, wenn skiprows=1 angegeben ist?
Um dies zu entschlüsseln, führen wir ein Experiment mit einer Beispiel-CSV-Datei mit drei Zeilen durch:
1, 2 3, 4 5, 6
Überspringen der Zeile mit Index 1
Wenn Sie die Zeile mit Index 1 überspringen möchten, übergeben Sie Skiprows als Liste:
<code class="python">import pandas as pd from io import StringIO s = """1, 2 ... 3, 4 ... 5, 6""" df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skip row with index 1 print(df)</code>
Ausgabe:
0 1 0 1 2 1 5 6
Eine Anzahl von Zeilen überspringen
Um eine bestimmte Anzahl von Zeilen (in diesem Fall 1) zu überspringen, übergeben Sie Skiprows als Ganzzahl:
<code class="python">df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Skip the first row print(df)</code>
Ausgabe:
0 1 0 3 4 1 5 6
Daher ist es klar, dass sich das Skirows-Argument unterschiedlich verhält, je nachdem, ob Sie eine Liste oder eine Ganzzahl angeben. Wenn Sie eine Zeile anhand ihres Index überspringen möchten, verwenden Sie eine Liste. Andernfalls verwenden Sie eine Ganzzahl, um eine angegebene Anzahl von Zeilen vom Anfang der Datei zu überspringen.
Das obige ist der detaillierte Inhalt vonWoher weiß „skiprows' in Pandas, ob Sie die erste Zeile oder die Zeile mit Index 1 überspringen möchten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!