Interpretation des Arguments „Zeilen überspringen“ von Pandas für CSV-Importe
Beim Importieren einer CSV-Datei in einen DataFrame mit pandas.read_csv() können Sie Folgendes tun: Es kommt zu Situationen, in denen Sie bestimmte Zeilen vom Importvorgang ausschließen möchten. Das Argument „skiprows“ bietet diese Funktionalität, aber seine Syntax kann mehrdeutig sein.
Die Mehrdeutigkeit verstehen
In der Pandas-Dokumentation heißt es, dass „skiprows“ entweder eine Liste von Zeilennummern ( 0-indiziert) oder eine Ganzzahl, die die Anzahl der Zeilen darstellt, die vom Anfang der Datei übersprungen werden sollen. Diese Mehrdeutigkeit kann zu Verwirrung führen, wenn Sie eine bestimmte Zeile überspringen möchten, beispielsweise die mit Index 1.
Bestimmen des Verhaltens
Um das Verhalten von Skiprows zu klären Betrachten Sie die folgenden Szenarien:
Beispieldemonstration
Lassen Sie uns das Verhalten veranschaulichen unter Verwendung eines StringIO-Objekts:
<code class="python">import pandas as pd from io import StringIO s = "1, 2\n3, 4\n5, 6" # Skipping the first row df1 = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Skipping the row with index 1 df2 = pd.read_csv(StringIO(s), skiprows=1, header=None) print(df1) print(df2)</code>
Ausgabe:
0 1 0 1 2 1 5 6 0 1 0 3 4 1 5 6
Wie Sie sehen können, überspringt „skiprows=[1]“ die zweite Zeile (Index 1), während „skiprows=1“ die zweite Zeile überspringt erste Zeile.
Fazit
Um eine bestimmte Zeile während CSV-Importen mit pandas.read_csv() zu überspringen, verwenden Sie die Syntax „skiprows=[row_index]“. Diese Syntax gibt eindeutig die Zeile an, die vom Importvorgang ausgeschlossen werden soll, wodurch jegliche Verwirrung über das Verhalten des Arguments vermieden wird.
Das obige ist der detaillierte Inhalt vonWie überspringe ich bestimmte Zeilen beim Importieren von CSV-Dateien mit Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!