Zeilen beim CSV-Import mit Pandas überspringen
Wenn Sie pandas.read_csv() zum Importieren von CSV-Daten verwenden, möchten Sie möglicherweise bestimmte Zeilen überspringen . Der Parameter „skiprows“ kann jedoch verwirrend sein, da er sowohl eine Liste als auch eine Ganzzahl akzeptiert.
Mit dem Parameter „skiprows“ können Sie Zeilen angeben, die vom Anfang der Datei übersprungen werden sollen. Wenn Sie eine Liste mit Zeilennummern angeben, werden diese Zeilen übersprungen. Wenn Sie eine Ganzzahl angeben, wird diese Anzahl an Zeilen übersprungen.
Wenn Sie beispielsweise eine CSV-Datei haben, in der die zweite Zeile unnötige Daten enthält, und Sie diese überspringen möchten, können Sie eine der folgenden Optionen verwenden Methoden:
Skiprow als Liste (empfohlen)
<code class="python">import pandas as pd from io import StringIO s = """1, 2 3, 4 5, 6""" # Skip the second row using a list df = pd.read_csv(StringIO(s), skiprows=[1], header=None) # Output: Row with index 1 skipped print(df)</code>
Skiprow als Ganzzahl
<code class="python"># Skip the second row using an integer df = pd.read_csv(StringIO(s), skiprows=1, header=None) # Output: Row with index 1 skipped print(df)</code>
Hinweis dass bei Verwendung von „skiprows=1“ die erste Zeile übersprungen wird, während „skiprows=[1]“ die Zeile mit Index 1 überspringt. Dies liegt daran, dass Python eine 0-basierte Indizierung verwendet, bei der das erste Element in einer Liste den Index 0 hat.
Fazit
Wenn Sie das Verhalten des Skiprows-Parameters verstehen, können Sie unerwünschte Zeilen beim CSV-Import mit Pandas effektiv überspringen.
Das obige ist der detaillierte Inhalt vonWie überspringe ich Zeilen beim Pandas CSV-Import?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!