Das Importieren von CSV-Dateien in Python ist eine häufige Aufgabe, und Pandas ist eine beliebte Bibliothek zum Bearbeiten und Analysieren von Daten. Es kann jedoch vorkommen, dass Sie während des Importvorgangs bestimmte Zeilen überspringen müssen.
Um dies zu erreichen, stellt Pandas in seiner Funktion read_csv() den Parameter „skiprows“ bereit. Die Dokumentation erscheint jedoch möglicherweise mehrdeutig, sodass Sie sich fragen, wie Sie die zu überspringenden Zeilen richtig angeben können.
Den Skiprows-Parameter verstehen
Der Skiprows-Parameter akzeptiert eine Liste von Zeilennummern (0-indiziert) oder eine Ganzzahl, die die Anzahl der Zeilen darstellt, die vom Anfang der Datei übersprungen werden sollen. Die Verwirrung entsteht, weil Pandas je nach Format des von Ihnen bereitgestellten Werts beide Interpretationen zulässt.
Beispiel
Um den Unterschied zu veranschaulichen, betrachten Sie die folgende CSV-Datei:
<code class="csv">1, 2 3, 4 5, 6</code>
Um die zweite Zeile (mit Index 1) zu überspringen:
<code class="python">import pandas as pd # Skip row with index 1 data = pd.read_csv("data.csv", skiprows=[1]) # Print the data print(data)</code>
Dies würde Folgendes ausgeben:
0 1 0 1 2 1 5 6
Um die erste Zeile zu überspringen:
<code class="python">import pandas as pd # Skip first row data = pd.read_csv("data.csv", skiprows=1) # Print the data print(data)</code>
Dies würde Folgendes ausgeben:
0 1 0 3 4 1 5 6
Wenn Sie die verschiedenen Möglichkeiten zur Angabe übersprungener Zeilen in Pandas.read_csv() verstehen, können Sie Daten effizient importieren und bestimmte Szenarien bewältigen, in denen der Ausschluss bestimmter Zeilen erforderlich ist.
Das obige ist der detaillierte Inhalt vonWie überspringe ich bestimmte Zeilen beim Importieren von CSV-Dateien mit Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!