CSV-Dateien mit Pandas erweitern
Bei der Arbeit mit großen Datensätzen kann es notwendig sein, Daten zu einer vorhandenen CSV-Datei hinzuzufügen. Pandas, eine leistungsstarke Datenbearbeitungsbibliothek in Python, bietet die Funktion to_csv() zum Exportieren von Daten in das CSV-Format. In diesem Artikel wird die Verwendung von to_csv() zum Anhängen von Daten an eine vorhandene CSV-Datei untersucht, um die Kompatibilität mit deren Struktur sicherzustellen.
Anhängen an vorhandene CSV-Dateien
To_csv( )-Funktion bietet einen Schreibmodusparameter, mit dem Benutzer angeben können, wie die Daten in die Datei geschrieben werden. Wenn Sie diesen Parameter auf „a“ setzen, werden die Daten an die vorhandene Datei angehängt. Beispiel:
df.to_csv('my_csv.csv', mode='a', header=False)
Hier wird der Datenrahmen df an die CSV-Datei mit dem Namen „my_csv.csv“ angehängt. Der Parameter header=False stellt sicher, dass die Kopfzeile nicht mehrfach geschrieben wird.
Es ist wichtig zu beachten, dass der Standardschreibmodus für to_csv() „w“ ist, wodurch die vorhandene Datei überschrieben wird. Um den Anhängemodus sicherzustellen, geben Sie explizit „a“ an.
Umgang mit anfänglicher Abwesenheit der Datei
Wenn die Ziel-CSV-Datei anfangs nicht vorhanden ist, ist die Kopfzeile möglicherweise nicht vorhanden korrekt geschrieben, wenn der Anhängemodus verwendet wird. Um dieses Problem zu beheben, können Sie die folgende Variante verwenden:
import os output_path='my_csv.csv' df.to_csv(output_path, mode='a', header=not os.path.exists(output_path))
Dieser Code prüft mithilfe von os.path.exists(), ob die Datei vorhanden ist. Ist dies nicht der Fall, wird die Kopfzeile geschrieben, indem header=True gesetzt wird. Andernfalls werden die Daten ohne Header angehängt.
Das obige ist der detaillierte Inhalt vonWie kann ich Pandas verwenden, um Daten an eine vorhandene CSV-Datei anzuhängen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!