Fehlerbehebung bei „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten“ für die Pandas-CSV-Analyse
Möglicherweise tritt der Fehler „pandas.parser.CParserError“ auf : Fehler bei der Tokenisierung der Daten bei Verwendung der pd.read_csv-Funktion des Pandas-Bibliothek, die auf eine Diskrepanz zwischen der erwarteten und der gefundenen Anzahl von Feldern in einer bestimmten Zeile der CSV-Datei hinweist.
Die Fehlermeldung impliziert, dass die Bibliothek zwei Felder in einer bestimmten Zeile (in diesem Fall Zeile 3) erwartet hat. aber stattdessen 12 gefunden. Diese Ungleichheit kann durch fehlerhafte Daten wie fehlende Werte oder zusätzliche Kommas in einem Feld entstehen.
Um das Problem zu beheben und mit der CSV-Analyse fortzufahren, ziehen Sie den folgenden Ansatz in Betracht:
Verwenden Sie die on_bad_lines Parameter:
data = pd.read_csv(path, on_bad_lines='skip')
Für eine erweiterte Behandlung ungültiger Zeilen implementieren Sie eine benutzerdefinierte aufrufbare Funktion definiert Aktionen, die ergriffen werden sollen, wenn fehlerhafte Leitungen erkannt werden.
Wenn Ihre Pandas-Version kleiner als 1.3.0 ist, können Sie den Parameter on_bad_lines durch ersetzen error_bad_lines:
data = pd.read_csv("file1.csv", error_bad_lines=False)
Als Alternative zu Pandas können Sie die Erkundung mit dem CSV-Modul in Python durchführen, das grundlegende Dienstprogramme bereitstellt zum Parsen von CSV-Dateien. Es bietet jedoch möglicherweise nicht das gleiche Maß an Flexibilität und Funktionen wie Pandas.
Das obige ist der detaillierte Inhalt vonWie löst man den Pandas-Fehler „pandas.parser.CParserError: Error tokenizing data' beim Lesen von CSV-Dateien?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!