Heim > Backend-Entwicklung > Python-Tutorial > Wie löst man „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' beim Lesen von CSV-Dateien?

Wie löst man „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' beim Lesen von CSV-Dateien?

Barbara Streisand
Freigeben: 2024-12-23 15:49:14
Original
784 Leute haben es durchsucht

How to Solve

Behandlung von „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten“ beim Lesen von CSV-Dateien

Der „pandas.parser.CParserError: Fehler beim Tokenisieren Der Fehler „Daten“ tritt auf, wenn Pandas eine Inkonsistenz in der Anzahl der Felder in einer CSV-Zeile feststellt. Um diesen Fehler zu beheben und eine reibungslose Datenmanipulation sicherzustellen, beachten Sie Folgendes:

1. Auf Codierungsfehler prüfen

Überprüfen Sie Ihre CSV-Datei auf Codierungsfehler, wie z. B. fehlende Feldtrennzeichen oder falsch formatierte Werte. Überprüfen Sie außerdem, ob die Datei die richtige Dateierweiterung hat (z. B. .csv).

2. CSV-Trennzeichen anpassen

Standardmäßig verwendet Pandas ein Komma als Trennzeichen für CSV-Dateien. Wenn Ihre CSV-Datei jedoch ein anderes Trennzeichen verwendet (z. B. ein Semikolon), geben Sie es mithilfe des Trennzeichenparameters in read_csv() an.

3. Fehlerhafte Zeilen ignorieren

Wenn Sie auf eine kleine Anzahl problematischer Zeilen stoßen, können Sie Pandas anweisen, diese beim Lesen der CSV-Datei zu überspringen. Sie können dies mit dem Parameter on_bad_lines='skip' in read_csv() tun.

4. Verwenden Sie das CSV-Modul

Als Alternative zu Pandas können Sie das Python-CSV-Modul verwenden, um CSV-Dateien zu lesen und zu analysieren. Dieses Modul bietet mehr Kontrolle über den Parsing-Prozess und ermöglicht Ihnen einen flexibleren Umgang mit Fehlern oder Inkonsistenzen.

Beispiel:

Um das CSV-Modul zu verwenden, können Sie Folgendes ausprobieren folgender Code:

with open(path, 'r') as csv_file:
    csv_reader = csv.reader(csv_file, delimiter=',')
    data = list(csv_reader)
Nach dem Login kopieren

Zusätzlich Tipps:

  • Für Pandas-Versionen vor 1.3.0 verwenden Sie error_bad_lines=False, um den Fehler zu unterdrücken.
  • Wenn Sie eine erhebliche Anzahl fehlerhafter Zeilen erwarten, Verwenden Sie on_bad_lines='warn' oder ein benutzerdefiniertes Callable, um sie angemessen zu behandeln.
  • Erwägen Sie, die CSV-Daten vorher zu validieren Importieren in Pandas, um seine Integrität sicherzustellen.

Das obige ist der detaillierte Inhalt vonWie löst man „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' beim Lesen von CSV-Dateien?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage