Heim > Backend-Entwicklung > Python-Tutorial > Wie behebe ich den „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' von Pandas in CSV-Dateien?

Wie behebe ich den „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' von Pandas in CSV-Dateien?

Barbara Streisand
Freigeben: 2024-12-21 10:26:09
Original
224 Leute haben es durchsucht

How to Fix Pandas'

So beheben Sie „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten“ beim Lesen einer CSV-Datei

Beim Arbeiten mit einer CSV-Datei mit Pandas, möglicherweise tritt der Fehler „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten“ auf. Dieser spezielle Fehler tritt auf, wenn die CSV-Datei eine ungleiche Anzahl von Feldern in einer Zeile enthält, was zu einem Analysefehler führt.

Verstehen der Ursache:

Die Fehlermeldung weist darauf hin Der Parser erwartete zwei Felder in einer bestimmten Zeile, fand aber stattdessen 12. Diese Diskrepanz zwischen der erwarteten und der tatsächlichen Anzahl von Feldern führt zu dem Fehler.

Lösung des Problems:

Es gibt zwei primäre Möglichkeiten, dieses Problem zu beheben:

  1. Schlechtes Handling Zeilen:

    • on_bad_lines='skip': Diese Option weist Pandas an, die fehlerhaften Zeilen mit ungültigen Daten zu überspringen, sodass Sie den Rest der Datei fehlerfrei lesen können .
    • on_bad_lines='warn': Diese Option generiert Warnungen für das Ungültige Linien, die auf deren Vorhandensein hinweisen und es Ihnen ermöglichen, das Ausmaß des Problems einzuschätzen. Für eine erweiterte Behandlung können Sie eine aufrufbare Funktion übergeben.
  2. Fehlerbehandlung:

    • error_bad_lines=False : (für Pandas-Versionen unter 1.3.0) Diese Option unterdrückt den Fehler vollständig und ermöglicht Ihnen das Lesen gesamte Datei, einschließlich der ungültigen Zeilen. Es werden jedoch keine Informationen zu den ungültigen Zeilen bereitgestellt.

Beispielcode:

Als Beispiel, wenn Sie es hätten den folgenden Code:

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path)
Nach dem Login kopieren

Um den Fehler zu behandeln, können Sie den Code wie folgt ändern folgt:

path = 'GOOG Key Ratios.csv'
data = pd.read_csv(path, on_bad_lines='skip')
Nach dem Login kopieren

Mit einem dieser Ansätze können Sie die CSV-Datei trotz ungültiger Zeilen lesen und so sicherstellen, dass Ihre Pandas-Vorgänge reibungslos ablaufen

Das obige ist der detaillierte Inhalt vonWie behebe ich den „pandas.parser.CParserError: Fehler beim Tokenisieren von Daten' von Pandas in CSV-Dateien?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage