pandas.parser.CParserError: The Error Tokenizing Data Enigma
Beim Versuch, eine CSV-Datei mithilfe der Pandas-Bibliothek zu lesen, stoßen Benutzer auf Folgendes: ein rätselhafter Fehler: pandas.parser.CParserError: Fehler beim Tokenisieren von Daten. C-Fehler: 2 Felder in Zeile 3 erwartet, 12 gesehen. Trotz Konsultation der Pandas-Dokumentation wurde keine klare Lösung gefunden.
Das täuschend einfache Code-Snippet:
path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path)
fällt diesem zum Opfer schwer fassbarer Fehler. Es stellt sich die Frage: Wie kann dieses Hindernis überwunden werden? Sollten alternative Module oder sogar Programmiersprachen in Betracht gezogen werden?
Ein Lichtblick
Keine Angst, liebe Entwickler! Die Lösung liegt im Reich der Pandas selbst. Durch Hinzufügen des folgenden Arguments zur pd.read_csv()-Funktion kann der Fehler elegant behoben werden:
data = pd.read_csv('file1.csv', on_bad_lines='skip')
Diese Änderung weist Pandas an, alle Zeilen zu ignorieren, die Parsing-Probleme verursachen, wodurch das Problem effektiv umgangen wird. Wenn Sie außerdem mehr Kontrolle über die Behandlung beschädigter Leitungen wünschen, können Sie eine benutzerdefinierte Rückruffunktion definieren, um maßgeschneiderte Antworten bereitzustellen.
Für Versionen von Pandas vor 1.3.0 gilt die folgende Syntax:
data = pd.read_csv("file1.csv", error_bad_lines=False)
Mit diesen Anpassungen verschwindet der mysteriöse Fehler und Sie können die Macht von Pandas für Ihre Datenmanipulationsanforderungen nutzen.
Das obige ist der detaillierte Inhalt vonPandas „CParserError': Wie löst man „X-Felder erwartet, Y gesehen'?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!