Heim > Backend-Entwicklung > Python-Tutorial > Wie kann ich den UnicodeDecodeError von Pandas beim Lesen von CSV-Dateien beheben?

Wie kann ich den UnicodeDecodeError von Pandas beim Lesen von CSV-Dateien beheben?

Patricia Arquette
Freigeben: 2025-01-03 21:45:40
Original
659 Leute haben es durchsucht

How Can I Fix Pandas' UnicodeDecodeError When Reading CSV Files?

Dekodierungsfehler beim Lesen von CSV-Dateien mit Pandas

Dieses Problem tritt beim Einlesen von CSV-Dateien in Pandas auf und führt zu folgendem Fehler:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
Nach dem Login kopieren

Die zugrunde liegende Ursache liegt oft in Inkonsistenzen in der Kodierung der CSV Dateien.

Lösung

Um diesen Fehler zu beheben, stellt die Funktion read_csv einen Codierungsparameter bereit. Durch Angabe einer geeigneten Kodierung können Sie Pandas anweisen, die Datei korrekt zu interpretieren. Zu den häufig verwendeten Kodierungen gehören:

  • UTF-8:kodierung = "utf-8"
  • ISO-8859-1:kodierung = "ISO-8859-1"
  • Latin-1: Encoding = "Latin"
  • Windows-1252: Encoding = „cp1252“

Wenn die CSV-Dateien beispielsweise in ISO-8859-1 kodiert sind, können Sie den folgenden Code verwenden:

data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
Nach dem Login kopieren

Bestimmen des Richtigen Kodierung

Wenn Sie sich über die richtige Kodierung nicht sicher sind, können Sie Tools wie Enca oder File verwenden um die Datei zu analysieren:

  • enca: Bietet einen detaillierten Bericht über die Kodierung der Datei.
  • Datei: Zeigt eine Kurzdarstellung an Beschreibung der Datei, einschließlich ihrer Kodierung.

Zusätzlich Ressourcen

  • [Pandas CSV-Dokumentation](https://pandas.pydata.org/docs/reference/api/pandas.read_csv.html)
  • [Python CSV Datei Beispiele](https://www.pythonprogramming.net/parse-csv-python-file/)
  • [Unicode-Zeichen und Kodierungen](https://realpython.com/python-encodings-guide/)

Das obige ist der detaillierte Inhalt vonWie kann ich den UnicodeDecodeError von Pandas beim Lesen von CSV-Dateien beheben?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage