Warum erhalte ich beim Durchlaufen einer Textdatei den Fehler „UnicodeDecodeError: Der Codec „utf-8' kann kein Byte dekodieren'?

Patricia Arquette
Freigeben: 2024-11-04 13:35:01
Original
989 Leute haben es durchsucht

Why am I getting a UnicodeDecodeError: 'utf-8' codec can't decode byte when iterating through a text file?

"for line in..." führt zu UnicodeDecodeError: 'utf-8' Codec Can't Decode Byte

Beim Versuch Beim Durchlaufen von Zeilen einer Textdatei mithilfe der Syntax „for line in open('filename')“ kann es sein, dass Programmierer auf einen UnicodeDecodeError stoßen, der darauf hinweist, dass der Codec „utf-8“ ein bestimmtes Byte nicht dekodieren kann. Dieser Fehler tritt normalerweise auf, wenn die Kodierung der Textdatei nicht mit der vom „utf-8“-Codec angenommenen Kodierung übereinstimmt.

Problem lösen

Um dieses Problem zu beheben Fehler auftritt, muss beim Öffnen der Textdatei die korrekte Codierung angegeben werden. Dies kann erreicht werden, indem der open()-Funktion ein „encoding="-Parameter hinzugefügt wird, wie unten gezeigt:

<code class="python">for line in open('filename', encoding='utf-8'):
    # Read each line</code>
Nach dem Login kopieren

In einigen Fällen ist die angegebene Codierung möglicherweise nicht korrekt, was zu demselben Fehler führt. Um die geeignete Kodierung zu ermitteln, können Programmierer die Textdatei untersuchen und den verwendeten Zeichensatz identifizieren.

Als Beispiel das vom Fragesteller bereitgestellte Code-Snippet:

<code class="python">for line in open('u.item'):
    # Read each line</code>
Nach dem Login kopieren

Die Dekodierung ist fehlgeschlagen Textdatei, da fälschlicherweise angenommen wurde, dass die Codierung „utf-8“ ist. Bei der Prüfung der Textdatei wurde festgestellt, dass die korrekte Kodierung „ISO-8859-1“ war. Durch Ändern des Codes wie folgt wurde das Problem behoben:

<code class="python">for line in open('u.item', encoding='ISO-8859-1'):
    # Read each line</code>
Nach dem Login kopieren

Das obige ist der detaillierte Inhalt vonWarum erhalte ich beim Durchlaufen einer Textdatei den Fehler „UnicodeDecodeError: Der Codec „utf-8' kann kein Byte dekodieren'?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Neueste Artikel des Autors
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage
Über uns Haftungsausschluss Sitemap
Chinesische PHP-Website:Online-PHP-Schulung für das Gemeinwohl,Helfen Sie PHP-Lernenden, sich schnell weiterzuentwickeln!