"for line in..." führt zu UnicodeDecodeError: 'utf-8' Codec Can't Decode Byte
Beim Versuch Beim Durchlaufen von Zeilen einer Textdatei mithilfe der Syntax „for line in open('filename')“ kann es sein, dass Programmierer auf einen UnicodeDecodeError stoßen, der darauf hinweist, dass der Codec „utf-8“ ein bestimmtes Byte nicht dekodieren kann. Dieser Fehler tritt normalerweise auf, wenn die Kodierung der Textdatei nicht mit der vom „utf-8“-Codec angenommenen Kodierung übereinstimmt.
Problem lösen
Um dieses Problem zu beheben Fehler auftritt, muss beim Öffnen der Textdatei die korrekte Codierung angegeben werden. Dies kann erreicht werden, indem der open()-Funktion ein „encoding="-Parameter hinzugefügt wird, wie unten gezeigt:
<code class="python">for line in open('filename', encoding='utf-8'): # Read each line</code>
In einigen Fällen ist die angegebene Codierung möglicherweise nicht korrekt, was zu demselben Fehler führt. Um die geeignete Kodierung zu ermitteln, können Programmierer die Textdatei untersuchen und den verwendeten Zeichensatz identifizieren.
Als Beispiel das vom Fragesteller bereitgestellte Code-Snippet:
<code class="python">for line in open('u.item'): # Read each line</code>
Die Dekodierung ist fehlgeschlagen Textdatei, da fälschlicherweise angenommen wurde, dass die Codierung „utf-8“ ist. Bei der Prüfung der Textdatei wurde festgestellt, dass die korrekte Kodierung „ISO-8859-1“ war. Durch Ändern des Codes wie folgt wurde das Problem behoben:
<code class="python">for line in open('u.item', encoding='ISO-8859-1'): # Read each line</code>
Das obige ist der detaillierte Inhalt vonWarum erhalte ich beim Durchlaufen einer Textdatei den Fehler „UnicodeDecodeError: Der Codec „utf-8' kann kein Byte dekodieren'?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!