Wie liest und schreibt man Unicode-Dateien in Python: Eine Anleitung zum Kodieren und Dekodieren?-Python-Tutorial-php.cn

Wie liest und schreibt man Unicode-Dateien in Python: Eine Anleitung zum Kodieren und Dekodieren?

DDD

Freigeben： 2024-11-05 13:29:02

Original

981 Leute haben es durchsucht

How to Read and Write Unicode Files in Python: A Guide to Encoding and Decoding?

Unicode (UTF-8) Lesen und Schreiben in Dateien in Python

In Python kann der Umgang mit Unicode in Dateien schwierig sein. Lassen Sie uns einige häufige Missverständnisse untersuchen und elegante Lösungen finden.

Unicode-Kodierungen verstehen

Python-Strings sind Unicode-Objekte, die Zeichen mit verschiedenen Zeichenkodierungen wie UTF-8 kodieren. Wenn wir einen String in eine Datei schreiben, müssen wir entscheiden, wie er codiert wird. Die „utf8“-Kodierung wandelt Unicode-Zeichen in eine Folge von Bytes um.

Dateien mit angegebener Kodierung öffnen

Anstatt sich auf .encode und .decode zu verlassen, ist es besser, dies zu tun Geben Sie beim Öffnen der Datei die Codierung an. In Python 2.6 und höher stellt das io-Modul io.open einen Kodierungsparameter zur Verfügung. In Python 3.x unterstützt dies auch die integrierte Open-Funktion.

<code class="python">import io
f = io.open("test", "r", encoding="utf-8")</code>

Nach dem Login kopieren

Dadurch wird die Datei im UTF-8-Modus geöffnet und f.read() gibt ein dekodiertes Unicode-Objekt zurück.

Codecs-Modul verwenden

Alternativ können wir open aus dem Codecs-Modul verwenden.

<code class="python">import codecs
f = codecs.open("test", "r", "utf-8")</code>

Nach dem Login kopieren

Mischen von read() und readline () mit Codecs

Das Mischen von read() und readline() bei der Verwendung von Codecs kann zu Problemen führen. Es ist besser, readlines() zu verwenden, das eine Liste von Unicode-Strings zurückgibt und so Codierungsprobleme vermeidet.

Fazit

Um Unicode-Textdateien effektiv in Python zu lesen und zu schreiben, Geben Sie die Kodierung an, wenn Sie die Dateien mit io.open oder codecs.open öffnen. Dadurch wird sichergestellt, dass Unicode-Zeichen korrekt verarbeitet und wie erwartet dargestellt werden.

Das obige ist der detaillierte Inhalt vonWie liest und schreibt man Unicode-Dateien in Python: Eine Anleitung zum Kodieren und Dekodieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!