Unicode-Text zum Schreiben von Dateien dekodieren
Beim Schreiben von Unicode-Text in eine Datei treten Kodierungsprobleme auf. Um dies zu überwinden, ist es wichtig, so viel wie möglich mit Unicode-Objekten umzugehen.
Codieren von Unicode-Strings
Wenn Ihr String ein Unicode-Objekt ist (gekennzeichnet durch das Präfix „ u“ in Python), muss es vor dem Schreiben in eine Datei in eine Unicode-codierte Zeichenfolge konvertiert werden. Verwenden Sie das folgende Format:
foo = u'Δ, Й, ק, م, ๗, あ, 叶, 葉, and 말.' f = open('test', 'w') f.write(foo.encode('utf8')) # Encode to UTF-8 f.close()
Dadurch wird sichergestellt, dass Nicht-ASCII-Zeichen ordnungsgemäß in der Datei codiert werden.
Dekodierung beim Lesen
Wann Wenn Sie die codierte Datei lesen, erhalten Sie eine Unicode-codierte Zeichenfolge. Um das Unicode-Objekt abzurufen, dekodieren Sie es:
f = file('test', 'r') print f.read().decode('utf8') # Decode from UTF-8
Wenn Sie diese Schritte befolgen, können Sie Unicode-Text beim Schreiben in und Lesen aus Dateien sicher verarbeiten und dabei die Beibehaltung von Sonderzeichen und Symbolen sicherstellen.
Das obige ist der detaillierte Inhalt vonWie schreibe und lese ich Unicode-Textdateien in Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!