Membaca dan Menulis Fail Teks Unikod dalam Python
Apabila berurusan dengan aksara Unicode dalam fail teks, Python menawarkan pelbagai pendekatan untuk memastikan pengendalian yang betul. Satu isu biasa timbul apabila cuba membaca dan menulis rentetan Unicode menggunakan kaedah encode() dan decode().
Untuk mengatasi cabaran ini, anda disyorkan untuk menentukan pengekodan fail semasa membukanya. Dengan pengenalan modul io dalam Python 2.6, fungsi io.open tersedia, membolehkan kami menentukan pengekodan yang diingini:
<code class="python">import io # Assuming the file is encoded in UTF-8 f = io.open("test", mode="r", encoding="utf-8") unicodeString = f.read()</code>
Dalam Python 3.x, fungsi io.open ialah alias untuk fungsi terbuka terbina dalam, menghapuskan keperluan untuk import.
Pilihan lain ialah menggunakan open() daripada perpustakaan standard codec modul:
<code class="python">import codecs f = codecs.open("test", "r", "utf-8") unicodeString = f.read()</code>
Walau bagaimanapun, pendekatan ini mungkin membawa kepada isu keserasian apabila mencampurkan operasi read() dan readline().
Untuk menulis rentetan Unicode pada fail dalam pengekodan UTF-8, anda boleh menggunakan coretan kod berikut:
<code class="python"># assumes unicodeString is a Unicode string outputFile = io.open("output.txt", mode="w", encoding="utf-8") outputFile.write(unicodeString)</code>
Dengan mengikuti garis panduan ini, anda boleh memastikan bahawa aksara Unicode adalah dikendalikan dengan betul semasa membaca dan menulis fail teks dalam Python.
Atas ialah kandungan terperinci Bagaimana untuk Membaca dan Menulis Fail Teks Unikod dalam Python?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!