Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimana untuk menukar pengekodan fail XML dalam Python

Bagaimana untuk menukar pengekodan fail XML dalam Python

王林
Lepaskan: 2023-05-21 12:22:06
ke hadapan
2274 orang telah melayarinya

1. Isu pengekodan fail XML dalam Python

1 Pustaka xml.etree.ElementTree yang digunakan oleh Python hanya menyokong penghuraian dan penjanaan pengekodan format UTF-8 standard

2. fail XML yang dikodkan seperti GBK atau GB2312 digunakan untuk memastikan keupayaan XML merakam aksara Cina dalam sistem lama

3. Terdapat pengepala pada permulaan fail XML dan pengepala menentukan pemprosesan program Pengekodan yang harus digunakan untuk XML

Bagaimana untuk menukar pengekodan fail XML dalam Python

4 Untuk mengubah suai pengekodan, bukan sahaja pengekodan keseluruhan fail mesti diubah suai, tetapi juga nilainya bahagian pengekodan dalam pengepala logo mesti diubah suai

2 Idea untuk memproses fail XML Python

1. mod binari untuk membaca fail XML dan menukar fail menjadi aliran binari

  • Gunakan kaedah

    untuk menghuraikan strim binari menjadi rentetan menggunakan format pengekodan fail asal
  • .encode() 2. Proseskan pengepala: gunakan kaedah

    , gantikan bahagian
  • dalam rentetan

3. Pengekodan & simpan: Simpan rentetan menggunakan format pengekodan baharu .replace()encoding="xxx"3. Ditemui dalam proses sebenar Masalah

GB2312 >

  • GBK
  • GBK -->

    • UTF8 --> ; GBK: .encode() akan melaporkan ralat Anda mesti menambah parameter error="ignore" untuk mengabaikan aksara yang tidak boleh ditukar

    • Prinsip di sini ialah: Pengekodan GBK serasi dengan pengekodan UTF-8 Oleh itu, kandungan yang tidak boleh ditukar boleh dipaparkan terus menggunakan GBK
    • . GBK GB2312: Tiada masalah

    4 . Memandangkan pengepala logo perlu diganti terus di sini, nama pengekodan mesti sepadan sepenuhnya, jika tidak, penggantian akan gagal
  • Contohnya: GBK tidak boleh ditulis sebagai gbk, utf-8 tidak boleh ditulis sebagai UTF8. Kod ini hanya diuji berdasarkan GBK, GB2312, UTF-8 di atas & format pengekodan lain yang biasa digunakan tidak dijamin berjaya

Atas ialah kandungan terperinci Bagaimana untuk menukar pengekodan fail XML dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:yisu.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan