Cara Mengendalikan Pasangan Pengganti dalam Unikod Python
Dalam Python, pasangan pengganti digunakan untuk mewakili aksara Unikod di luar Satah Berbilang Bahasa Asas (BMP ). Pasangan ini terdiri daripada dua titik kod pengganti yang digunakan untuk mengekod satu aksara Unikod.
Apabila bekerja dengan rentetan unicode Python yang mengandungi pasangan pengganti, anda mungkin menghadapi ralat yang berkaitan dengan pengekodan pengganti. Ralat ini berlaku kerana Python mengendalikan pasangan pengganti secara berbeza bergantung pada konteks.
Mengendalikan Pasangan Pengganti
Untuk menukar pasangan pengganti kepada rentetan biasa, anda mempunyai beberapa pilihan:
Gunakan Modul json:
Enkod dan Nyahkod dengan kaedah encode():
Contoh:
<code class="python">emoji = "This is \ud83d\ude4f, an emoji." encoded = emoji.encode("utf-16") decoded = encoded.decode("utf-16") print(decoded) # Output: "This is ?, an emoji."</code>
Gunakan Pengendali Ralat Surrogatepass:
Contoh:
<code class="python">encoded = emoji.encode("utf-16", "surrogatepass") decoded = encoded.decode("utf-16") print(decoded) # Output: "?"</code>
Perhatikan bahawa pendekatan yang anda pilih akan bergantung pada konteks khusus dan format output yang diingini.
Atas ialah kandungan terperinci Bagaimana Mengendalikan Pasangan Pengganti dalam Python Unicode?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!