Menggunakan Pengekodan UTF-8 dalam Kod Sumber Python
Dalam senario tertentu, anda mungkin menghadapi ralat yang berkaitan dengan aksara bukan ASCII semasa bekerja dengan Rentetan Unicode dalam kod sumber Python. Ini kerana pengekodan lalai untuk fail sumber Python 2 bukan UTF-8.
Mengisytiharkan Rentetan UTF-8
Dalam Python 3, UTF-8 ialah lalai pengekodan sumber, jadi anda boleh terus menggunakan aksara Unicode tanpa sebarang pengisytiharan khas. Walau bagaimanapun, dalam Python 2, anda perlu mengisytiharkan pengekodan UTF-8 secara eksplisit dalam pengepala fail sumber menggunakan sintaks berikut:
# -*- coding: utf-8 -*-
Letakkan baris ini pada permulaan fail sumber Python 2 anda.
Sebagai contoh, pertimbangkan kod Python 2 berikut:
<code class="python"># -*- coding: utf-8 -*- u = 'idzie wąż wąską dróżką' uu = u.decode('utf8') s = uu.encode('cp1250') print(s)</code>
Kod ini menggunakan pengekodan UTF-8 dan berjaya menukar rentetan Unicode kepada rentetan bait berkod CP1250 untuk pencetakan.
Dengan mengisytiharkan pengekodan UTF-8, anda memastikan Python akan mentafsir aksara Unicode dengan betul dan mengelakkan ralat yang berkaitan dengan aksara bukan ASCII. Adalah penting untuk ambil perhatian bahawa pengisytiharan ini mesti diletakkan pada permulaan fail sumber, sebelum sebarang kod lain.
Atas ialah kandungan terperinci Bagaimana untuk Menggunakan Pengekodan UTF-8 dalam Kod Sumber Python 2?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!