Bab ini mengemas kini kandungan yang berkaitan dengan "Spesifikasi sintaks Python dan jenis data", terutamanya untuk membolehkan semua orang memahami jenis mod pengaturcaraan yang Python ada, menguasai sintaks asas Python dan memahami Bagaimana untuk mengeluarkan dan aplikasi asas parameter baris arahan Selepas memahami jenis data Python, anda boleh melakukan lebih banyak operasi yang berkaitan.
①Python pengaturcaraan arahan interaktif.
②Pengaturcaraan skrip Python.
③Pemprosesan pengekodan Cina.
Mod pengaturcaraan arahan interaktif ialah mod pelaksanaan bacaan baris demi baris biasa.
Mod pengaturcaraan ini adalah aplikasi biasa apabila program hanya mempunyai satu baris atau kurang.
Angka berikut menggunakan editor PythonIDLE untuk pengaturcaraan, dan mod pengaturcaraan editor ini ialah simbol pengekodan perintah interaktif biasa.
>>> ialah gesaan untuk memasukkan arahan interaktif Setiap kali anda menekan enter selepas memasukkan, arahan itu akan dilaksanakan oleh penghurai Python.
Apabila kita perlu menulis bahagian kod yang lebih kompleks atau besar, pengaturcaraan imperatif tidak cukup mudah.
Oleh itu, Python menyediakan mod pengaturcaraan skrip. Anda boleh mencipta fail skrip dengan akhiran *.py dan menulis sejumlah besar kod ke dalam fail, yang memudahkan penyelenggaraan dan kemas kini kod Anda kemudian boleh menggunakan arahan interaktif atau alat IDE untuk menjalankannya.
String ialah jenis data. Walau bagaimanapun, terdapat masalah pengekodan khas dengan rentetan.
Oleh kerana komputer hanya boleh memproses nombor, jika anda ingin memproses teks, anda mesti menukar teks terlebih dahulu kepada nombor sebelum memproses.
Komputer terawal direka menggunakan 8 bit sebagai bait Oleh itu, integer terbesar yang boleh diwakili oleh bait Iaitu 255 (binari 11111111 =. perpuluhan 255). Jika anda ingin mewakili integer yang lebih besar, anda mesti menggunakan lebih banyak bait. Sebagai contoh, integer maksimum yang boleh diwakili oleh dua bait ialah 65535, dan integer maksimum yang boleh diwakili oleh 4 bait ialah 4294967295.
Memandangkan komputer dicipta oleh orang Amerika, hanya 127 aksara pada mulanya dikodkan ke dalam komputer, iaitu huruf besar dan kecil Inggeris, nombor dan beberapa simbol Jadual pengekodan ini dipanggil pengekodan ASCII, seperti huruf besar The kod untuk huruf A ialah 65, dan kod untuk huruf kecil z ialah 122.
Sebab Python3 boleh menyelesaikan masalah kacau Cina dengan baik ialah ia menggunakan unikod untuk semua rentetan Pengekodan aksara.
● Unicode menyatukan semua bahasa ke dalam satu set kod supaya tiada aksara bercelaru.
● Unicode juga sentiasa berkembang, tetapi yang paling biasa digunakan ialah menggunakan dua bait untuk mewakili aksara (jika anda menemui aksara yang sangat jarang berlaku, anda memerlukan 4 bait). Kebanyakan sistem pengendalian dan kebanyakan bahasa pengaturcaraan yang kita lihat kini menyokong unicode.
Pengekodan ASCII ialah 1 bait, manakala pengekodan Unikod biasanya 2 bait.
Masalah baharu timbul: Jika disatukan ke dalam pengekodan Unikod, masalah bercelaru akan hilang. Walau bagaimanapun, jika teks yang anda tulis pada asasnya semuanya dalam bahasa Inggeris, pengekodan Unicode memerlukan ruang storan dua kali lebih banyak daripada pengekodan ASCII, yang sangat tidak menjimatkan dari segi penyimpanan dan penghantaran.
Lahirnya penyelesaian: Pengekodan UTF-8 yang menukar pengekodan Unikod kepada "pengekodan panjang pembolehubah" muncul semula.
● Pengekodan UTF-8 mengekod aksara Unikod kepada 1-6 bait mengikut saiz nombor yang berbeza Huruf Inggeris yang biasa digunakan dikodkan kepada 1 bait, dan aksara Cina biasanya 3 bait sahaja dikodkan kepada 4-6 bait.
● Jika teks yang anda ingin pindahkan mengandungi sejumlah besar aksara Inggeris, pengekodan UTF-8 boleh menjimatkan ruang.
● Pengekodan UTF-8 mempunyai faedah tambahan, iaitu pengekodan ASCII sebenarnya boleh dianggap sebagai sebahagian daripada pengekodan UTF-8 Oleh itu, sejumlah besar perisian warisan sejarah yang hanya menyokong pengekodan ASCII boleh dikodkan dalam UTF-8 Teruskan bekerja sambil mengekod.
Nota khas: Pengekodan Unikod digunakan secara seragam dalam ingatan komputer.
Dalam versi Python3, rentetan dikodkan dalam Unicode, yang bermaksud rentetan Python menyokong berbilang bahasa.
Untuk pengekodan aksara tunggal, Python menyediakan fungsi ord() untuk mendapatkan perwakilan integer perpuluhan bagi aksara tunggal, dan fungsi chr() menukar pengekodan kepada aksara yang sepadan.
>>> ord(‘A’) 65 >>> ord(‘中’) 20013 >>> chr(66) ‘B’ >>> chr(25991) ‘文’
Kod sumber Python juga merupakan fail teks, jadi apabila kod sumber anda mengandungi bahasa Cina, apabila menyimpan kod sumber, anda perlu menentukan untuk menyimpannya sebagai pengekodan UTF-8. Apabila jurubahasa Python membaca kod sumber, agar ia dibaca dalam pengekodan UTF-8, kami biasanya menulis baris ini pada permulaan fail. Ulasan
#-*- coding:utf-8 *-
adalah untuk memberitahu penterjemah Python untuk membaca kod sumber mengikut pengekodan UTF-8 Jika tidak, output bahasa Cina yang anda tulis dalam kod sumber mungkin bercelaru.
Atas ialah kandungan terperinci Ujian automatik: beberapa corak pengaturcaraan biasa dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!