Jenis data asas Python
1. Integer
Python boleh mengendalikan integer dalam sebarang saiz, termasuk integer negatif sudah tentu Dalam program Python, integer dinyatakan sama seperti dalam matematik, seperti: 1, 100, -8080, 0, dsb. .
Memandangkan komputer menggunakan binari, kadangkala lebih mudah untuk menggunakan perenambelasan untuk mewakili integer diwakili oleh awalan 0x dan 0-9, a-f, contohnya: 0xff00, 0xa5b4c3d2, dsb.
2. Nombor titik terapung
Nombor titik terapung juga dipanggil nombor titik terapung kerana apabila dinyatakan dalam tatatanda saintifik, kedudukan titik perpuluhan nombor titik terapung adalah berubah. Cara integer dan nombor titik terapung disimpan di dalam komputer adalah berbeza operasi Integer sentiasa tepat (pembahagian juga tepat), manakala operasi titik terapung mungkin mempunyai ralat pembundaran.
3. Rentetan
Rentetan ialah sebarang teks yang disertakan dengan '' atau "", seperti 'abc', "123", dsb. Sila ambil perhatian bahawa '' atau "" itu sendiri hanyalah perwakilan, bukan sebahagian daripada rentetan Oleh itu, rentetan 'abc' hanya mempunyai 3 aksara: a, b, c. Ini serupa untuk bahasa pengaturcaraan lain.
(1) Rentetan dan rentetan terlepas dalam Python
Seperti yang dinyatakan di atas, rentetan boleh diwakili oleh kurungan '' atau "". Tetapi kadangkala, rentetan kita sendiri mengandungi '' atau "", apakah yang perlu kita lakukan?
Pada masa ini, anda perlu "melarikan diri" beberapa aksara khas rentetan Python yang dilepaskan dengan . Begitu juga dengan JAVA. . Untuk mengatasi situasi ini, kita boleh menambah awalan r di hadapan rentetan, menunjukkan bahawa ini adalah rentetan mentah, dan aksara di dalamnya tidak perlu dilepaskan.
Walau bagaimanapun, satu perkara yang perlu diambil perhatian ialah tatatanda r'...' tidak boleh mewakili rentetan berbilang baris, begitu juga rentetan yang mengandungi ' dan ". Jika anda ingin mewakili rentetan berbilang baris, anda boleh gunakan '''...''' bermakna, sudah tentu anda juga boleh menambah r di hadapan rentetan berbilang baris untuk menukar rentetan berbilang baris ini menjadi rentetan mentah(2) Isu pengekodan rentetan
Kita semua tahu bahawa komputer hanya boleh memproses nombor Jika anda ingin memproses teks, anda mesti menukar teks terlebih dahulu kepada nombor sebelum memproses. Komputer terawal direka bentuk menggunakan 8 bit sebagai bait Oleh itu, integer terbesar yang boleh diwakili oleh bait ialah 255 (perduaan 11111111 = perpuluhan 255), dan 0 - 255 digunakan untuk mewakili saiz. nombor dan beberapa simbol, jadual pengekodan ini dipanggil pengekodan ASCII Contohnya, pengekodan huruf besar A ialah 65, dan pengekodan huruf kecil z ialah 122.
Jika anda ingin mewakili bahasa Cina, jelas satu bait tidak mencukupi, sekurang-kurangnya dua bait diperlukan, dan ia tidak boleh bercanggah dengan pengekodan ASCII Oleh itu, China telah merumuskan pengekodan GB2312 untuk mengekod bahasa Cina.
Begitu juga, bahasa lain seperti Jepun dan Korea juga mengalami masalah ini. Untuk menyatukan pengekodan semua teks, Unicode wujud. Unicode menyatukan semua bahasa ke dalam satu set pengekodan, jadi tidak akan ada lagi aksara yang bercelaru.
Unicode biasanya menggunakan dua bait untuk mewakili satu aksara Pengekodan bahasa Inggeris asal telah berubah daripada bait tunggal kepada bait berganda Anda hanya perlu mengisi semua bait tinggi dengan 0.
Oleh kerana Python dilahirkan lebih awal daripada keluaran standard Unicode, Python terawal hanya menyokong pengekodan ASCII Rentetan biasa 'ABC' dikodkan secara dalaman dalam Python.
Python kemudian menambah sokongan untuk Unicode, dan rentetan yang diwakili dalam Unicode diwakili oleh u'...'.
Walau bagaimanapun, dalam versi Python 3 terkini, rentetan dikodkan dalam Unicode, yang bermaksud rentetan Python menyokong berbilang bahasa. Sama seperti contoh di atas, saya tidak menambah u'...' dalam kod saya dan ia boleh dipaparkan seperti biasa.
Walau bagaimanapun, memandangkan kod sumber Python juga merupakan fail teks, apabila kod sumber anda mengandungi bahasa Cina, anda perlu menentukan pengekodan UTF-8 semasa menyimpan kod sumber. Apabila jurubahasa Python membaca kod sumber, untuk membolehkannya membaca dalam pengekodan UTF-8, kami biasanya menulis dua baris ini pada permulaan fail:
\n 表示换行 \t 表示一个制表符 \ 表示 \ 字符本身
Barisan pertama komen adalah untuk memberitahu Linux/OS X sistem yang ini Untuk program boleh laku Python, sistem Windows akan mengabaikan komen ini
Barisan kedua komen adalah untuk memberitahu jurubahasa Python untuk membaca kod sumber mengikut pengekodan UTF-8 kod sumber mungkin mempunyai aksara Garbled.
Menyatakan bahawa pengekodan UTF-8 tidak bermakna fail .py anda dikodkan UTF-8 Anda mesti dan memastikan penyunting teks menggunakan UTF-8 tanpa pengekodan BOM
4 Boolean perwakilan nilai adalah sama seperti algebra Boolean Nilai Boolean hanya mempunyai dua nilai, True dan False, sama ada True atau False, anda boleh terus menggunakan True atau False untuk mewakili nilai Boolean perhatian kepada kes itu), atau anda boleh Dikira menggunakan operasi Boolean.
Nilai Boolean boleh dikendalikan dengan dan, atau dan tidak.dan
Operasi adalah operasi DAN Hanya apabila semuanya Benar, hasil operasi DAN adalah Benar.atau
Operasi adalah operasi ATAU Selagi salah satu daripadanya adalah Benar, hasil operasi ATAU adalah Benar.bukan Operasi adalah operasi penolakan Ia adalah pengendali unary yang menukar Benar kepada Salah dan Salah kepada Benar.
5 Nilai null
Pada asasnya setiap bahasa pengaturcaraan mempunyai nilai khasnya sendiri - nilai nol, dalam Python, ia diwakili oleh Tiada