Rumah > pangkalan data > tutorial mysql > Penjelasan terperinci tentang set aksara dan peraturan pengumpulan dalam MySQL

Penjelasan terperinci tentang set aksara dan peraturan pengumpulan dalam MySQL

WBOY
Lepaskan: 2023-06-14 14:01:30
asal
3399 orang telah melayarinya

MySQL ialah sistem pengurusan pangkalan data hubungan yang digunakan secara meluas Untuk menyokong set aksara dan peraturan penyusunan antara bahasa dan budaya yang berbeza, MySQL menyediakan pelbagai set aksara dan tetapan penyusunan.

Set aksara dan penyusunan adalah konsep yang sangat penting dalam MySQL dan memainkan peranan penting dalam penyimpanan data dan proses pertanyaan. Mari kita lihat dengan lebih dekat set aksara dan peraturan pengumpulan dalam MySQL.

1. Set aksara

Set aksara dalam MySQL menentukan cara data disimpan dalam pangkalan data termasuk ASCII, UTF-8, GB2312, dsb. Set aksara yang biasa digunakan dan maknanya adalah seperti berikut:

  1. ASCII

ASCII ialah standard pengekodan aksara 7-bit yang digunakan untuk mewakili aksara Inggeris, nombor dan simbol asas, Pengekodan aksara biasa yang berkenaan dalam sistem Bahasa Inggeris. Set aksara berkod ASCII mempunyai 128 aksara, termasuk aksara kawalan seperti suapan baris dan tab.

  1. UTF-8

UTF-8 ialah kod universal yang boleh mewakili semua aksara di dunia, termasuk aksara bukan abjad Latin seperti aksara Cina. Ia menggunakan pengekodan panjang berubah-ubah, dan panjang pengekodan setiap aksara adalah berbeza, biasanya menggunakan 1 hingga 4 bait. Pengekodan UTF-8 mengikut standard Unicode dan merupakan kaedah pengekodan aksara moden yang telah menjadi set aksara yang digunakan secara meluas di Internet.

  1. GB2312

GB2312 ialah set aksara Cina yang boleh mewakili aksara seperti aksara Cina, Inggeris dan nombor Ia telah digubal oleh Jawatankuasa Pentadbiran Standardisasi Kebangsaan pada tahun 1980. Set aksara GB2312 termasuk perpustakaan aksara standard yang terdiri daripada 3755 aksara Cina ringkas dan 682 aksara bukan Cina.

Di atas adalah set aksara biasa MySQL juga menyokong set aksara lain, seperti Latin1, GBK, dsb. Apabila mencipta pangkalan data atau jadual, anda perlu menentukan set aksara yang digunakan, contohnya:

CIPTA PANGKALAN DATA test_database SET CHARACTER utf8;

2. Peraturan penyusunan tentukan kaedah Isih data, peraturan pengisihan biasa termasuk ASCII, UTF-8, GB2312, dsb.

Hubungan antara set aksara dan himpunan
  1. Set aksara dan himpunan dalam MySQL adalah berkaitan antara satu sama lain Contohnya, apabila menggunakan set aksara Cina, anda perlu untuk memilih yang sepadan Susun pesanan dengan betul.

Peraturan Pengumpulan mempunyai beberapa akhiran biasa:

_ci: tidak sensitif huruf besar, iaitu, huruf besar dan huruf kecil akan dianggap sebagai aksara yang sama semasa mengisih.

_cs: Sensitif huruf besar, iaitu, huruf besar dan huruf kecil akan dianggap sebagai aksara yang berbeza semasa mengisih.

_bin: Gunakan pengisihan binari, iaitu, bandingkan terus nilai binari Contohnya, hasil perbandingan 0x41 dan 0x61 adalah berbeza.

Contohnya, dalam set aksara UTF-8, apabila menggunakan peraturan penyusunan utf8_general_ci, untuk huruf besar dan kecil a dan A, ia dianggap sama apabila mengisih, iaitu kesan ketidakpekaan huruf besar dan kecil. .

Peraturan pengumpulan biasa
  1. Terdapat banyak peraturan pengumpulan untuk dipilih dalam MySQL Berikut ialah beberapa peraturan pengumpulan yang biasa digunakan:

2.1 utf8_general_ci

Ini ialah peraturan pengisihan yang biasa digunakan yang boleh mengabaikan huruf kecil dan menggabungkan serta mengisih aksara seperti diakritik Contohnya, á, à, â dan a akan dianggap sama apabila mengisih.

2.2 utf8_bin

Ini ialah peraturan pengisihan binari yang membezakan perbezaan dalam aksara seperti huruf besar dan huruf kecil, diakritik, dsb., dan melaksanakan pengisihan binari lengkap untuk aksara khas.

2.3 utf8_unicode_ci

Peraturan pengisihan ini boleh mengisih aksara dan nombor pada masa yang sama dan boleh mengisih data yang mengandungi set aksara yang berbeza.

2.4 gb2312_chinese_ci

Ini ialah peraturan pengisihan untuk set aksara Cina Apabila mengisih aksara Cina, Inggeris, nombor dan aksara lain, pastikan aksara Cina diisih mengikut urutan pinyin Cina.

3. Senario aplikasi set aksara dan peraturan penyusunan

Dalam pembangunan sebenar, adalah perlu untuk memilih set watak dan peraturan penyusunan mengikut situasi sebenar. Secara umumnya, situasi berikut memerlukan perhatian khusus:

Storan dan pertanyaan data berbilang bahasa: adalah perlu untuk menggunakan set aksara dan himpunan yang menyokong berbilang bahasa, seperti set aksara UTF-8 dan utf8_unicode_ci peraturan pengisihan.

    Isih aksara khas: Untuk data yang mengandungi aksara khas seperti diakritik, peraturan pengisihan yang sesuai biasanya digunakan untuk mengisih.
  1. Isih data Cina: Untuk data Cina, anda perlu menggunakan set aksara dan peraturan pengumpulan yang menyokong bahasa Cina, seperti set aksara GB2312 dan peraturan pengumpulan gb2312_chinese_ci.
  2. Pertanyaan data sensitif: Untuk situasi di mana pertanyaan data sensitif diperlukan, adalah disyorkan untuk menggunakan peraturan pengisihan sensitif huruf besar-besaran.
  3. Ringkasan:
Set aksara dan peraturan penyusunan dalam MySQL ialah konsep yang sangat penting dalam pangkalan data dan memainkan peranan penting dalam penyimpanan data dan proses pertanyaan. Dalam pembangunan sebenar, adalah perlu untuk memilih set aksara yang sesuai dan peraturan pengisihan mengikut situasi sebenar untuk memastikan penyimpanan dan pertanyaan data yang betul.

Atas ialah kandungan terperinci Penjelasan terperinci tentang set aksara dan peraturan pengumpulan dalam MySQL. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan