MySQL VARCHAR Lengths and UTF-8: Bytes versus Characters
Apabila mencipta medan VARCHAR dalam jadual MySQL, adalah penting untuk memahami cara panjang yang ditentukan ditafsirkan. Dalam versi MySQL sebelum 4.1, panjang VARCHAR ditakrifkan dalam bait. Walau bagaimanapun, dari MySQL 4.1 dan seterusnya, panjang dikira dalam aksara.
Medan VARCHAR(32) dalam jadual UTF-8 mewakili 32 aksara, bukan 32 bait. Ini kerana UTF-8 ialah pengekodan panjang berubah-ubah, di mana setiap aksara boleh menduduki berbilang bait (sehingga 4 bait).
Dokumentasi MySQL rasmi untuk versi 5 menyatakan:
"MySQL mentafsirkan spesifikasi panjang dalam takrifan lajur aksara dalam unit aksara Ini digunakan untuk CHAR, VARCHAR dan TEKS jenis."
Walau bagaimanapun, panjang maksimum lajur VARCHAR juga dipengaruhi oleh UTF-8. Dalam MySQL 5.0.3 dan lebih baru, panjang maksimum berkesan dihadkan oleh saiz baris (65,535 bait) dan set aksara yang digunakan.
Sebagai contoh, kerana aksara UTF-8 boleh memerlukan sehingga 3 bait setiap aksara , lajur VARCHAR menggunakan UTF-8 boleh diisytiharkan dengan maksimum 21,844 aksara. Ini kerana 21,844 didarab dengan 3 (bait setiap aksara) ialah 65,532, meninggalkan penimbal 3 bait untuk data lajur lain dalam saiz baris maksimum.
Atas ialah kandungan terperinci Bagaimanakah panjang VARCHAR berfungsi dalam MySQL dengan UTF-8: Bait atau Aksara?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!