Tajuk baharu: Skrip baharu tidak memaparkan pengekodan aksara pelik bagi data yang disimpan dengan betul

Question

Saya cuba menulis semula laman web lama. Ia dalam bahasa Parsi dan menggunakan aksara Parsi/Arab. CREATEDATABASE`db`DEFAULTCHARACTERSETutf8COLLATEutf8_persian_ci;USE`db`;Hampir semua jadual/lajur saya COLLATE ditetapkan kepada utf8_persian_ci Saya menggunakan codeigniter untuk skrip baharu saya dan saya mempunyai 'char_set'=>'utf8'='dbcollat

P粉257342166 · Answer

jawapan deceze sangat bagus, tetapi saya boleh menambah beberapa maklumat yang mungkin membantu mengendalikan sejumlah besar rekod tanpa perlu mengujinya secara manual.

Jika anda menukar CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) 失败，则会打印 NULL 而不是 field_name kandungan.

Jadi saya menggunakan ini untuk mencari rekod tersebut:

SELECT IFNULL(
    CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8)
    , '**************************************************')
FROM table_name

Atau ini:

SELECT id, field_name, CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8)
FROM table_name
WHERE CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) IS NULL

UPDATE dengan klausa ini hanya mempengaruhi rekod yang penukaran berjaya:

UPDATE table_name
SET
field_name = CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8mb4 )
WHERE
CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8mb4) IS NOT NULL

P粉663883862 · Answer

Ringkasnya, kerana soalan ini telah dibincangkan seribu kali sebelum ini:

PHP menyimpan rentetan, seperti "汉字"，以 UTF-8 编码。该字节为 E6 BC A2 E5 AD 97.
Ia menghantar rentetan ini melalui latin1sambungan pangkalan data yang ditetapkan kepada .
Pangkalan data menerima bait E6 BC A2 E5 AD 97，认为它们代表 latin1E6 BC A2 E5 AD 97 dan menganggap ia mewakili
Watak storan pangkalan data
æ¡ ¡ ¿ Li>

Proses yang sama secara terbalik menyebabkan PHP menerima bait yang sama dan kemudian menganggapnya sebagai UTF-8. Perjalanan pergi dan balik berfungsi dengan baik untuk PHP, walaupun pangkalan data tidak mengendalikan aksara seperti yang sepatutnya.

Jadi masalah di sini ialah sambungan pangkalan data tidak disediakan dengan betul apabila data dimasukkan ke dalam pangkalan data. Anda perlu menukar data dalam pangkalan data kepada aksara yang betul. Cuba ini:

SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name

utf8 不是您所需要的，请尝试一下。如果有效，请将其更改为 UPDATEMungkin utf8 bukan yang anda perlukan, sila cuba. Jika ia berfungsi, tukar kepada pernyataan 🎜KEMASKINI untuk mengemas kini data secara kekal. 🎜