Neuer Titel: Neues Skript zeigt seltsame Zeichenkodierung gespeicherter Daten nicht korrekt an

Question

Ich versuche, eine alte Website neu zu schreiben. Es ist auf Persisch und verwendet persische/arabische Zeichen. CREATEDATABASE`db`DEFAULTCHARACTERSETutf8COLLATEutf8_persian_ci;USE`db`;Fast alle meine Tabellen/Spalten COLLATE sind auf utf8_persian_ci gesetzt. Ich verwende Codeigniter für mein neues Skript und habe 'char_set'=>'utf8','dbcollat'=&g

P粉257342166 · Answer

deceze的答案非常好，但我可以添加一些信息，这些信息可能有助于处理大量记录，而无需手动测试它们.

如果转换 CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) 失败，则会打印 NULL 而不是 field_name 内容。

所以我用这个来查找那些记录：

SELECT IFNULL(
    CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8)
    , '**************************************************')
FROM table_name

或者这个：

SELECT id, field_name, CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8)
FROM table_name
WHERE CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) IS NULL

带有该子句的 UPDATE 仅影响转换成功的记录：

UPDATE table_name
SET
field_name = CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8mb4 )
WHERE
CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8mb4) IS NOT NULL

P粉663883862 · Answer

简而言之，因为这个问题之前已经讨论过一千次了：

PHP 保存一个字符串，例如 "汉字"，以 UTF-8 编码。该字节为 E6 BC A2 E5 AD 97。
它通过设置为 latin1 的数据库连接发送此字符串。
数据库收到字节 E6 BC A2 E5 AD 97，认为它们代表 latin1 字符。
数据库存储字符 æ¡¡¿李>
相反的相同过程使 PHP 接收相同的字节，然后将其视为 UTF-8。尽管数据库没有按应有的方式处理字符，但往返对于 PHP 来说工作得很好。

所以这里的问题是数据录入数据库时数据库连接设置不正确。您必须将数据库中的数据转换为正确的字符。试试这个：

SELECT CONVERT(BINARY CONVERT(field_name USING latin1) USING utf8) FROM table_name

也许 utf8 不是您所需要的，请尝试一下。如果有效，请将其更改为 UPDATE 语句以永久更新数据。