Correction des caractères UTF8 à double codage
Un codage de caractères incorrect peut entraîner des anomalies de données, telles que la conversion de caractères espagnols comme "ñ" à "ñ." Le double encodage des caractères UTF8, qui se produit lorsqu'un fichier CSV est interprété par erreur comme codé en Latin1 puis à nouveau codé en UTF8, est une cause fréquente de ce problème.
Pour résoudre ce problème et restaurer le caractère souhaité représentation, MySQL fournit une fonction spécialisée :
CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8)
Cette fonction prend la chaîne doublement codée, la reconvertit d'abord en chaîne binaire Latin1 à l'aide de CONVERT (champ USING latin1), puis la réencode correctement en UTF8 en utilisant CONVERT(...) AS BINARY) USING utf8).
Pour appliquer la correction à vos données, utilisez l'instruction de mise à jour suivante :
UPDATE tablename SET field = CONVERT(CAST(CONVERT(field USING latin1) AS BINARY) USING utf8);
Cette instruction sera mettre à jour le champ spécifié dans la table tablename, en remplaçant les caractères doublement codés par leurs équivalents UTF8 corrects. En gérant correctement le codage des caractères, vous pouvez garantir l'intégrité et l'exactitude de vos données.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!