Gestion des chaînes UTF-8 en PHP : json_encode et JSON_UNESCAPED_UNICODE
Dans les scripts PHP impliquant du contenu multilingue, le comportement de la fonction json_encode peut poser question. On observe que les caractères Unicode finissent souvent sous forme d'entités hexadécimales.
Exemple :
Entrée : echo $text;
Sortie : "База данни грешка."
Entrée : json_encode($text);
Sortie : "u0411u0430u0437u0430 8u0433u0440u0435u0448u043au0430."
Comprendre la conversion
Par défaut, json_encode encode les chaînes Unicode sous forme d'entités hexadécimales. Il s'agit d'une pratique courante en JSON pour garantir la compatibilité avec les anciens systèmes qui peuvent ne pas prendre en charge Unicode.
Solution : JSON_UNESCAPED_UNICODE
Introduit dans PHP 5.4.0, l'indicateur JSON_UNESCAPED_UNICODE vous permet de contourner cette conversion. Lorsqu'il est spécifié, il demande à json_encode de générer directement les caractères UTF-8.
Utilisation :
<code class="php">json_encode($text, JSON_UNESCAPED_UNICODE);</code>
Avec cet indicateur, la sortie conservera son codage de caractères Unicode d'origine. :
<code class="php">\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430.</code>
En utilisant l'indicateur JSON_UNESCAPED_UNICODE, vous pouvez conserver les caractères Unicode d'origine dans votre sortie JSON. Ceci est particulièrement utile lorsque vous travaillez avec du contenu multilingue ou lors de l'intégration avec des systèmes qui nécessitent une véritable prise en charge Unicode.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!