Encodage de caractères en JSON : comprendre la représentation Unicode
Les caractères Unicode peuvent être codés en JSON en utilisant différents formats. Une méthode couramment utilisée par la fonction json_encode de PHP est la séquence d'échappement "u". Ce format représente les caractères sous forme de points de code hexadécimaux, tels que :
"foo": "\u99ac"
Cette séquence d'échappement est un JSON valide et sera interprétée correctement par les analyseurs JSON conformes, ce qui donnera la chaîne "馬".
Pourquoi les séquences d'échappement sont préférées
Par défaut, json_encode de PHP préfère utilisez des séquences d'échappement pour les caractères non-ASCII. Bien que cela ne soit pas esthétique, cela est parfaitement valable et n'affecte pas l'intégrité des données.
Avantages des séquences d'échappement
Activation du littéral Caractères
Si vous préférez représenter des caractères Unicode sans séquences d'échappement, vous pouvez spécifier le Indicateur JSON_UNESCAPED_UNICODE lors de l'appel de json_encode. Cela entraînera la sortie des caractères au format UTF-8 littéral :
"foo": "馬"
Conclusion
Les séquences d'échappement et les caractères littéraux sont des moyens valides pour représenter Unicode en JSON. . Le choix de la méthode à utiliser dépend des préférences et des exigences spécifiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!