Cet article présente principalement les problèmes d'encodage et de vérification de l'écriture de code XML. Semblable au HTML, l'encodage des fichiers XML peut également être spécifié dans le préambule. Les amis dans le besoin peuvent se référer à
Encodage.
Le codage est le processus de conversion des caractères Unicode en représentations binaires équivalentes. Lorsqu'un gestionnaire XML lit un document XML, il s'appuie sur le type de codage pour coder le document. Par conséquent, nous devons spécifier le type de codage dans la déclaration XML.
Type d'encodage
Il existe deux principaux types d'encodage :
UTF-8
UTF-16
UTF représente le format de conversion UCS, et UCS lui-même signifie jeu de caractères universel . Le chiffre 8 ou 16 indique le nombre de bits pour représenter le caractère. Ils sont au nombre de 8 (un octet) ou 16 (deux octets). Pour les documents sans informations de codage, UTF-8 est utilisé par défaut.
Syntaxe
Les informations d'encodage sont contenues dans le prologue du document XML. La syntaxe du codage UTF-8 est la suivante :
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
La syntaxe du codage UTF-16 est la suivante :
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
Exemple
L'exemple suivant montre la déclaration d'encodage :
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>Tanmay Patil TutorialsPoint (011) 123-4567
Dans l'exemple encoding="UTF-8" ci-dessus, il est spécifié d'utiliser 8 caractères de 3 bits. Pour utiliser 16 caractères, utilisez le codage UTF-16.
Les fichiers XML codés en UTF-8 sont plus petits que les fichiers au format UTF-16.
Validation
La validation est le processus de validation des documents XML. Un document est considéré comme valide si son contenu correspond aux éléments, attributs et définition de type de document (DTD) associé, et si le document est conforme aux contraintes exprimées par b. Il existe deux manières de gérer la validation via un analyseur XML. Ce sont :
Document XML bien formé
Document XML valide
Document XML bien formé
Un document XML est considéré comme bien formé s'il suit les règles suivantes.
Les documents XML sans DTD doivent utiliser des entités de caractères prédéfinies pour gérer amp(&), apos (guillemet simple), g(>), quot (guillemet double).
Doit suivre l'ordre des balises, par exemple, les balises internes doivent être fermées avant que les balises externes ne soient fermées.
Chaque balise de début doit avoir une balise de fin ou doit être une balise à fermeture automatique (
Ce qui suit est un exemple de document XML bien formé :
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> <!DOCTYPE address [ <!ELEMENT address (name,company,phone)> <!ELEMENT name (#PCDATA)> <!ELEMENT company (#PCDATA)> <!ELEMENT phone (#PCDATA)> ]> <address> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </address>
L'exemple ci-dessus est considéré comme bien formé car :
Il définit le type de document. Et ici, le type de document est le type d'élément.
contient un élément racine nommé adresse.
Chaque nom d'élément enfant, entreprise et téléphone est une balise explicite et correctement fermée.
Les tags sont dans le bon ordre.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!