Les documents XML peuvent contenir des caractères étrangers comme le norvégien ou le français (le chinois, bien sûr ! Cette partie ne peut toujours pas être traduite selon le texte original, une partie du contenu ci-dessous est écrite par moi-même)
Afin de rendre votre l'analyseur comprend ces caractères, vous devez unifier les normes de codage des caractères dans les documents XML.
Bloc-notes Windows 95/98
Le Bloc-notes Windows 95/98 ne peut pas enregistrer les fichiers au format d'encodage Unicode.
Vous pouvez utiliser Note pour modifier et enregistrer des documents XML contenant des caractères étrangers (par exemple : norvégien ou français ou chinois)
<?xml version="1.0"?> <note> <from>小奀</from> <to>小林</to> <message>晚上一起去火锅呀</message> </note>
Mais si vous l'ouvrez avec un navigateur XML les documents modifiés avec le Bloc-notes auront une erreur lors de leur ouverture avec IE 5.0.
Utilisation de l'encodage dans le Bloc-notes Windows 95/98
L'attribut d'encodage doit être défini lors de la modification de fichiers XML dans le Bloc-notes Windows 95/98.
Afin d'éviter les erreurs, vous pouvez ajouter un attribut d'encodage à la déclaration du document XML pour indiquer le type d'encodage de ce document XML, mais n'utilisez pas l'encodage Unicode.
Les types d'encodage suivants ne provoqueront pas d'erreurs et les caractères chinois s'afficheront normalement :
<?xml version="1.0" encoding="gb2312"?>
Les types d'encodage suivants ne provoqueront pas d'erreurs et Les caractères chinois s'afficheront normalement. Normal :
<?xml version="1.0" encoding="gbk"?>
Les types d'encodage suivants ne provoqueront pas d'erreurs et les caractères chinois s'afficheront anormalement (caractères tronqués) :
<?xml version="1.0" encoding="windows-1252"?>
Les types d'encodage suivants ne provoqueront pas d'erreurs et les caractères chinois ne s'afficheront pas normalement (caractères tronqués) :
<?xml version="1.0" encoding="ISO-8859-1"?>
Les types d'encodage suivants ne provoqueront pas d'erreurs et les caractères chinois s'affichent normalement :
<?xml version="1.0" encoding="UTF-8"?>
Le Les types d'encodage suivants provoqueront des erreurs :
<?xml version="1.0" encoding="UTF-16"?>
Utilisation du Bloc-notes Windows 2000
Le Bloc-notes Windows 2000 peut enregistrer des fichiers au format d'encodage Unicode.
Le Bloc-notes pour Windows 2000 prend en charge le jeu de caractères Unicode. Si vous utilisez le Bloc-notes Win2000 pour enregistrer le document XML au format d'encodage Unicode (veuillez noter qu'il n'y a aucune information d'encodage dans la déclaration XML) :
<?xml version="1.0"?> <note><from>小奀</from><to>小林</to><message>晚上一起去火锅呀</message></note>
Le fichier suivant : note_encode_none_u. xml, l'erreur ne se produira pas dans IE5.0, mais si vous utilisez Netscape 6.2, une erreur peut se produire. Les lecteurs comparent les deux fichiers note_encode_none.xml et note_encode_none_u.xml s'ils examinent leurs fichiers sources respectifs séparément, il n'y a pas de différence, mais pourquoi l'un peut-il être affiché et l'autre ne peut pas l'être ? La réponse est le jeu de caractères Unicode.
Encodage du Bloc-notes Windows 2000
Le Bloc-notes Windows 2000 peut également enregistrer des fichiers au format d'encodage "UTF-16".
Si vous déclarez l'attribut d'encodage dans le document XML et enregistrez le fichier au format d'encodage Unicode, une erreur peut survenir.
Le code suivant provoquera une erreur :
<?xml version="1.0" encoding="windows-1252"?>
Le code suivant provoquera une erreur :
<?xml version="1.0" encoding="ISO-8859-1"?>
Le code suivant provoquera une erreur :
<?xml version="1.0" encoding="UTF-8"?>
Le fichier suivant note_encode_utf16_u.xml, le sera-t-il ? s'affiche normalement dans IE5.0, mais une erreur se produira dans le navigateur Netscape 6.2.
<?xml version="1.0" encoding="UTF-16"?>
Message d'erreur
Lors de la navigation dans des documents XML à l'aide d'IE5.0 ou supérieur, vous pouvez rencontrer deux erreurs d'encodage différentes :
Un caractère invalide a été trouvé dans le contenu du texte.
Si votre document XML ne correspond pas au format d'encodage de votre document XML, une erreur peut survenir. Habituellement, le document XML contient des caractères « non anglais », un éditeur de codage à un octet est utilisé et le format de codage du document XML n'est pas défini dans la déclaration du document XML.
Le passage de l'encodage actuel à l'encodage spécifié n'est pas pris en charge.
Si le document XML est enregistré au format de codage Unicode/UTF-16, mais que la déclaration du document XML définit le format de codage sur un codage sur un seul octet (tel que Windows-1252, ISO-8859-1 ou UTF -8) ; Ou bien le document XML est enregistré dans un format de codage sur un seul octet, mais la déclaration du document XML définit le format de codage comme étant une forme de codage Unicode/UTF-16. Dans les deux cas, des erreurs se produiront.
Conclusion
Conclusion : Définissez le format d'encodage du document dans la déclaration du document XML avant de l'enregistrer. Certaines de mes suggestions pour éviter les erreurs :
Utilisez un format d'encodage prenant en charge l'éditeur Unicode.
Assurez-vous de savoir quel encodage vous utilisez.
Utilisez les déclarations d'attributs dans les documents XML pour définir le format d'encodage.