XMLLes documents peuvent contenir des caractères étrangers tels que le norvégien ou le français (le chinois est également acceptable ! Cette partie ne peut toujours pas être traduite selon le texte original, une partie du contenu ci-dessous est écrite par moi-même)
Pour que votre analyseur comprenne ces caractères, vous devez adopter une norme de codage de caractères cohérente dans le document XML.
------------------------------------------------------ ------ ------------------------------------
Windows 95 /98 Notepad
Le Bloc-notes Windows 95/98 ne peut pas enregistrer les fichiers au format de codage Unicode.
Vous pouvez utiliser le Bloc-notes pour modifier et enregistrer des documents XML contenant des caractères étrangers (par exemple : norvégien ou français ou chinois)
<?xml version="1.0"?> <note> <from>小奀</from> <to>小林</to> <message>晚上一起去火锅呀</message> </note>
Mais si vous l'ouvrez avec un navigateur, utilisez le Bloc-notes pour documents XML modifiés, une erreur apparaîtra.
------------------------------------------------------ ------ ------------------------------------
sous Windows Bloc-notes 95/98 Pour utiliser l'encodage
Bloc-notes Windows 95/98 pour éditer des fichiers XML, l'attribut d'encodage doit être défini.
Afin d'éviter les erreurs, vous pouvez ajouter un attribut d'encodage à la déclaration du document XML pour indiquer le type d'encodage de ce document XML, mais n'utilisez pas l'encodage Unicode.
Le type d'encodage suivant ne provoquera pas d'erreurs et les caractères chinois s'afficheront normalement :
<?xml version="1.0" encoding="gb2312"?>
Les types d'encodage suivants ne provoqueront pas d'erreurs et les caractères chinois s'afficheront normalement :
<?xml version="1.0" encoding="gbk"?>
Les types d'encodage suivants ne provoqueront pas d'erreurs et les caractères chinois s'afficheront anormalement (caractères tronqués) :
<?xml version="1.0" encoding="windows-1252"?>
Les types d'encodage suivants ne provoqueront pas d'erreurs. provoquer des erreurs et les caractères chinois ne s'afficheront pas normalement (caractères tronqués) : Affichage anormal (caractères tronqués) :
<?xml version="1.0" encoding="ISO-8859-1"?>
Le type d'encodage suivant ne provoquera pas d'erreurs et les caractères chinois s'afficheront normalement :
<?xml version="1.0" encoding="UTF-8"?>
Le type d'encodage suivant entraînera une erreur :
<?xml version="1.0" encoding="UTF-16"?>
--------------- ------------------ -------------------------------- ------------------
Utiliser le Bloc-notes Windows 2000
Le Bloc-notes Windows 2000 peut enregistrer des fichiers au format d'encodage Unicode.
Le Bloc-notes pour Windows 2000 prend en charge Unicodejeu de caractères. Si vous utilisez le Bloc-notes Win2000 pour enregistrer le document XML au format d'encodage Unicode (veuillez noter qu'il n'y a aucune information d'encodage dans la déclaration XML) :
<?xml version="1.0"?> <note><from>小奀</from><to>小林</to><message>晚上一起去火锅呀</message></note>
------------ - ------------------------------------------------- - ----------------
Encodage du Bloc-notes Windows 2000
Le Bloc-notes Windows 2000 peut également enregistrer des fichiers au format d'encodage "UTF-16".
Si vous déclarez l'attribut d'encodage dans le document XML et enregistrez le fichier au format d'encodage Unicode, une erreur peut survenir.
Le code suivant provoquera une erreur :
<?xml version="1.0" encoding="windows-1252"?>
Le code suivant provoquera une erreur :
<?xml version="1.0" encoding="ISO-8859-1"?>
Le code suivant provoquera une erreur :
<?xml version="1.0" encoding="UTF-8"?>
Le fichier suivant : note_encode_utf16_u.xml, s'affichera normalement dans IE5.0+, mais provoquera une erreur dans le navigateur Netscape 6.2.
<?xml version="1.0" encoding="UTF-16"?>
-------------------------------------- --- ------------------------------------------
Message d'erreur
Lorsque vous utilisez IE5.0 ou supérieur pour parcourir des documents XML, vous pouvez rencontrer deux erreurs d'encodage différentes :
Un caractère illégal a été trouvé dans le texte content (Un caractère invalide a été trouvé dans le contenu du texte).
Si votre document XML ne correspond pas au format d'encodage de votre document XML, une erreur peut survenir. Habituellement, le document XML contient des caractères « non anglais » et utilise un Éditeur de codage sur un seul octet, et le format de codage du document XML n'est pas défini dans la déclaration du document XML.
Passer de l'encodage actuel à l'encodage spécifiésiied non pris en charge).
Si le document XML est enregistré au format de codage Unicode/UTF-16, mais que la déclaration du document XML définit le format de codage sur un seul octet (tel que Windows-1252, ISO-8859- 1 ou UTF -8) ou le document XML est enregistré dans un format de codage sur un seul octet, mais la déclaration du document XML définit le format de codage comme étant une forme de codage Unicode/UTF-16. Les deux situations provoqueront des erreurs. ------------------------------------------------------ ------ ------------------------------------ConclusionConclusion : Enregistrer Avant de définir le format d'encodage du document dans la déclaration du document XML, quelques-unes de mes suggestions pour éviter les erreurs :
Assurez-vous de savoir quel encodage vous utilisez.
Utilisez les déclarations d'attributs dans les documents XML pour définir le format d'encodage.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!