Maison > développement back-end > Tutoriel XML/RSS > Notes d'étude Crazy XML (2) -------------Exigences de format

Notes d'étude Crazy XML (2) -------------Exigences de format

黄舟
Libérer: 2017-02-21 14:04:18
original
1618 Les gens l'ont consulté

Syntaxe de XML

 Un fichier XML est divisé en les parties suivantes :

 Document Déclaration

Élément

Attributs

 Zone CDATA, caractères spéciaux

 Instructions de traitement (instruction de traitement)

Déclaration de Xml

La déclaration la plus simple est

Encodage

attribut

 : Encodage des caractères s'il n'est pas spécifié, la valeur par défaut est UTF-8 encodage

Jeu de caractères commun Chinois simplifié :

GBK

ou GB2312

Chinois traditionnel  : BIG5Caractères d'Europe occidentale

 : ISO8859-1

Encodage international universel

 : Unicode UTF-8

Cas de démonstration :

<Chine>Chine

>

La cause de l'erreur est : Erreur d'encodage


Décodé en caractères

tr>


解码成字符

xml document lorsque le jeu de caractères est incorrect




新建是一个.txt文档

保存的是.xml UTF-8

默认的编码ANSI

中国


写入到硬盘

编码成二进制码

00 11

Le nouveau est un document


磁盘文件

.txtCelui enregistré est .xml UTF-8 Encodage par défautANSI Chine
Écrire sur le disque durEncodé en code binaire00 11
Fichier disque

Autonome :Spécifiez si le document doit référencer d'autres ressources,La valeur de l'attribut est uniquement : oui ou non

Oui : indépendantNon : non indépendant

Le fichier XML, comme le fichier HTML, est en fait un fichier texte.

Évidemment, tout le monde comprendra immédiatement que l'outil le plus courant pour créer des fichiers XML est le même que le HTML, à savoir le "Bloc-notes".

En plus de "Notepad", il existe bien sûr des outils plus pratiques, tels que XML Notepad, XML Pro et CLIP ! Éditeur XML, etc.,

Une caractéristique majeure de ces outils est qu'ils peuvent vérifier si le fichier XML que vous créez est conforme à la spécification XML. Cependant, ces outils ne sont actuellement disponibles qu’en anglais et sont payants.

Bien sûr, vous pouvez toujours utiliser des outils tels que FrontPage et DreamWeaver, mais ils ne sont pas très pratiques à utiliser.

Avec la popularité progressive du XML, je pense que des outils très utiles pour créer des fichiers XML apparaîtront dans un avenir proche.
Utilisons maintenant "Notepad" pour créer notre fichier XML. Regardez d'abord un fichier XML :


Exemple 1


〈 ? xml version="1.0" encoding="gb2312" ?〉
〈Références〉
〈Livres〉
〈Nom〉Introduction à XML 〈/nom〉
〈Auteur〉Zhang San〈/Auteur 〉
〈Unité monétaire du prix="RMB"〉20,00〈/Prix〉
〈/Livre〉
〈Livre〉
〈Nom〉Syntaxe XML〈/Nom〉
〈 !-- Ce le livre sera bientôt publié--〉
〈Auteur〉李思〈/Auteur〉
〈Price Currency Unit="RMB"〉18.00〈/Price〉
〈/Book〉
〈/Référence Matériaux 〉


Il s'agit d'un fichier XML typique Après l'édition, enregistrez-le sous forme de fichier avec le suffixe .xml. Nous pouvons diviser ce fichier en deux parties principales : le préambule du fichier (Prolog) et le corps du fichier.

La première ligne de ce fichier est le préambule du fichier. Cette ligne est quelque chose qu'un fichier XML doit déclarer, et elle doit également être située sur la première ligne du fichier XML. Elle indique principalement à l'analyseur XML comment fonctionner.

Parmi eux, la version indique le numéro de version standard utilisé dans ce fichier XML, qui est obligatoire ; l'encodage indique le type de caractère utilisé dans ce fichier XML, qui peut être omis. Lorsque vous omettez cette instruction, le suivant. le code de caractère doit être un code de caractère Unicode (il est recommandé de ne pas l'omettre)

. Étant donné que nous utilisons le code de caractères GB2312 dans cet exemple, l'instruction de codage ne peut pas être omise. Il y a également quelques déclarations dans le préambule du dossier, que nous présenterons plus tard.


Le reste du fichier appartient au corps du fichier, où les informations sur le contenu du fichier XML sont stockées.

Nous pouvons voir que le corps principal du fichier est composé des balises de contrôle de début et de fin . C'est ce qu'on appelle « l'élément racine » du fichier XML ; est utilisé comme direct Il appartient aux « éléments enfants » sous l'élément racine ; sous il y a des sous-éléments tels que , et . L'unité monétaire est un « attribut » dans l'élément et « RMB » est la « valeur de l'attribut ».


Tout d'abord, la première ligne du fichier XML doit déclarer que le fichier est un fichier XML et la version de la spécification XML qu'il utilise. Il ne peut y avoir d'autres éléments ou commentaires devant le fichier.


Deuxièmement, il ne peut y avoir qu'un seul élément racine dans un fichier XML. Dans notre premier exemple, 〈Références〉... 〈/Références〉 est l'élément racine de ce fichier XML.


Troisièmement, les balises du fichier XML doivent être fermées correctement, c'est-à-dire que dans le fichier XML, la balise de contrôle doit avoir une balise de fermeture correspondante. Par exemple : la balise doit avoir une balise de fermeture correspondante. Contrairement au HTML, la balise de fermeture de certaines balises est facultative. Si vous rencontrez une balise d'unité autonome dans un fichier XML, qui est similaire à Notes d'étude Crazy XML (2) -------------Exigences de format en HTML et n'a pas de balise de fin, XML l'appelle élément "vide". " doit être écrit comme ceci : 〈nom d'élément vide/〉. Si l'élément contient des attributs, il doit être écrit comme ceci : 〈nom d'élément vide nom d'attribut="valeur d'attribut"/〉.


Quatrièmement, les marques ne doivent pas se croiser. Dans le fichier HTML précédent, vous pouviez écrire comme ceci :
〈B〉〈H〉XXXXXXX〈/B〉〈/H〉, 〈B〉 et 〈H〉 Il y a des zones qui se chevauchent entre les balises
, et En XML, un tel entrelacement de balises est strictement interdit et les balises doivent apparaître dans un ordre régulier.


Cinquièmement, les valeurs d'attribut doivent être entourées de signes " ". Tels que "1.0", "gb2312", "RMB" dans le premier exemple. Ils sont tous entourés de symboles « » et ne peuvent être omis.


Sixièmement, les balises de contrôle, les instructions et les noms d'attributs en anglais doivent être sensibles à la casse. Différent du HTML, en HTML, les balises comme et ont la même signification, tandis qu'en XML, les balises comme , ou sont différentes


Septième , nous savons que dans les fichiers HTML, si nous voulons que le navigateur affiche intacts les éléments que nous avons saisis, nous pouvons mettre ces éléments dans 〈pre〉〈/pre〉 ou 〈xmp〉〈/xmp〉 marque le milieu. Ceci est essentiel pour nous de créer des pages Web pédagogiques HTML, car le code source du HTML doit être affiché dans la page Web. En XML, pour réaliser une telle fonction, des balises CDATA doivent être utilisées. Les informations contenues dans la balise CDATA sont transmises intactes à l'application par l'analyseur, et les balises de contrôle du segment d'informations ne sont pas analysées. La zone CDATA est marquée par "


Règles de base pour l'élément Xml

L'unité de base , xml est composé d'éléments imbriqués couche par couche. L'ensemble du document xml commence à partir de l'élément racine , et l'élément racine contient plusieurs sous-éléments , , et chaque sous-élément peut contenir plusieurs sous-éléments , Ainsi, un document xml peut être formé.

Xml syntaxe des balises :

1

, Les tags de >

Tag double :

<Chine>Chine >

2, xml exigences relatives aux balises : 1, les noms de balises peuvent avoir des lettres (

y compris des caractères non européens

) , des chiffres, des traits de soulignement (_), des traits de soulignement (- ), deux points (:)

et point

(.) forment , mais ne peut pas commencer par des chiffres, des tirets et des points. 2, le nom de la balise ne peut pas contenir <, >,,,$ et d'autres symboles

3. Essayez de ne pas avoir de deux-points anglais (:), dans les noms d'étiquettes, sauf si vous utilisez un espace de noms. 4, le nom de la balise ne peut pas commencer par une combinaison de caractères majuscules et minuscules tels que xml

,

XML , etc. 5

. Les noms de balises ne peuvent pas contenir d'espaces.

6, les noms de balises sont sensibles à la casse

3, xml balise les éléments enfants imbriqués : xml permet une imbrication profonde des éléments enfants, à condition qu'une imbrication raisonnable entre les éléments soit assurée. est, . et l'élément xml peuvent imbriquer plusieurs sous-éléments portant le même nom , et ces sous-éléments sont ordonnés.

Premier:xml

<Chine >

<Pékin>

<Haidian/>

<Chaoyang>Chaoyang > 🎜>

Pékin>Chine

>

Deuxième

xml: <

Chine

> <

Pékin

>  <

Chaoyang

>Chaoyang>

<Chaoyang>Chaoyang>

🎜>/>Chine>

4, élément vide : l'élément vide ne peut pas accepter les éléments enfants, ne peut pas non plus accepter contenu de la chaîne.

Le troisième xml :

>

                                                                                                                                                    Et peut accepter plusieurs attributs

                                                                                                                                         🎜>

Par exemple, un élément vide accepte les attributs :

  建议” price=”30”/>

5、字符数据

  

      Struts2开发详解

     

         Struts2开发详解

     

  

  对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理

 如果文本字符中包含了一些特殊的字符,例如<&由于这些字符都有特殊的含义,因此直接在xml文档中使用该字符串将引起文档的混乱。

<表达式>

 

        <比较符>1+3<6比较符>

   表达式>

代表的是文本字符串中包含了特殊的字符

 

有以下两种方法解决:

1、 使用实体引用:用另一个特殊符号代替这些特殊符号

2、使用CDATA标记:将整个文档定义成字符串。

1、  使用实体引用

       

  <表达式>

        <比较符>1+3&<6比较符>

  表达式>

上面的红色的<产生了干扰

解决如下:

 

  <表达式>

        <比较符>1+3<6比较符>

Expression>

2, Utiliser CDATA balises

sous les balises spéciales CDATA, tous les caractères spéciaux , sont même des éléments valides seront traités comme des cordes simples. Les références d'entité perdent également leur effet et deviennent du texte direct. Le format de syntaxe de

CDATA est le suivant :

< ![CDATA[Contenu texte]]>

<expression>

                                                                                 1 3<6

                                                                                                   

Expression>

Remarques : Puisque le document xml n'effectuera aucune analyse sur le contenu du CDATA tag ,

, donc tout contenu peut être placé dans

CDATA, où le contenu n'est jamais faux. 1,

Commentaires

XmlLe document peut également ajouter des données de caractères pour explication, Ces chaînes d'interprétation ne seront pas traitées par l'analyseur xml. Ces textes explicatifs sont appelés notes. Les commentaires de documentation de Xml sont exactement les mêmes que ceux de html

.

String

-->

Xml les commentaires peuvent contenir éléments et balises. Remarque :

1. Les commentaires Xml ne peuvent pas être placés dans le corps de la balise.

2. Ne pas mettre le document xml avant la déclaration du document

xml

xml document La déclaration est toujours sur la première ligne

3 N'utilisez pas de doubles traits de soulignement dans les commentaires

(--)

<.>…..

2. Instructions de traitementInstructions de traitement, visées. comme PI instruction de traitement). Les instructions de traitement sont utilisées pour indiquer au moteur d'analyse comment analyser le contenu du document XML

.

Les

instructions de traitement sont utilisées pour fournir des informations aux applications qui traitent les documents xml indiquent au processeur comment traiter le document. Un programme complet de traitement de documents xml , peut lire les instructions de traitement de documents xml , et effectuer le traitement correspondant conformément aux instructions de traitement, ou passez-le au programme suivant.

XmlLe format de l'instruction de traitement est le suivant :

Traitement du nom de l'instruction de traitement Informations sur la commande?>

Attributs

xmlCaractéristiques des attributs :

1. 2. Le même élément

xml

ne peut pas avoir plusieurs attributs portant le même nom 3. Il n'y a pas d'ordre parmi les multiples attributs dans l'élément

Xml

.

<book>
     <isbn>123456780</isbn>
     <book_name>Java讲义</book_name>
      <price>99</price>
</book>
Copier après la connexion

Par exemple, ce livre
lui-même a un

prix isbn book_name< Les propriétés de 🎜>

puis

<book isbn=”” book_name=”” price=””/>
Copier après la connexion

Xml doit avoir un élément racine.

XmlLa structure globale du document

1 Il doit y avoir une racine. element(

Il y en a et un seul

)2 L'élément doit se terminer raisonnablement <🎜. >

3, Les éléments doivent être raisonnablement imbriqués

4, Les attributs des éléments doivent avoir des valeurs d'attribut

Tant que les conditions ci-dessus ne sont pas remplies, il s'agit d'un document xml mal formaté

Tant que les conditions ci-dessus sont remplies, il s'agit d'un documentxml bien formé

et conforme au dtd ou au schéma est un document

xml

valide. 🎜>Le nœud racine correspond au nœud racine de l'arborescence DOM.

<book>
    <computer>
       <name>网上介绍</name>
       <author>redarmy</author>
    </computer>
    <computer>
        <name>网上介绍</name>
       <author>redarmy</author>
    </computer>
</book>
Copier après la connexion


livre



book

ordinateur


computer


computer

ordinateur


………


computer

………
ordinateur


name

nom


author

auteur

Remarque :

doit avoir une balise racine et la balise racine doit être uniqueLa balise de début et la balise de fin doivent être utilisées par paires

Les balises ne peuvent pas être utilisées de manière interchangeable

Les balises vides peuvent être écrites sous la forme de "<

Nom de la balise

/>

"


La balise est sensible à la casse

Ce qui précède est le contenu des folles notes d'étude XML (2)------------ - exigences de format Pour plus de contenu connexe, veuillez faire attention au site Web PHP chinois (www .php.cn) !
Étiquettes associées:
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal