Cet article présente principalement les concepts de base et le didacticiel d'introduction à la syntaxe du langage de balisage XML. XML est également largement utilisé pour marquer les données en tant que format d'échange de données XML. Les amis dans le besoin peuvent s'y référer
XML. signifie Extensible Markup Language. Il s'agit d'un langage de balisage textuel dérivé du langage de balisage standard généralisé (SGML).
Les balises XML identifient les données et sont utilisées pour stocker et organiser les données, plutôt que de spécifier comment les afficher, comme le HTML, qui est utilisé pour afficher les données. XML ne remplacera pas HTML dans un avenir proche, mais il introduit des possibilités en adoptant de nombreuses fonctionnalités à succès trouvées dans HTML.
Voici trois fonctionnalités importantes de XML qui le rendent utile pour une grande variété de systèmes et de solutions :
XML est extensible : XML nous permet de créer nos propres applications adaptées. Une balise auto-descriptive ou la langue d'un programme.
XML transporte des données, mais ne les restitue pas : XML nous permet de stocker des données quelle que soit la manière dont elles seront restituées.
XML est un standard public : XML a été développé par une organisation appelée le World Wide Web Consortium (W3C) et il est disponible en tant que standard ouvert.
Objectifs de XML
Cette courte liste d'utilisations de XML dit tout :
XML peut fonctionner en coulisses pour simplifier la création de documents HTML pour les grands sites Web.
XML peut être utilisé pour échanger des informations entre des organisations et des systèmes.
XML peut être utilisé pour décharger et recharger la base de données.
XML peut être utilisé pour stocker et organiser des données, et peut également personnaliser les besoins de traitement des données.
XML facilite l'incorporation de feuilles de style pour créer presque n'importe quelle sortie souhaitée.
En fait, tout type de données peut être représenté sous forme de document XML.
Que sont les tags ?
XML est un langage de balisage qui définit un ensemble de règles pour encoder des documents dans un format lisible par l'homme et par la machine. Alors, qu’est-ce qu’un langage de balisage exactement ? Le balisage est une information ajoutée à un document qui améliore sa signification d'une manière ou d'une autre. Il identifie les parties et leurs relations les unes avec les autres. Plus précisément, un langage de balisage est un ensemble de symboles qui peuvent être placés dans le texte d'un document pour diviser et marquer certaines parties du document.
L'exemple suivant montre à quoi ressemble une balise XML incorporée dans un bloc de texte :
<message> <text>Hello, world!</text> </message>
Ce fragment contient des symboles de balisage, ou des balises, tels que < ;message>... et
XML est-il un langage de programmation ?
Un langage de programmation utilisé pour créer des programmes informatiques se compose de règles de syntaxe et de son propre vocabulaire. Ces programmes demandent à l'ordinateur d'effectuer des tâches spécifiques. XML n'est pas considéré comme un langage de programmation car il n'effectue aucun calcul ni algorithme. Il est généralement stocké dans un simple fichier texte et traité par un logiciel spécial capable d'interpréter XML.
Syntaxe XML
Ce qui suit est un document XML complet :
<?xml version="1.0"?> <concat-info> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </concat-info>
Vous pouvez remarquer qu'il existe deux types d'informations :
balises, telles que
Données texte ou caractères, telles que _Tutorials Point et (011) 123-4567_.
La figure suivante décrit les règles de syntaxe pour l'écriture de différents types de balisage et de texte dans les documents XML :
Examinons de plus près chaque composant de la figure ci-dessus :
Déclaration XML
Les documents XML peuvent avoir une déclaration XML facultative. Il peut être écrit sous la forme suivante :
<?xml version="1.0" encoding="UTF-8"?>
Ici version est la version XML, et encoding précise l'encodage des caractères utilisé dans le document.
Règles de syntaxe pour la déclaration XML
La déclaration XML est sensible à la casse et doit commencer par "", où "xml" est en minuscule .
Si le document contient une déclaration XML, celle-ci doit être la première instruction du document XML.
La déclaration XML doit être la première instruction du document XML.
La valeur d'encodage spécifiée dans la déclaration XML peut être remplacée à l'aide d'un protocole HTTP.
Balises et éléments
La structure d'un fichier XML est constituée de plusieurs éléments XML, également appelés nœuds XML ou balises XML. Le nom d'un élément XML est placé entre crochets < > comme suit :
<element>
Règles de syntaxe pour les balises et les éléments
Syntaxe des éléments : chaque élément XML doit être fermé. ou avec des éléments d'ouverture et de fermeture, comme ceci :
<element>....
ou en abrégé comme ceci :
<element/>
Éléments imbriqués : un élément XML peut contenir plusieurs éléments XML comme enfant éléments, mais les éléments enfants ne peuvent pas se chevaucher. Par exemple, la balise de fermeture d'un élément doit avoir le même nom que la balise d'ouverture correspondante la plus récente.
L'exemple suivant montre des balises imbriquées incorrectes :
<?xml version="1.0"?> <contact-info> <company>TutorialsPoint <contact-info> </company>
L'exemple suivant montre des balises imbriquées correctes :
<?xml version="1.0"?> <contact-info> <company>TutorialsPoint</company> <contact-info>
Élément racine : Un document XML ne possède qu'un seul élément racine. Par exemple, le document suivant est un document XML incorrect car les éléments x et y apparaissent au niveau supérieur sans élément racine :
<x>...</x> <y>...</y>
下面的例子展示了正确形式的 XML 文档:
<root> <x>...</x> <y>...</y> </root>
区分大小写: XML 元素的名称区分大小写。这意味着元素的起始和结束标签大小写必须一样。
例如
属性
attribute 使用名/值对给元素指定一个属性(property)。一个 XML 元素可以有一个或多个属性(attributes)。例如:
<a href="http://www.php.cn/">Tutorialspoint!</a>
这里 href 就是属性名称,而 http://www.php.cn/ 就是属性值。
XML 属性的语法规则
XML 属性名区分大小写(和 HTML 不一样)。也就是说 HREF 和 href 会被认为是两个不同的 XML 属性。
在语法中相同的属性不能有两个。下面的例子展示了不正确的语法,因为属性 b 被指定了两次:
<a b="x" c="y" b="z">....</a>
属性名定义不带引号标记,而属性值必须显示在引号标记中。下面的例子演示了不正确的 XML 语法:
<a b=x>....</a>
在上面的语法中,属性值没有定义在引号标记中。
XML 引用
引用 通常允许我们在 XML 文档中添加或包含附加的文本。引用始终以符号 "&" 开始,这是一个保留字符,以符号 ";" 结尾。XML 中有两种类型的引用:
实体引用: 一个实体引用的起始和结束定界符之间包含一个名称。比如 &,其中 amp 就是名称。这个 name 通常指向一个预定义的文本字符串或标记。
字符引用: 这些包含引用比如 A 包含一个 hash 标记("#"),后面紧跟一个数字。这个数字始终指向一个字符的 Unicode 码。在这里,65 指向字母 "A"。
XML 文本
XML 元素和 XML 属性的名称区分大小写。这意味着元素的开始和结束标签大小写必须一致。
为了避免字符编码的问题,所有的 XML 文件都应该保存为 Unicode UTF-8 或者 UTF-16 文件。
空白字符,比如空格,制表符以及 XML 元素和 XML 属性之间换行符会被忽略。
有些字符是 XML 语法本身保留的。因此,不能直接使用它们。要使用它们,就要使用一些替代实体。下面列出了一些:
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!