Extensible Markup Language, un sous-ensemble du Standard Universal Markup Language, est un langage de balisage utilisé pour marquer les fichiers électroniques afin de les rendre structurels. Dans les ordinateurs électroniques, les balises font référence à des symboles d'information que les ordinateurs peuvent comprendre. Grâce à ces balises, les ordinateurs peuvent traiter diverses informations telles que des articles, etc. Il peut être utilisé pour marquer des données et définir des types de données. C'est un langage source qui permet aux utilisateurs de définir leur propre langage de balisage. Il est parfaitement adapté au transport sur le World Wide Web, offrant une approche unifiée pour décrire et échanger des données structurées indépendamment des applications ou des fournisseurs. Il s'agit d'une technologie multiplateforme et dépendante du contenu dans l'environnement Internet, et c'est également un outil efficace pour traiter des informations structurées distribuées aujourd'hui. Dès 1998, le W3C a publié la spécification XML1.0, Utiliser il pour simplifier le transfert d'informations sur les documents sur Internet.
En 1969, GML (Généralisé Langage de balisage Langage de balisage généralisé)---->1985année,SGML (Langage de balisage généralisé standardLangage de balisage généralisé standard)--- > ;1993 année, HTML (Langage de balisage hypertexteLangage de balisage hypertexte)--->1998 Année, XML(Extensible Markup LanguageExtensible Markup Language)
1, Extensible Markup Language est un langage de balisage très similaire au Hypertext Markup Language.
2. Il est conçu pour transmettre des données, pas pour afficher des données.
3, ses balises ne sont pas prédéfinies. Vous devez définir vous-même les étiquettes.
4, Il est conçu pour être auto-descriptif.
5, qui est la norme recommandée du W3C.
1. Il ne remplace pas le langage de balisage hypertexte.
2, C'est un complément au Hypertext Markup Language.
3, Il est conçu à des fins différentes du langage de balisage hypertexte :
4, Il est conçu pour transmettre et stocker des données, dont l'objectif est le contenu des données.
5. Le langage de balisage hypertexte est conçu pour afficher des données, l'accent étant mis sur l'apparence des données.
6, le langage de balisage hypertexte est conçu pour afficher des informations, alors qu'il est conçu pour transmettre des informations.
7 La meilleure description est la suivante : il s'agit d'un outil de transmission d'informations indépendant du logiciel et du matériel.
1, résout le problème de la transmission irrégulière des données.
2, peut très bien décrire les choses dans une structure arborescente.
3, peut être utilisé comme fichier de configuration.
PS : De nos jours, de nombreux langages et technologies utilisent le XML comme standard de transmission de données , donc une compréhension approfondie du XML équivaut à maîtriser un protocole général de transmission de données.
Document de référence : http://www.php.cn/
Cas :
<?xml version="1.0" encoding="UTF-8"?> <class> <stu id="a001"> <name>张三</name> <sex>男</sex> <age>20</age> </stu> <stu id="a002"> <name>李四</name> <sex>女</sex> <age>18</age> </stu> </class>
一个XML文件可分为如下几部分内容:
文档声明 、元素、属性、注释 、CDATA区 ,特殊字符 、处理指令(processing instruction)
基本语法:
<?xml version="1.0" encoding="UTF-8"?> <!-- 上面是文档声明 - -> <?xml-stylesheet type="text/css" href=”XML2.css”?> <!-- 上面是处理指令 - -> <根元素> <!-- 注释 - -> <![CDATA[ CDATA区,可以是任意字符 ]]> <元素 属性=”属性值”> <元素>元素内容</元素> <空元素/>> </元素> </class>
<?xml version="1.0" encoding=“编码方式" standalone="yes|no"?>
XML声明放在XML文档的第一行
XML声明由以下几个部分组成:
version - -文档符合XML1.0规范
encoding - -文档字符编码,比如”utf-8”
standalone - -文档定义是否独立使用
standalone="yes“
standalone=“no” 默认
PS:虽说现在XML出了2.0版了,但是现在大多还是用1.0版。
基本语法:
<元素>元素内容</元素> <元素/>
注意事项:
1、每个XML文档必须有且只有一个根元素。
2、根元素是一个完全包括文档中其他所有元素的元素。
3、根元素的起始标记要放在所有其他元素的起始标记之前。
4、根元素的结束标记要放在所有其他元素的结束标记之后。
5、XML元素指XML文件中出现的标签,一个标签分为开始标签和结束标签,一个标签有如下几种书写形式,例如:
6、一个标签中也可以嵌套若干子标签。但所有标签必须合理的嵌套,绝对不允许交叉嵌套 ,例如:
7、对于XML标签中出现的所有空格和换行,XML解析程序都会当作标签内容进行处理。
例如:
8、一个XML元素可以包含字母、数字以及其它一些可见字符,但必须遵守下面的一些规范:
1---区分大小写,例如,和是两个不同的标记。
2---不能以数字或"_" (下划线)开头。
3---不能包含空格。
4---名称中间不能包含冒号(:)。
9、元素、标签、节点意义都是一样的。
基本语法
<元素 属性1=”属性值” 属性2=”属性值”>元素内容</元素>
注意事项:
1、属性值用双引号(")或单引号(')分隔(如果属性值中有',用"分隔;有",用'分隔)
2、一个元素可以有多个属性,它的基本格式为:
3、属性名称在同一个元素标记中只能出现一次
4、属性值不能包括<, >, &之类的特殊字符,否则需要使用转义字符。
这个和HTML一样,都是