Extensible Markup Language, XML), un langage de balisage utilisé pour marquer des documents électroniques afin de les rendre structurels, il peut être utilisé pour marquer des données et définir des types de données, est une source. langage qui permet aux utilisateurs de définir leurs propres langages de balisage. XML est un sous-ensemble du langage SGML (Standard Generalized Markup Language) et convient parfaitement au transport Web. XML fournit une méthode unifiée pour décrire et échanger des données structurées indépendamment des applications ou des fournisseurs.
Caractéristiques du format
XML est différent des bases de données telles que Access, Oracle et SQL Server. La base de données offre des capacités de stockage et d'analyse de données plus puissantes, telles que : l'indexation des données, le tri, la recherche, la cohérence associée, etc. . XML affiche simplement les données. En fait, la plus grande différence entre XML et les autres représentations de données est qu’il est extrêmement simple. Il s'agit d'un avantage apparemment trivial, mais c'est ce qui rend XML unique.
La différence de conception entre XML et HTML est la suivante : XML est utilisé pour stocker des données, en se concentrant sur les données elles-mêmes. HTML est utilisé pour définir les données, en se concentrant sur le mode d'affichage des données.
La simplicité de XML facilite la lecture et l'écriture de données dans n'importe quelle application. Cela fait que XML devient rapidement le seul langage public pour l'échange de données. Bien que différents logiciels d'application prennent également en charge d'autres formats d'échange de données, ils prendront tous en charge XML. que le programme peut s'intégrer plus facilement aux informations générées sous Windows, Mac OS, Linux et d'autres plates-formes, puis il est facile de charger des données XML dans le programme et de les analyser, et d'utiliser les résultats de sortie au format XML .
Afin de rendre SGML convivial, XML redéfinit certaines valeurs et paramètres internes de SGML, supprimant un grand nombre de fonctions rarement utilisées. Ces fonctions complexes compliquent SGML lors de la conception de sites Web. XML conserve les fonctions structurelles de SGML, qui permet aux concepteurs de sites Web de définir leurs propres types de documents. XML introduit également un nouveau type de document, afin que les développeurs n'aient pas besoin de définir des types de documents.
Syntaxe simple
SGML est couramment utilisé pour définir des définitions de types de documents (DTD) pour HTML, et il est également couramment utilisé pour écrire des DTD pour XML. Le problème avec SGML est qu'il autorise une syntaxe étrange, ce qui rend la création d'un analyseur HTML un gros problème :
1. Certaines balises de début n'autorisent pas les balises de fin, comme la balise Une erreur se produira si une balise de fermeture est incluse.
2 Certaines balises de début peuvent éventuellement apparaître avec une balise de fin ou masquer la balise de fin
3 Certaines balises de début nécessitent qu'une balise de fin apparaisse, comme la balise