Explication détaillée des principes et comparaison des performances de quatre analyseurs XML-Tutoriel XML/RSS-php.cn

Maison

développement back-end

Tutoriel XML/RSS

Explication détaillée des principes et comparaison des performances de quatre analyseurs XML

黄舟

Mar 24, 2017 pm 04:39 PM

1 : DOM

DOM est la norme officielle du W3C pour représenter les documents XML d'une manière indépendante de la plate-forme et de la langue. Le DOM est un ensemble de nœuds ou d'informations organisés selon une structure hiérarchique. Cette hiérarchie permet aux développeurs de rechercher dans l'arborescence des informations spécifiques. L'analyse de cette structure nécessite généralement de charger l'intégralité du document et de construire la hiérarchie avant de pouvoir effectuer tout travail. Puisqu'il est basé sur une hiérarchie d'informations, le DOM est considéré comme étant basé sur une arborescence ou sur des objets. Le DOM, et le traitement arborescent en général, présentent plusieurs avantages.
Premièrement, comme l'arborescence est persistante en mémoire, elle peut être modifiée afin que l'application puisse apporter des modifications aux données et à la structure. Il permet également de naviguer de haut en bas dans l'arborescence à tout moment, plutôt qu'un processus unique comme SAX. DOM est également beaucoup plus simple à utiliser.
D'un autre côté, pour les documents particulièrement volumineux, l'analyse et le chargement de l'intégralité du document peuvent être lents et gourmands en ressources, il est donc préférable d'utiliser d'autres moyens pour traiter ces données. Ce sont des modèles basés sur des événements comme SAX.

2:SAX

Les avantages de ce traitement sont très similaires à ceux du streaming multimédia. L'analyse peut commencer immédiatement au lieu d'attendre que toutes les données soient traitées. De plus, puisque l'application vérifie simplement les données au fur et à mesure de leur lecture, il n'est pas nécessaire de stocker les données en mémoire. C'est un énorme avantage pour les documents volumineux. En fait, l'application n'a même pas besoin d'analyser l'intégralité du document ; elle peut arrêter l'analyse lorsqu'une certaine condition est remplie. En général, SAX est également beaucoup plus rapide que son remplaçant, DOM.
　3 : Choisir DOM ou SAX ?
Pour les développeurs qui doivent écrire leur propre code pour traiter des documents XML, le choix du modèle d'analyse DOM ou SAX est une décision de conception très importante.
　DOM utilise une structure arborescente pour accéder aux documents XML, tandis que SAX utilise un modèle d'événement.
　L'analyseur DOM convertit un document XML en une arborescence contenant son contenu, et peut parcourir l'arborescence. L'avantage d'utiliser DOM pour analyser le modèle est que la programmation est simple. Les développeurs n'ont qu'à appeler les instructions de création d'arborescence, puis à utiliser les APIde navigation pour accéder aux nœuds d'arborescence requis pour terminer la tâche. Les éléments de l'arborescence peuvent être facilement ajoutés et modifiés. Cependant, étant donné que l'intégralité du document XML doit être traitée lors de l'utilisation de l'analyseur DOM, les exigences en termes de performances et de mémoire sont relativement élevées, en particulier lorsqu'il s'agit de fichiers XML volumineux. En raison de leurs capacités de traversée, les analyseurs DOM sont souvent utilisés dans les services où les documents XML doivent être modifiés fréquemment.
L'analyseur SAX adopte un modèle basé sur les événements. Il peut déclencher une série d'événements lors de l'analyse des documents XML. Lorsqu'une balise donnée est trouvée, il peut activer une méthode de rappel pour indiquer à la méthode que la balise spécifiée a été activée. . SAX a généralement des besoins en mémoire inférieurs car il permet aux développeurs de décider quelles balises traiter. Surtout lorsque les développeurs n'ont besoin de traiter qu'une partie des données contenues dans le document, l'évolutivité de SAX est mieux reflétée. Mais le codage est plus difficile lorsqu’on utilise un analyseur SAX, et il est difficile d’accéder simultanément à plusieurs données différentes dans le même document.

4:JDOM

JDOM est destiné à être un modèle de document spécifique à Java qui simplifie l'interaction avec XML et est plus rapide que l'utilisation de DOM. JDOM a été fortement promu et promu depuis qu'il s'agissait du premier modèle spécifique à Java. Il est envisagé pour une utilisation éventuelle en tant qu'« extension standard Java » via la « demande de spécification Java JSR-102 ». Le développement de JDOM est en cours depuis le début des années 2000.
Il existe deux différences principales entre JDOM et DOM. Premièrement, JDOM utilise uniquement des classes concrètes et non des interfaces. Cela simplifie l'API à certains égards, mais limite également la flexibilité. Deuxièmement, l'API fait un usage intensif des classes Collections, simplifiant ainsi l'utilisation pour les développeurs Java déjà familiarisés avec ces classes.
La documentation JDOM indique que son objectif est de "résoudre 80 % (ou plus) des problèmes Java/XML avec 20 % (ou moins) d'effort" (en supposant 20 % en fonction de la courbe d'apprentissage). JDOM est certainement utile pour la plupart des applications Java/XML, et la plupart des développeurs trouvent l'API beaucoup plus facile à comprendre que le DOM. JDOM inclut également des contrôles assez approfondis sur le comportement du programme pour empêcher les utilisateurs de faire quoi que ce soit qui n'a pas de sens en XML. Cependant, cela nécessite toujours que vous compreniez suffisamment bien XML pour faire plus que les bases (ou même comprendre les erreurs dans certains cas). Cela peut être un travail plus significatif que l'apprentissage des interfaces DOM ou JDOM.
JDOM lui-même ne contient pas d'analyseur. Il utilise généralement un analyseur SAX2 pour analyser et valider les documents XML d'entrée (bien qu'il puisse également prendre en entrée des représentations DOM précédemment construites). Il contient des convertisseurs pour générer des représentations JDOM dans des flux d'événements SAX2, des modèles DOM ou des documents texte XML. JDOM est open source publié sous une variante de la licence Apache.

5 : DOM4J

Bien que DOM4J représente un développement totalement indépendant, il s'agissait à l'origine d'un fork intelligent de JDOM. Il intègre de nombreuses fonctionnalités au-delà de la représentation de base des documents XML, notamment la prise en charge intégrée de XPath, la prise en charge des schémas XML et le traitement basé sur les événements pour les documents volumineux ou diffusés en continu. Il fournit également des options pour créer des représentations de documents avec des capacités d'accès parallèle via l'API DOM4J et les interfaces DOM standard. Il est en développement depuis fin 2000.
Pour prendre en charge toutes ces fonctionnalités, DOM4J utilise des interfaces et des méthodes de classe de base abstraites. DOM4J utilise largement la classe Collections dans l'API, mais dans de nombreux cas, il propose également des alternatives permettant de meilleures performances ou une approche de codage plus simple. L'avantage direct est que, même si DOM4J paie le prix d'une API plus complexe, il offre une flexibilité bien plus grande que JDOM.
Tout en ajoutant de la flexibilité, l'intégration XPath et la gestion de documents volumineux, les objectifs de DOM4J sont les mêmes que ceux de JDOM : facilité d'utilisation et fonctionnement intuitif pour les développeurs Java. Il vise également à être une solution plus complète que JDOM, atteignant l'objectif de gérer essentiellement tous les problèmes Java/XML. Il atteint cet objectif en mettant moins l'accent que JDOM sur la prévention des comportements incorrects des applications.
DOM4J est une très, très excellente API Java XML avec d'excellentes performances, des fonctions puissantes et une extrême facilité d'utilisation. De nos jours, vous pouvez constater que de plus en plus de logiciels Java utilisent DOM4J pour lire et écrire du XML. Il convient particulièrement de mentionner que même JAXM de Sun utilise également DOM4J.
　6 : Présentation
　JDOM et DOM se sont mal comportés lors des tests de performances et la mémoire a débordé lors du test de 10 millions de documents. Il vaut également la peine d'envisager d'utiliser DOM et JDOM dans le cas de petits documents. Bien que les développeurs de JDOM aient déclaré qu'ils prévoyaient de se concentrer sur les problèmes de performances avant la sortie officielle, il n'y a vraiment rien qui le recommande du point de vue des performances. De plus, DOM reste un très bon choix. L'implémentation du DOM est largement utilisée dans de nombreux langages de programmation. C'est également la base de nombreuses autres normes liées à XML, et comme il est officiellement recommandé par le W3C (par opposition au modèle Java non standard), il peut également être requis dans certains types de projets (comme dans javascript en utilisant DOM).
SAX fonctionne mieux, ce qui dépend de sa méthode d'analyse spécifique. Un SAX détecte le flux XML entrant, mais ne le charge pas en mémoire (bien entendu lors de la lecture du flux XML, certains documents seront temporairement cachés en mémoire).
Sans aucun doute, DOM4J est le meilleur. Actuellement, DOM4J est largement utilisé dans de nombreux projets open source. Par exemple, le célèbre Hibernate utilise également DOM4J pour lire les fichiers de configuration XML. Si la portabilité n'est pas un problème, utilisez DOM4J !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semaines By DDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

4 Il y a quelques semaines By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Comment déverrouiller tout dans Myrise

1 Il y a quelques mois By 尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7510

Tutoriel CakePHP

1378

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus

Related knowledge

Puis-je ouvrir un fichier XML à l'aide de PowerPoint ? Feb 19, 2024 pm 09:06 PM

Les fichiers XML peuvent-ils être ouverts avec PPT ? XML, Extensible Markup Language (Extensible Markup Language), est un langage de balisage universel largement utilisé dans l'échange et le stockage de données. Comparé au HTML, XML est plus flexible et peut définir ses propres balises et structures de données, rendant le stockage et l'échange de données plus pratiques et unifiés. PPT, ou PowerPoint, est un logiciel développé par Microsoft pour créer des présentations. Il fournit un moyen complet de

Utiliser Python pour fusionner et dédupliquer des données XML Aug 07, 2023 am 11:33 AM

Utilisation de Python pour fusionner et dédupliquer des données XML XML (eXtensibleMarkupLanguage) est un langage de balisage utilisé pour stocker et transmettre des données. Lors du traitement de données XML, nous devons parfois fusionner plusieurs fichiers XML en un seul ou supprimer les données en double. Cet article explique comment utiliser Python pour implémenter la fusion et la déduplication de données XML, et donne des exemples de code correspondants. 1. Fusion de données XML Lorsque nous avons plusieurs fichiers XML, nous devons les fusionner

Filtrage et tri des données XML à l'aide de Python Aug 07, 2023 pm 04:17 PM

Implémentation du filtrage et du tri des données XML à l'aide de Python Introduction : XML est un format d'échange de données couramment utilisé qui stocke les données sous forme de balises et d'attributs. Lors du traitement de données XML, nous devons souvent filtrer et trier les données. Python fournit de nombreux outils et bibliothèques utiles pour traiter les données XML. Cet article explique comment utiliser Python pour filtrer et trier les données XML. Lecture du fichier XML Avant de commencer, nous devons lire le fichier XML. Python possède de nombreuses bibliothèques de traitement XML,

Convertir des données XML au format CSV en Python Aug 11, 2023 pm 07:41 PM

Convertir des données XML en Python au format CSV XML (ExtensibleMarkupLanguage) est un langage de balisage extensible couramment utilisé pour le stockage et la transmission de données. CSV (CommaSeparatedValues) est un format de fichier texte délimité par des virgules couramment utilisé pour l'importation et l'exportation de données. Lors du traitement des données, il est parfois nécessaire de convertir les données XML au format CSV pour faciliter l'analyse et le traitement. Python est un puissant

Importer des données XML dans une base de données à l'aide de PHP Aug 07, 2023 am 09:58 AM

Importation de données XML dans la base de données à l'aide de PHP Introduction : Pendant le développement, nous devons souvent importer des données externes dans la base de données pour un traitement et une analyse ultérieurs. En tant que format d'échange de données couramment utilisé, XML est souvent utilisé pour stocker et transmettre des données structurées. Cet article explique comment utiliser PHP pour importer des données XML dans une base de données. Étape 1 : analyser le fichier XML Tout d'abord, nous devons analyser le fichier XML et extraire les données requises. PHP propose plusieurs façons d'analyser XML, la plus couramment utilisée étant l'utilisation de Simple

Python implémente la conversion entre XML et JSON Aug 07, 2023 pm 07:10 PM

Python implémente la conversion entre XML et JSON Introduction : Dans le processus de développement quotidien, nous devons souvent convertir des données entre différents formats. XML et JSON sont des formats d'échange de données courants. En Python, nous pouvons utiliser diverses bibliothèques pour réaliser une conversion mutuelle entre XML et JSON. Cet article présentera plusieurs méthodes couramment utilisées, avec des exemples de code. 1. Pour convertir XML en JSON en Python, nous pouvons utiliser le module xml.etree.ElementTree

Gestion des erreurs et des exceptions en XML à l'aide de Python Aug 08, 2023 pm 12:25 PM

Gestion des erreurs et des exceptions dans XML à l'aide de Python XML est un format de données couramment utilisé pour stocker et représenter des données structurées. Lorsque nous utilisons Python pour traiter XML, nous pouvons parfois rencontrer des erreurs et des exceptions. Dans cet article, je vais vous présenter comment utiliser Python pour gérer les erreurs et les exceptions dans XML, et fournir un exemple de code pour référence. Utilisez l'instruction try-sauf pour détecter les erreurs d'analyse XML Lorsque nous utilisons Python pour analyser XML, nous pouvons parfois rencontrer des

Qu'est-ce qu'un fichier mdi ? Feb 18, 2024 pm 01:13 PM

Les fichiers MDI sont un format de document électronique courant, dont le nom complet est Microsoft Document Imaging. Il s'agit d'un format de fichier développé par Microsoft Corporation pour stocker et afficher des documents numérisés. Les fichiers MDI permettent aux utilisateurs de numériser des documents papier en images numériques pouvant être visualisées, modifiées et imprimées à partir d'un ordinateur. Les fichiers MDI présentent de nombreux avantages, le premier étant leur grande compressibilité. Les fichiers MDI peuvent enregistrer les images numérisées dans la plus petite taille de fichier, ce qui est très avantageux pour le stockage et la transmission de documents. Deuxièmement

See all articles