Une introduction détaillée à la comparaison de plusieurs façons d'analyser les fichiers XML-Tutoriel XML/RSS-php.cn

Maison

développement back-end

Tutoriel XML/RSS

Une introduction détaillée à la comparaison de plusieurs façons d'analyser les fichiers XML

黄舟

Mar 31, 2017 pm 02:45 PM

J'ai souvent besoin d'analyser des fichiers XML au travail. Lors de l'entretien d'il y a quelques jours, on m'a posé des questions sur certaines connaissances approfondies, ce qui était surprenant. Si la réponse n’est pas satisfaisante, je l’enregistrerai et l’étudierai.

Caractéristiques : DOM doit charger les fichiers XML en mémoire en même temps.
SAX ne nécessite pas de chargement unique et l'analyse peut démarrer immédiatement au lieu d'attendre que toutes les données soient traitées.
JDOM utilise largement la collection d'objets de Java, ce qui améliore considérablement l'efficacité du travail des programmeurs Java 28 principes.
DOM4J est actuellement le plus utilisé, et notre projet utilise également DOM4j pour l'analyse.

1) DOM (analyseur JAXP Crimson)
DOM est la norme officielle du W3C pour représenter les documents XML d'une manière indépendante de la plate-forme et du langage. DOM est une collection de nœuds ou d'informations organisées dans une structure hiérarchique. Cette hiérarchie permet aux développeurs de rechercher dans l'arborescence des informations spécifiques. L'analyse de cette structure nécessite généralement de charger l'intégralité du document et de construire la hiérarchie avant de pouvoir effectuer tout travail. Parce qu'il est basé sur une hiérarchie d'informations, le DOM est considéré comme basé sur une arborescence ou sur des objets. Le DOM, et le traitement arborescent en général, présentent plusieurs avantages. Premièrement, comme l’arborescence est persistante en mémoire, elle peut être modifiée afin que l’application puisse apporter des modifications aux données et aux structures. Il peut également naviguer de haut en bas dans l'arborescence à tout moment, plutôt qu'un processus unique comme SAX. DOM est également beaucoup plus simple à utiliser.

2) SAX

Les avantages du traitement SAX sont très similaires à ceux du streaming multimédia. L'analyse peut commencer immédiatement au lieu d'attendre que toutes les données soient traitées. De plus, puisque l'application vérifie simplement les données au fur et à mesure de leur lecture, il n'est pas nécessaire de stocker les données en mémoire. C'est un énorme avantage pour les documents volumineux. En fait, l'application n'a même pas besoin d'analyser l'intégralité du document ; elle peut arrêter l'analyse lorsqu'une certaine condition est remplie. En général, SAX est également beaucoup plus rapide que son remplaçant, DOM.

Choisir DOM ou SAX ? Pour les développeurs qui doivent écrire leur propre code pour traiter des documents XML, le choix du modèle d'analyse DOM ou SAX est une décision de conception très importante. DOM utilise une structure arborescente pour accéder aux documents XML, tandis que SAX utilise le modèle event. L'analyseur DOM convertit le document XML en une arborescence contenant son contenu, et peut parcourir l'arborescence. L'avantage d'utiliser DOM pour analyser le modèle est qu'il est
programmation
facile. Les développeurs n'ont qu'à appeler les instructions de construction de l'arborescence, puis à utiliser les APIde navigation pour accéder aux informations requises. nœuds d’arborescence pour terminer la tâche. Les éléments de l'arborescence peuvent être facilement ajoutés et modifiés. Cependant, étant donné que l'intégralité du document XML doit être traitée lors de l'utilisation de l'analyseur DOM, les exigences en termes de performances et de mémoire sont relativement élevées, en particulier lorsqu'il s'agit de fichiers XML volumineux. En raison de leurs capacités de traversée, les analyseurs DOM sont souvent utilisés dans les services où les documents XML doivent être modifiés fréquemment. L'analyseur SAX adopte un modèle basé sur les événements. Il peut déclencher une série d'événements lors de l'analyse des documents XML. Lorsqu'une balise donnée est trouvée, il peut activer une méthode de rappel et indiquer à la méthode de formuler la balise. été trouvé. SAX a généralement moins besoin de mémoire car il permet aux développeurs de décider quelles balises traiter. Surtout lorsque les développeurs n'ont besoin de traiter qu'une partie des données contenues dans le document, l'évolutivité de SAX est mieux reflétée. Mais le codage est plus difficile lorsqu’on utilise un analyseur SAX, et il est difficile d’accéder simultanément à plusieurs données différentes dans le même document.

3) JDOM www.jdom.org

JDOM est conçu pour être un modèle de document spécifique à Java qui simplifie l'interaction avec XML et est plus rapide que l'utilisation de DOM. JDOM a été fortement promu et promu depuis qu'il s'agissait du premier modèle spécifique à Java. Il est envisagé pour une utilisation éventuelle en tant qu'« extension standard Java » via la « demande de spécification Java JSR-102 ». Le développement de JDOM a commencé depuis le début des années 2000.

Il existe deux différences principales entre JDOM et DOM. Premièrement, JDOM n'utilise que des classes concrètes et non des
interfaces
. Cela simplifie l'API à certains égards, mais limite également la flexibilité. Deuxièmement, l'API utilise largement la classe Collections, simplifiant ainsi son utilisation pour les développeurs Java déjà familiarisés avec ces classes. La documentation JDOM indique que son objectif est de « résoudre 80 % (ou plus) des problèmes Java/XML en utilisant 20 % (ou moins) d'effort » (en supposant 20 % en fonction de la courbe d'apprentissage). JDOM est certainement utile pour la plupart des applications Java/XML, et la plupart des développeurs trouvent l'API beaucoup plus facile à comprendre que DOM. JDOM inclut également des contrôles assez approfondis sur le comportement du programme pour empêcher les utilisateurs de faire quoi que ce soit qui n'a pas de sens en XML. Cependant, cela nécessite toujours que vous compreniez suffisamment bien XML pour faire plus que les bases (ou même comprendre les erreurs dans certains cas). Cela peut être un travail plus significatif que l'apprentissage des interfaces DOM ou JDOM.

JDOM lui-même ne contient pas d'analyseur. Il utilise généralement un analyseur SAX2 pour analyser et valider les documents XML d'entrée (bien qu'il puisse également prendre en entrée des représentations DOM précédemment construites). Il contient des convertisseurs pour générer des représentations JDOM dans des flux d'événements SAX2, des modèles DOM ou des documents texte XML. JDOM est open source publié sous une variante de la licence Apache.

4) DOM4J dom4j.sourceforge.net

Bien que DOM4J représente un résultat de développement complètement indépendant, au départ, c'était un fork intelligent de JDOM. Il intègre de nombreuses fonctionnalités au-delà de la représentation de base des documents XML, notamment la prise en charge intégrée de XPath, la prise en charge des schémas XML et le traitement basé sur les événements pour les documents volumineux ou en streaming. Il fournit également des options pour créer des représentations de documents avec des capacités d'accès parallèle via l'API DOM4J et les interfaces DOM standard. Il est en développement depuis le second semestre 2000.

Pour prendre en charge toutes ces fonctionnalités, DOM4J utilise des interfaces et des méthodes de classe de base abstraites. DOM4J utilise largement la classe Collections dans l'API, mais dans de nombreux cas, il propose également des alternatives permettant de meilleures performances ou une approche de codage plus directe. L'avantage direct est que même si DOM4J paie le prix d'une API plus complexe, il offre une flexibilité bien plus grande que JDOM.

Tout en ajoutant de la flexibilité, l'intégration XPath et l'objectif de traiter des documents volumineux, les objectifs de DOM4J sont les mêmes que ceux de JDOM : facilité d'utilisation et fonctionnement intuitif pour les développeurs Java. Il vise également à être une solution plus complète que JDOM, atteignant l'objectif de gérer essentiellement tous les problèmes Java/XML. Tout en atteignant cet objectif, il met moins l'accent que JDOM sur la prévention des comportements incorrects des applications.

DOM4J est une très, très excellente API Java XML avec d'excellentes performances, des fonctions puissantes et une extrême facilité d'utilisation. De nos jours, vous pouvez constater que de plus en plus de logiciels Java utilisent DOM4J pour lire et écrire du XML. Il convient particulièrement de mentionner que même JAXM de Sun utilise également DOM4J

2... Comparaison

. 1) DOM4J a les meilleures performances, même JAXM de Sun utilise également DOM4J Actuellement, de nombreux projets open source utilisent largement DOM4J. Par exemple, le célèbre Hibernate utilise également DOM4J pour lire XML fichiers de configuration . Si la portabilité n'est pas prise en compte, utilisez DOM4J

2) JDOM et DOM ont mal fonctionné lors des tests de performances et la mémoire a débordé lors du test de 10 millions de documents. Il vaut également la peine d'envisager d'utiliser DOM et JDOM dans le cas de petits documents. Bien que les développeurs de JDOM aient déclaré qu'ils s'attendaient à se concentrer sur les problèmes de performances avant la sortie officielle, du point de vue des performances, cela n'a vraiment rien à recommander. De plus, DOM reste un très bon choix. L'implémentation du DOM est largement utilisée dans de nombreux langages de programmation. C'est également la base de nombreux autres standards liés à XML, et comme il est officiellement recommandé par le W3C (par opposition au modèle Java non standard), il peut également être requis dans certains types de projets (par exemple, en JavaScript utilise DOM).

3) SAX fonctionne mieux, ce qui dépend de sa méthode d'analyse spécifique - événement pilotée . Un SAX détecte le flux XML entrant, mais ne le charge pas en mémoire (bien entendu lors de la lecture du flux XML, certains documents seront temporairement cachés en mémoire).
3. Utilisation de base des quatre méthodes de fonctionnement XML 2) SAX

3) JDOM

＜?xml version="1.0" encoding="GB2312"?＞ 
＜RESULT＞ 
＜VALUE＞ 
　　 ＜NO＞A1234＜/NO＞ 
　　 ＜ADDR＞XX号＜/ADDR＞ 
＜/VALUE＞ 
＜VALUE＞ 
　　 ＜NO＞B1234＜/NO＞ 
　 　＜ADDR＞XX组＜/ADDR＞ 
＜/VALUE＞ 
＜/RESULT＞

Copier après la connexion

4) DOM4J

import java.io.*; 
import java.util.*; 
import org.w3c.dom.*; 
import javax.xml.parsers.*; 

public class MyXMLReader{ 
　public static void main(String arge[]){ 

　　long lasting =System.currentTimeMillis(); 
　　try{ 
　　　File f=new File("data_10k.xml"); 
　　　DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); 
　　　DocumentBuilder builder=factory.newDocumentBuilder(); 
　　　Document doc = builder.parse(f); 
　　　NodeList nl = doc.getElementsByTagName("VALUE"); 
　　　for (int i=0;i＜nl.getLength();i++){ 
　　　　System.out.print("车牌号码:" + doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue()); 
　　　　System.out.println("车主地址:" + doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue()); 
　 　} 
　　}catch(Exception e){ 
　　　e.printStackTrace(); 
}

Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Assassin's Creed Shadows: Solution d'énigmes de coquille

3 Il y a quelques semaines By DDD

Quoi de neuf dans Windows 11 KB5054979 et comment résoudre les problèmes de mise à jour

2 Il y a quelques semaines By DDD

Où trouver la courte de la grue à atomide atomique

3 Il y a quelques semaines By DDD

<🎜>: Dead Rails - Comment relever chaque défi

4 Il y a quelques semaines By DDD

Guide de l'atomfall: emplacements des articles, guides de quête et conseils

1 Il y a quelques mois By DDD

Afficher plus

Outils chauds

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Afficher plus

Sujets chauds

Où se trouve l'entrée de connexion pour la messagerie Gmail ?

7678

Tutoriel CakePHP

1393

Tutoriel C#

1207

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

Afficher plus

Related knowledge

Comparaison approfondie : Vivox100 ou Vivox100Pro, lequel vaut le plus la peine d'être acheté ? Mar 22, 2024 pm 02:06 PM

Sur le marché actuel des smartphones, les consommateurs sont confrontés à de plus en plus de choix. Avec le développement continu de la technologie, les fabricants de téléphones mobiles ont lancé de plus en plus de modèles et de styles, parmi lesquels Vivox100 et Vivox100Pro sont sans aucun doute deux produits qui ont attiré beaucoup d'attention. Les deux téléphones mobiles proviennent de la célèbre marque Vivox, mais ils présentent certaines différences en termes de fonctions, de performances et de prix. Alors face à ces deux téléphones mobiles, lequel vaut le plus la peine d'être acheté ? Il existe des différences évidentes dans la conception de l'apparence entre Vivox100 et Vivox100Pro.

Lequel a le plus de potentiel, la pièce SOL ou la pièce BCH ? Quelle est la différence entre la pièce SOL et la pièce BCH ? Apr 25, 2024 am 09:07 AM

Actuellement, les pièces potentielles favorisées par le cercle monétaire incluent la pièce SOL et la pièce BCH. SOL est le jeton natif de la plate-forme blockchain Solana. BCH est le jeton du projet BitcoinCash, qui est une monnaie fork de Bitcoin. Parce qu'ils ont des caractéristiques techniques, des scénarios d'application et des orientations de développement différents, il est difficile pour les investisseurs de faire un choix entre les deux. J'aimerais analyser lequel a le plus de potentiel, la monnaie SOL ou le BCH ? Investissez à nouveau. Cependant, la comparaison des devises nécessite une analyse complète basée sur le marché, les perspectives de développement, la solidité du projet, etc. Ensuite, l'éditeur vous le dira en détail. Lequel a le plus de potentiel, la pièce SOL ou le BCH ? En comparaison, la pièce SOL a plus de potentiel. Déterminer laquelle a le plus de potentiel, la pièce SOL ou BCH, est une question compliquée car elle dépend de nombreux facteurs.

Comparaison des performances de Windows 10 et Windows 11 : lequel est le meilleur ? Mar 28, 2024 am 09:00 AM

Comparaison des performances de Windows 10 et Windows 11 : lequel est le meilleur ? Avec le développement et les progrès continus de la technologie, les systèmes d’exploitation sont constamment mis à jour et mis à niveau. En tant que l'un des plus grands développeurs de systèmes d'exploitation au monde, la série de systèmes d'exploitation Windows de Microsoft a toujours attiré beaucoup d'attention de la part des utilisateurs. En 2021, Microsoft a lancé le système d’exploitation Windows 11, ce qui a suscité de nombreuses discussions et attentions. Alors, quelle est la différence de performances entre Windows 10 et Windows 11 ?

Comparaison des box TV Huawei, ZTE, Tmall et Xiaomi Feb 02, 2024 pm 04:42 PM

Les box TV, en tant qu'appareil important qui connecte Internet et la télévision, sont devenues de plus en plus populaires ces dernières années. Avec la popularité des téléviseurs intelligents, les consommateurs privilégient de plus en plus les marques de boîtiers TV telles que Tmall, Xiaomi, ZTE et Huawei. Afin d’aider les lecteurs à choisir le boîtier TV qui leur convient le mieux, cet article proposera une comparaison approfondie des caractéristiques et des avantages de ces quatre boîtiers TV. 1. Huawei TV Box : L'expérience audiovisuelle intelligente est excellente et peut offrir une expérience visuelle fluide. Huawei TV Box dispose d'un processeur puissant et d'une qualité d'image haute définition. Tels que la vidéo en ligne et les applications riches intégrées, la musique et les jeux, etc., il prend en charge une variété de formats audio et vidéo. Le boîtier TV Huawei dispose également d'une fonction de commande vocale, ce qui rend l'utilisation plus pratique. Vous pouvez facilement diffuser le contenu de votre téléphone mobile sur l'écran du téléviseur. Sa diffusion en un clic.

Mar 22, 2024 pm 02:33 PM

Évaluation comparative de Vivox100 et Vivox100Pro : Lequel préférez-vous ? À mesure que les smartphones deviennent de plus en plus populaires et puissants, la demande d'accessoires de téléphonie mobile augmente également. En tant qu'élément indispensable des accessoires de téléphonie mobile, les écouteurs jouent un rôle important dans la vie quotidienne et au travail des gens. Parmi les nombreuses marques de casques, Vivox100 et Vivox100Pro sont deux produits qui ont beaucoup retenu l'attention. Aujourd'hui, nous allons procéder à une évaluation comparative détaillée de ces deux écouteurs pour voir leurs avantages et inconvénients.

Comparaison des performances et avantages et inconvénients du langage Go et d'autres langages de programmation Mar 07, 2024 pm 12:54 PM

Titre : Comparaison des performances, avantages et inconvénients du langage Go et d'autres langages de programmation Avec le développement continu de la technologie informatique, le choix du langage de programmation devient de plus en plus critique, parmi lesquels les performances sont une considération importante. Cet article prendra le langage Go comme exemple pour comparer ses performances avec d'autres langages de programmation courants et analyser leurs avantages et inconvénients respectifs. 1. Présentation du langage Go Le langage Go est un langage de programmation open source développé par Google. Il présente les caractéristiques d'une compilation rapide, d'une concurrence efficace, d'une concision et d'une lisibilité aisée. Il convient au développement de services réseau, de systèmes distribués, de cloud computing et de technologies de pointe. d'autres domaines. Aller

A quoi sert le fichier XML ? Aug 03, 2023 am 09:38 AM

Les fichiers XML sont un langage de balisage utilisé pour décrire et transmettre des données. Il est connu pour son évolutivité, sa lisibilité et sa flexibilité et est largement utilisé dans les applications Web, l'échange de données et les services Web. Le format et la structure de XML rendent l'organisation et l'interprétation des données simples et claires, améliorant ainsi l'efficacité de l'échange et du partage des données.

méthode d'ouverture de fichier XML Feb 22, 2024 pm 04:04 PM

Méthodes courantes d'ouverture de fichiers XML : 1. Éditeur de texte ; 2. Navigateur ; 3. Éditeur XML ; 4. Environnement de développement intégré ;

See all articles