XML ファイルを解析するいくつかの方法の比較に関する詳細な紹介-XML/RSS チュートリアル-php.cn

ホームページ

バックエンド開発

XML/RSS チュートリアル

XML ファイルを解析するいくつかの方法の比較に関する詳細な紹介

黄舟

Mar 31, 2017 pm 02:45 PM

私たちは仕事で XML ファイルを解析する必要があることがよくありますが、数日前の面接でさらに詳しい知識について尋ねられたのですが、それは驚きでした。満足のいく答えが得られない場合は、記録して勉強します。

特徴: DOM は XML ファイルを一度にメモリにロードする必要があります。
SAX は 1 回限りのロードを必要とせず、すべてのデータが処理されるのを待たずにすぐに分析を開始できます。
JDOM は Java のコレクションオブジェクトを広範囲に利用しており、Java プログラマーの作業効率を大幅に向上させます。
DOM4J は現在最もよく使用されており、私たちのプロジェクトでも解析に DOM4j を使用しています。

1) DOM (JAXP Crimson Parser)
DOM は、プラットフォームや言語に依存しない方法で XML ドキュメントを表現するための公式 W3C 標準です。 DOM は、階層構造で編成されたノードまたは情報の集合です。この階層により、開発者はツリーで特定の情報を検索できます。この構造を分析するには、通常、作業を行う前にドキュメント全体をロードし、階層を構築する必要があります。 DOM は情報階層に基づいているため、ツリーベースまたはオブジェクトベースとみなされます。 DOM、および一般にツリーベースの処理には、いくつかの利点があります。まず、ツリーはメモリ内に永続的であるため、アプリケーションがデータと構造を変更できるように変更できます。また、SAX のような 1 回限りのプロセスではなく、いつでもツリーを上下に移動できます。 DOM の使用も非常に簡単です。 2) SAX

SAX 処理の利点は、ストリーミングメディアの利点と非常に似ています。すべてのデータが処理されるのを待つことなく、すぐに分析を開始できます。また、アプリケーションはデータの読み取り時にデータをチェックするだけなので、データをメモリに保存する必要はありません。これは、大きなドキュメントにとって大きな利点です。実際、アプリケーションはドキュメント全体を解析する必要さえなく、特定の条件が満たされた場合に解析を停止できます。一般に、SAX は、それに代わる DOM よりもはるかに高速です。

DOM または SAX を選択しますか? XML ドキュメントを処理するために独自のコードを記述する必要がある開発者にとって、DOM または SAX 解析
モデル
の選択は非常に重要な設計上の決定です。 DOM はツリー構造を使用して XML ドキュメントにアクセスしますが、SAX は event モデルを使用します。 DOM パーサーは、XML ドキュメントをそのコンテンツを含むツリーに変換し、ツリーをトラバースできます。 DOM を使用してモデルを解析する利点は、開発者がツリー構築命令を呼び出して、ナビゲーション
API
を使用して必要なツリーノードにアクセスするだけで、タスクを完了できるプログラミングが簡単であることです。ツリー内の要素は簡単に追加および変更できます。ただし、DOM パーサーを使用する場合は XML ドキュメント全体を処理する必要があるため、特に大きな XML ファイルを処理する場合には、パフォーマンスとメモリの要件が比較的高くなります。 DOM パーサーは、そのトラバーサル機能により、XML ドキュメントを頻繁に変更する必要があるサービスでよく使用されます。 SAX パーサーはイベントベースのモデルを採用しており、XML ドキュメントを解析するときに一連のイベントをトリガーして、メソッドで指定されたタグが見つかったことをメソッドに通知できます。見つかった。。 SAX では、開発者が処理するタグを決定できるため、通常、メモリ要件が低くなります。特に、開発者がドキュメントに含まれるデータの一部のみを処理する必要がある場合、SAX のスケーラビリティがよりよく反映されます。ただし、SAX パーサーを使用する場合はコーディングがさらに難しくなり、同じドキュメント内の複数の異なるデータに同時にアクセスすることが困難になります。

3) JDOM www.jdom.org

JDOM の目的は、XML との対話を簡素化し、DOM を使用するより高速な Java 固有のドキュメントモデルであることです。 JDOM は、最初の Java 固有のモデルになって以来、盛んに推進されてきました。最終的には、「Java 仕様要求 JSR-102」を通じて「Java 標準拡張」として使用することが検討されています。 JDOM の開発は 2000 年代初頭から始まりました。

JDOM と DOM の間には 2 つの主な違いがあります。まず、JDOM は具象クラスのみを使用し、
インターフェース
は使用しません。これにより、API がいくつかの点で簡素化されますが、柔軟性も制限されます。第 2 に、API は Collections クラスを広範囲に利用しており、これらのクラスにすでに精通している Java 開発者にとっての使用が簡素化されています。 JDOM のドキュメントには、その目的は「20% (またはそれ以下) の労力を使って 80% (またはそれ以上) の Java/XML 問題を解決する」ことであると記載されています (学習曲線に基づいて 20% を想定)。 JDOM は確かにほとんどの Java/XML アプリケーションにとって便利であり、ほとんどの開発者は API の方が DOM よりもはるかに理解しやすいと感じています。 JDOM には、ユーザーが XML で意味をなさないことを行うことを防ぐために、プログラムの動作に関するかなり広範なチェックも含まれています。ただし、基本以上のことを行うには、XML を十分に理解している必要があります (場合によってはエラーも理解する必要があります)。これは、DOM や JDOM インターフェイスを学習するよりも有意義な作業かもしれません。 JDOM 自体にはパーサーが含まれていません。通常、SAX2 パーサーを使用して入力 XML ドキュメントを解析および検証します (ただし、以前に構築された DOM 表現を入力として受け取ることもできます)。これには、JDOM 表現を SAX2 イベントストリーム、DOM モデル、または XML テキストドキュメントに出力するコンバータが含まれています。 JDOM は、Apache ライセンスのバリアントに基づいてリリースされたオープンソースです。

4) DOM4J dom4j.source
for
ge.net DOM4J は完全に独立した開発結果を表しますが、当初は JDOM のインテリジェントフォークでした。これには、統合された
XPath
サポート、XML スキーマサポート、大規模ドキュメントまたはストリーミングドキュメントのイベントベースの処理など、基本的な XML ドキュメント表現を超える多くの機能が組み込まれています。また、DOM4J API および標準 DOM インターフェイスを介した並列アクセス機能を備えたドキュメント表現を構築するためのオプションも提供します。 2000 年後半から開発が進められてきました。これらすべての機能をサポートするために、DOM4J はインターフェイスと抽象基本クラスメソッドを使用します。 DOM4J は API で Collections クラスを多用しますが、多くの場合、パフォーマンスの向上やより直接的なコーディングアプローチを可能にする代替手段も提供します。直接的な利点は、DOM4J はより複雑な API の代償を払っていますが、JDOM よりもはるかに優れた柔軟性を提供することです。

DOM4J の目標は、柔軟性、XPath の統合、および大規模なドキュメントの処理を追加する一方で、Java 開発者にとっての使いやすさと直感的な操作という JDOM と同じです。また、JDOM よりも完全なソリューションとなることも目指しており、本質的にすべての Java/XML 問題を処理するという目標を達成します。その目標を達成する一方で、アプリケーションの不正な動作の防止には JDOM ほど重点を置いていません。

DOM4J は、優れたパフォーマンス、強力な機能、そして非常に使いやすい、非常に優れた Java XML API であり、オープンソースソフトウェアでもあります。最近では、XML の読み取りと書き込みに DOM4J を使用する Java ソフトウェアが増えています。特に注目すべき点は、Sun の JAXM も DOM4J を使用していることです

2... 比較

1) DOM4J が最高のパフォーマンスを発揮します。 Sun の JAXM も DOM4J を使用しています。現在、DOM4J は多くのオープンソースプロジェクトで広く使用されています。たとえば、有名な Hibernate も XML
設定ファイル
を読み取るために DOM4J を使用しています。移植性を考慮しない場合は、DOM4J を使用してください 2) パフォーマンステスト中に JDOM と DOM のパフォーマンスが低下し、10M ドキュメントをテストするとメモリオーバーフローが発生しました。小さなドキュメントの場合は、DOM と JDOM の使用を検討する価値があります。JDOM の開発者は、正式リリース前にパフォーマンスの問題に重点を置く予定であると述べていますが、パフォーマンスの観点からは、実際には推奨できるものは何もありません。さらに、DOM は依然として非常に優れた選択肢です。 DOM 実装は、多くの
プログラミング言語
で広く使用されています。これは、多くの他の XML 関連標準の基礎でもあり、(非標準ベースの Java モデルとは対照的に) W3C によって公式に推奨されているため、特定の種類のプロジェクトで必要になる場合もあります (例: JavaScript DOM を使用)。 3) SAX のパフォーマンスが向上しますが、これはその特定の解析方法、つまりイベント
ドライバー
に依存します。 SAX は受信 XML ストリームを検出しますが、それをメモリにロードしません (もちろん、XML ストリームが読み取られるとき、一部のドキュメントはメモリ内に一時的に隠蔽されます)。 3. 4 つの XML 操作メソッドの基本的な使用法
xml ファイル:

＜?xml version="1.0" encoding="GB2312"?＞ 
＜RESULT＞ 
＜VALUE＞ 
　　 ＜NO＞A1234＜/NO＞ 
　　 ＜ADDR＞XX号＜/ADDR＞ 
＜/VALUE＞ 
＜VALUE＞ 
　　 ＜NO＞B1234＜/NO＞ 
　 　＜ADDR＞XX组＜/ADDR＞ 
＜/VALUE＞ 
＜/RESULT＞

ログイン後にコピー

1) DOM

import java.io.*; 
import java.util.*; 
import org.w3c.dom.*; 
import javax.xml.parsers.*; 

public class MyXMLReader{ 
　public static void main(String arge[]){ 

　　long lasting =System.currentTimeMillis(); 
　　try{ 
　　　File f=new File("data_10k.xml"); 
　　　DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); 
　　　DocumentBuilder builder=factory.newDocumentBuilder(); 
　　　Document doc = builder.parse(f); 
　　　NodeList nl = doc.getElementsByTagName("VALUE"); 
　　　for (int i=0;i＜nl.getLength();i++){ 
　　　　System.out.print("车牌号码:" + doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue()); 
　　　　System.out.println("车主地址:" + doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue()); 
　 　} 
　　}catch(Exception e){ 
　　　e.printStackTrace(); 
}

ログイン後にコピー

2) SAX

import org.xml.sax.*; 
import org.xml.sax.helpers.*; 
import javax.xml.parsers.*; 

public class MyXMLReader extends DefaultHandler { 

　java.util.Stack tags = new java.util.Stack(); 
　public MyXMLReader() { 
　　super(); 
} 

　public static void main(String args[]) { 
　　long lasting = System.currentTimeMillis(); 
　　try { 
　　　SAXParserFactory sf = SAXParserFactory.newInstance(); 
　　　SAXParser sp = sf.newSAXParser(); 
　　　MyXMLReader reader = new MyXMLReader(); 
　　　sp.parse(new InputSource("data_10k.xml"), reader); 
　　} catch (Exception e) { 
　　　e.printStackTrace(); 
　　} 

　　System.out.println("运行时间：" + (System.currentTimeMillis() - lasting) + "毫秒");} 
　　public void characters(char ch[], int start, int length) throws SAXException { 
　　String tag = (String) tags.peek(); 
　　if (tag.equals("NO")) { 
　　　System.out.print("车牌号码：" + new String(ch, start, length)); 
} 
if (tag.equals("ADDR")) { 
　　System.out.println("地址:" + new String(ch, start, length)); 
} 
} 

　　public void startElement(String uri,String localName,String qName,Attributes attrs) { 
　　tags.push(qName);} 
}

ログイン後にコピー

3) JDOM

import java.io.*; 
import java.util.*; 
import org.jdom.*; 
import org.jdom.input.*; 

public class MyXMLReader { 

　public static void main(String arge[]) { 
　　long lasting = System.currentTimeMillis(); 
　　try { 
　　　SAXBuilder builder = new SAXBuilder(); 
　　　Document doc = builder.build(new File("data_10k.xml")); 
　　　Element foo = doc.getRootElement(); 
　　　List allChildren = foo.getChildren(); 
　　　for(int i=0;i＜allChildren.size();i++) { 
　　　　System.out.print("车牌号码:" + ((Element)allChildren.get(i)).getChild("NO").getText()); 
　　　　System.out.println("车主地址:" + ((Element)allChildren.get(i)).getChild("ADDR").getText()); 
　　　} 
　　} catch (Exception e) { 
　　　e.printStackTrace(); 
} 

}

ログイン後にコピー

4) DOM4J

import java.io.*; 
import java.util.*; 
import org.dom4j.*; 
import org.dom4j.io.*; 

public class MyXMLReader { 

　public static void main(String arge[]) { 
　　long lasting = System.currentTimeMillis(); 
　　try { 
　　　File f = new File("data_10k.xml"); 
　　　SAXReader reader = new SAXReader(); 
　　　Document doc = reader.read(f); 
　　　Element root = doc.getRootElement(); 
　　　Element foo; 
　　　for (Iterator i = root.elementIterator("VALUE"); i.hasNext() { 
　　　　foo = (Element) i.next(); 
　　　　System.out.print("车牌号码:" + foo.elementText("NO")); 
　　　　System.out.println("车主地址:" + foo.elementText("ADDR")); 
　　　} 
　　} catch (Exception e) { 
　　　e.printStackTrace(); 
} 
)

ログイン後にコピー

以上がXML ファイルを解析するいくつかの方法の比較に関する詳細な紹介の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7529

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

徹底した比較: Vivox100 と Vivox100Pro、どちらを購入する価値がありますか? Mar 22, 2024 pm 02:06 PM

今日のスマートフォン市場では、消費者はますます多くの選択肢に直面しています。技術の継続的な発展に伴い、携帯電話メーカーはますます多くのモデルやスタイルを発売していますが、その中でも Vivox100 と Vivox100Pro は間違いなく大きな注目を集めている 2 つの製品です。どちらの携帯電話も有名ブランド Vivox の製品ですが、機能、性能、価格に一定の違いがあるため、この 2 つの携帯電話を比較した場合、どちらを購入する価値があるでしょうか? Vivox100 と Vivox100Pro では外観デザインに明らかな違いがあります

Windows 10 と Windows 11 のパフォーマンス比較: どちらが優れていますか? Mar 28, 2024 am 09:00 AM

Windows 10 と Windows 11 のパフォーマンス比較: どちらが優れていますか?テクノロジーの継続的な開発と進歩により、オペレーティングシステムは常に更新され、アップグレードされます。世界最大のオペレーティングシステム開発者の 1 つとして、Microsoft の Windows シリーズオペレーティングシステムは常にユーザーから大きな注目を集めてきました。 2021 年、Microsoft は Windows 11 オペレーティングシステムをリリースし、広範な議論と注目を引き起こしました。では、Windows 10 と Windows 11 のパフォーマンスの違いは何でしょうか?

SOLコインとBCHコインではどちらの方が可能性が高いでしょうか？ SOLコインとBCHコインの違いは何ですか? Apr 25, 2024 am 09:07 AM

現在、通貨サークルが好む潜在的なコインには、SOL コインと BCH コインが含まれます。SOL は、Solana ブロックチェーンプラットフォームのネイティブトークンであり、ビットコインのフォーク通貨である BitcoinCash プロジェクトのトークンです。技術的特徴、応用シナリオ、開発の方向性が異なるため、投資家にとってSOL通貨とBCHのどちらがより可能性があるかを分析したいと思います。また投資しましょう。ただし、通貨の比較には、市場、開発見通し、プロジェクトの強みなどに基づいた包括的な分析が必要です。続いて編集者が詳しくお伝えします。 SOLコインとBCHではどちらの可能性が高いでしょうか？比較すると、SOL 通貨のほうがより大きな可能性を持っています。SOL 通貨と BCH のどちらがより大きな可能性を持っているかを判断するのは、多くの要因に依存するため、複雑な問題です。

Huawei、ZTE、Tmall、Xiaomi TVボックスの比較 Feb 02, 2024 pm 04:42 PM

TVボックスは、インターネットとテレビを接続する重要なデバイスとして、近年ますます人気が高まっています。スマート TV の人気に伴い、消費者は Tmall、Xiaomi、ZTE、Huawei などの TV ボックスブランドをますます好むようになっています。読者が自分に最適な TV ボックスを選択できるように、この記事ではこれら 4 つの TV ボックスの機能と利点を詳しく比較します。 1. Huawei TV Box: スマートなオーディオビジュアル体験は優れており、スムーズな視聴体験を提供できます. Huawei TV Box は強力なプロセッサーと高解像度の画質を備えています。オンラインビデオ、内蔵のリッチアプリケーション、音楽、ゲームなど、さまざまなオーディオおよびビデオ形式をサポートします。 Huawei TVボックスには音声制御機能もあり、操作がより便利になります。携帯電話のコンテンツをテレビ画面に簡単にキャストできます。ワンクリックでキャストできます。

Vivox100とVivox100Proの比較評価：どちらが好みですか？ Mar 22, 2024 pm 02:33 PM

Vivox100とVivox100Proの比較評価：どちらが好みですか？スマートフォンの人気が高まり、高性能になるにつれて、携帯電話アクセサリに対する人々の需要も高まっています。ヘッドフォンは携帯電話アクセサリの不可欠な部分として、人々の日常生活や仕事において重要な役割を果たしています。数あるヘッドホンブランドの中でも、Vivox100とVivox100Proは注目を集めている2つの製品です。今日は、これら 2 つのヘッドフォンの長所と短所を詳細に比較評価します。

Go言語と他のプログラミング言語の性能比較とメリット・デメリット Mar 07, 2024 pm 12:54 PM

タイトル: Go 言語と他のプログラミング言語のパフォーマンスの比較、長所と短所コンピューター技術の継続的な発展に伴い、プログラミング言語の選択はますます重要になってきており、その中でもパフォーマンスは重要な考慮事項です。この記事では、Go 言語を例として、そのパフォーマンスを他の一般的なプログラミング言語と比較し、それぞれの長所と短所を分析します。 1. Go 言語の概要 Go 言語は、Google が開発したオープンソースのプログラミング言語であり、高速なコンパイル、効率的な同時実行性、簡潔さ、読みやすさなどの特徴を持ち、ネットワークサービス、分散システム、クラウドコンピューティングなどの開発に適しています。他の分野。行く

XMLファイルは何のためにあるのでしょうか？ Aug 03, 2023 am 09:38 AM

XML ファイルは、データの記述と送信に使用されるマークアップ言語です。スケーラビリティ、可読性、柔軟性で知られており、Web アプリケーション、データ交換、Web サービスで広く使用されています。 XML の形式と構造により、データの編成と解釈がシンプルかつ明確になり、データの交換と共有の効率が向上します。

XMLファイルを開く方法 Feb 22, 2024 pm 04:04 PM

一般的な XML ファイルを開く方法: 1. テキストエディター、2. ブラウザー、3. XML エディター、4. 統合開発環境、5. Microsoft Excel など。

See all articles

XML ファイルを解析するいくつかの方法の比較に関する詳細な紹介

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック