目次
1.SAX 解析
[手順]:
1.SAX解析
SAXParserFactory spf = SAXParserFactory.newInstance();
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
2. startElement に追加します。 > メソッド " >
SAXParserFactory spf = SAXParserFactory.newInstance();
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
2. startElement に追加します。 > メソッド
1.2.SAX解析实例

XML - XML 解析用の SAX

Feb 24, 2017 pm 03:06 PM

1.SAX 解析

  • DOM を使用して XML ドキュメントを解析する場合、XML ドキュメント全体を読み取り、DOM ツリー全体の Document オブジェクトをメモリ内に構築してから、XML ドキュメントを操作する必要があります。 。この場合、XML ドキュメントが特に大きい場合は、コンピュータのメモリを大量に消費し、ひどい場合にはメモリ オーバーフローが発生することもあります。

  • SAX 解析を使用すると、文書を操作する前に文書全体がロードされるまで待つことなく、文書の読み取り時に文書を処理できます。

  • DefaultHandler

を継承してSAXパーサーを開発する [注意] SAXは主にXML文書の解析に使用され、要素の変更、削除、追加はできません。

1.1. SAX 解析メカニズム

sax はプッシュ メカニズムであり、XML ドキュメント内のコンテンツが見つかったときにパーサーが通知します (イベントをプッシュします)。 Java Swing でのイベント リスニングに多少似ています)。これらの結果をどう処理するかを決定するのはプログラマの責任です。

Sax ベースのプログラムでは、最も一般的に使用される 5 つの Sax イベントがあります:

1.startDocument()–> は、パーサーがドキュメントの先頭を見つけたことを示し、パーサーがスキャンを開始したことを示します。書類

2.endDocument()–> パーサーがドキュメントの終わりを見つけたことを示します
; 3.startElement()–> このイベントは、パーサーが開始タグを見つけたことを示し、要素のすべての属性名と値を示します。 4.characters()–> パーサーがテキストを見つけたことを示します。これらの 3 つの変数を使用して、パーサーが見つけたテキストを取得できます。 5.endElement()–> このイベントは、要素の名前を示します


引き続き、DOM 解析で使用される XML の例を使用します。
<?xml version="1.0" encoding="utf-8" standalone="no"?><班级>
    <学生 地址="香港">
        <名字>周小星</名字>
        <年龄>23</年龄>
        <介绍>学习刻苦</介绍>
    </学生>
    <学生 地址="澳门">
        <名字>林晓</名字>
        <年龄>25</年龄>
        <介绍>是一个好学生</介绍>
    </学生></班级>
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

[手順]:

1. SAXParserFactory を使用して SAX 解析ファクトリーを作成します

SAXParserFactory spf = SAXParserFactory.newInstance();
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

2. SAX 解析ファクトリーを通じてパーサー オブジェクトを取得します

SAXParser sp = spf.newSAXParser();
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
3. 解析オブジェクトとイベント ハンドラーを関連付けます。 object

sp.parse("src/myClass.xml",new MyHandler());
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

ここで、MyHandler は自分で定義する必要があり、

を継承してから、MyHandler クラスで上記の 5 つの Sax イベント メソッドを書き換える必要があります。 、必要なものを書き直すこともできます。

たとえば、今書いた MyHandler は次のとおりです:

class MyHandler extends DefaultHandler{    /**
     * 发现文档开始,该函数只会被调用一次
     */
    @Override
    public void startDocument() throws SAXException {
        System.out.println("startDocument");
    }    /**
     * 发现文档结束,该函数只会被调用一次
     */
    @Override
    public void endDocument() throws SAXException {
        System.out.println("endDocument");
    }    /**
     * 发现XML中的一个元素开始,会被反复调用
     */
    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        System.out.println("元素名称:"+qName);
    }    /**
     * 发现XML中的一个元素结束,会被反复调用
     */
    @Override
    public void endElement(String uri, String localName, String qName)            
    throws SAXException {

    }    /**
     * 发现XML文件中的文本,会被反复调用
     */
    @Override
    public void characters(char[] ch, int start, int length)            
    throws SAXException {        // 显示文本内容
        String text = new String(ch,start,length);        if(!text.trim().equals("")){
            System.out.println(text);
        }
    }
}
ログイン後にコピー

実行結果は次のとおりです:

実行結果 1MyHandler需要自己定义,并且它要继承DefaultHandler,然后在MyHandler类中重写上文提到的5个sax事件方法,当然也可以只重写自己需要的。
比如现在我写的MyHandler如下:

private boolean isName = false;private boolean isAge = false;
ログイン後にコピー
ログイン後にコピー

运行结果如下:

XML - XML 解析用の SAX

可以看到,这是对XML文档的一种遍历,而sax能够做的也只是遍历了。


那么,如果现在我们有这样一个需求:只显示所有学生的姓名和年龄,不显示学生的介绍,怎么实现呢?

我们可以在MyHandler类中定义两个布尔变量isName和isAge,在startElement方法中标识是否是姓名元素或者年龄元素,如果是的话才在characters方法中获取对应的文本,如下:

1.定义两个布尔变量

@Overridepublic void startElement(String uri, String localName, String qName,
        Attributes attributes) throws SAXException {    if(qName.equals("名字")){        this.isName = true;
    }else if(qName.equals("年龄")){        this.isAge = true;
    }
}
ログイン後にコピー

2.在startElement方法中添加判断

@Overridepublic void characters(char[] ch, int start, int length)        throws SAXException {    // 显示文本内容
    String text = new String(ch,start,length);    if(!text.trim().equals("")&&(isName||isAge)){
        System.out.println(text);
    }
    isName = false;
    isAge = false;
}
ログイン後にコピー
ログイン後にコピー

3.在characters方法中根据标识符进行判断是否获取文本

<?xml version="1.0" encoding="utf-8" standalone="no"?><班级>
    <学生 地址="香港">
        <名字>周小星</名字>
        <年龄>23</年龄>
        <介绍>学习刻苦</介绍>
    </学生>
    <学生 地址="澳门">
        <名字>林晓</名字>
        <年龄>25</年龄>
        <介绍>是一个好学生</介绍>
    </学生></班级>
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

最后要记得将两个布尔变量复位成false。
运行结果如下:

XML - XML 解析用の SAX

1.SAX解析

  • 在使用DOM解析XML文档时,需要读取整个XML文档,在内存中构建整个DOM树的Document对象,从而再对XML文档进行操作。此种情况下,如果XML文档特别大,就会消耗计算机的大量内存,严重的情况下可能还会导致内存溢出。

  • SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才对文档进行操作。

  • 通过继承DefaultHandler

    これは XML ドキュメントのトラバースであることがわかります。sax ができるのはトラバースだけです。

それでは、次のような要件がある場合:
すべての生徒の名前と年齢のみを表示し、生徒の紹介は表示しない場合、どのように実装すればよいでしょうか?

MyHandler クラスで 2 つのブール変数 isName と isAge を定義し、startElement メソッドでそれが name 要素であるか age 要素であるかを識別できます。はいの場合は、次のように characters メソッドで対応するテキストを取得します。

1. 2 つのブール変数を定義します

SAXParserFactory spf = SAXParserFactory.newInstance();
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
2. startElement に追加します。 > メソッド

SAXParser sp = spf.newSAXParser();
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

を決定します。 3. characters メソッドで、識別子

🎜
sp.parse("src/myClass.xml",new MyHandler());
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー
🎜 に基づいてテキストを取得するかどうかを判断します。 最後に、2 つのブール変数を false にリセットすることを忘れないでください。 🎜実行結果は以下の通りです: 🎜🎜XML - XML 解析用の SAX🎜🎜🎜1.SAX 解析🎜🎜🎜🎜🎜DOM を使用して XML ドキュメントを解析する場合、XML ドキュメント全体を読み取り、DOM ツリー全体の Document オブジェクトをメモリ内に構築してから、操作を行う必要があります。 XML ドキュメント。この場合、XML ドキュメントが特に大きい場合は、コンピュータのメモリを大量に消費し、ひどい場合にはメモリ オーバーフローが発生することもあります。 🎜🎜🎜🎜SAX 解析を使用すると、文書を操作する前に文書全体がロードされるまで待つことなく、文書の読み取り時に文書を処理できます。 🎜🎜🎜🎜🎜🎜🎜🎜🎜🎜🎜🎜を継承してSAXパーサーを開発する [注意] SAXは主にXML文書の解析に使用され、要素の変更、削除、追加はできません。 🎜🎜🎜🎜🎜1.1. SAX 解析メカニズム 🎜🎜🎜sax はプッシュ メカニズムです。XML ドキュメント内のコンテンツが見つかった場合、パーサーはそれを通知します (イベントをプッシュします)。 Java Swing でイベントをリッスンする)。これらの結果をどう処理するかを決定するのはプログラマの責任です。 🎜🎜 サックスベースのプログラムでは、最も一般的に使用される 5 つのサックス イベントがあります: 🎜

1.startDocument()–>告诉你解析器发现了文档的开始,告诉你解析器开始扫描文档
2.endDocument()–>告诉你解析器发现了文档结尾
3.startElement()–>告诉你解析器发现了一个起始标签,该事件告诉你标签的名称、该元素所有的属性名和值
4.characters()–>告诉你解析器发现了一些文本,将得到一个字符数组,该数组的偏移量和一个长度偏移量,有这三个变量你可以得到解析器发现的文本
5.endElement()–>告诉你解析器发现了一个结束标签,该事件告诉你元素的名称

1.2.SAX解析实例

依然使用DOM解析中用到的XML例子,如下:

<?xml version="1.0" encoding="utf-8" standalone="no"?><班级>
    <学生 地址="香港">
        <名字>周小星</名字>
        <年龄>23</年龄>
        <介绍>学习刻苦</介绍>
    </学生>
    <学生 地址="澳门">
        <名字>林晓</名字>
        <年龄>25</年龄>
        <介绍>是一个好学生</介绍>
    </学生></班级>
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

【步骤】:

1.使用SAXParserFactory创建SAX解析工厂

SAXParserFactory spf = SAXParserFactory.newInstance();
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

2.通过SAX解析工厂得到解析器对象

SAXParser sp = spf.newSAXParser();
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

3.将解析对象和事件处理器对象关联

sp.parse("src/myClass.xml",new MyHandler());
ログイン後にコピー
ログイン後にコピー
ログイン後にコピー

这里的MyHandler需要自己定义,并且它要继承DefaultHandler,然后在MyHandler类中重写上文提到的5个sax事件方法,当然也可以只重写自己需要的。
比如现在我写的MyHandler如下:

class MyHandler extends DefaultHandler{    /**
     * 发现文档开始,该函数只会被调用一次
     */
    @Override
    public void startDocument() throws SAXException {
        System.out.println("startDocument");
    }    /**
     * 发现文档结束,该函数只会被调用一次
     */
    @Override
    public void endDocument() throws SAXException {
        System.out.println("endDocument");
    }    /**
     * 发现XML中的一个元素开始,会被反复调用
     */
    @Override
    public void startElement(String uri, String localName, String qName,
            Attributes attributes) throws SAXException {
        System.out.println("元素名称:"+qName);
    }    /**
     * 发现XML中的一个元素结束,会被反复调用
     */
    @Override
    public void endElement(String uri, String localName, String qName)            
    throws SAXException {

    }    /**
     * 发现XML文件中的文本,会被反复调用
     */
    @Override
    public void characters(char[] ch, int start, int length)            
    throws SAXException {        // 显示文本内容
        String text = new String(ch,start,length);        
        if(!text.trim().equals("")){
            System.out.println(text);
        }
    }
}
ログイン後にコピー

运行结果如下:

XML - XML 解析用の SAX

可以看到,这是对XML文档的一种遍历,而sax能够做的也只是遍历了。


那么,如果现在我们有这样一个需求:只显示所有学生的姓名和年龄,不显示学生的介绍,怎么实现呢?

我们可以在MyHandler类中定义两个布尔变量isName和isAge,在startElement方法中标识是否是姓名元素或者年龄元素,如果是的话才在characters方法中获取对应的文本,如下:

1.定义两个布尔变量

private boolean isName = false;private boolean isAge = false;
ログイン後にコピー
ログイン後にコピー

2.在startElement方法中添加判断

@Overridepublic void startElement(String uri, String localName, String qName,
        Attributes attributes) throws SAXException {    if(qName.equals("名字")){        
        this.isName = true;
    }else if(qName.equals("年龄")){        this.isAge = true;
    }
}
ログイン後にコピー

3.在characters方法中根据标识符进行判断是否获取文本

@Overridepublic void characters(char[] ch, int start, int length)        throws SAXException {    // 显示文本内容
    String text = new String(ch,start,length);    if(!text.trim().equals("")&&(isName||isAge)){
        System.out.println(text);
    }
    isName = false;
    isAge = false;
}
ログイン後にコピー
ログイン後にコピー

最后要记得将两个布尔变量复位成false。
运行结果如下:

XML - XML 解析用の SAX

 以上就是XML—XML解析之SAX的内容,更多相关内容请关注PHP中文网(www.php.cn)!


このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

PowerPoint を使用して XML ファイルを開くことはできますか? PowerPoint を使用して XML ファイルを開くことはできますか? Feb 19, 2024 pm 09:06 PM

XML ファイルは PPT で開くことができますか? XML、Extensible Markup Language (Extensible Markup Language) は、データ交換とデータ ストレージで広く使用されている汎用マークアップ言語です。 HTML と比較して、XML はより柔軟であり、独自のタグとデータ構造を定義できるため、データの保存と交換がより便利で統一されます。 PPT (PowerPoint) は、プレゼンテーションを作成するために Microsoft によって開発されたソフトウェアです。包括的な方法を提供します。

Python を使用した XML データのマージと重複排除 Python を使用した XML データのマージと重複排除 Aug 07, 2023 am 11:33 AM

Python を使用した XML データのマージと重複排除 XML (eXtensibleMarkupLanguage) は、データの保存と送信に使用されるマークアップ言語です。 XML データを処理するとき、複数の XML ファイルを 1 つにマージしたり、重複データを削除したりする必要がある場合があります。この記事では、Python を使用して XML データのマージと重複排除を実装する方法と、対応するコード例を紹介します。 1. XML データのマージ 複数の XML ファイルがある場合、それらをマージする必要があります。

Python を使用した XML データのフィルタリングと並べ替え Python を使用した XML データのフィルタリングと並べ替え Aug 07, 2023 pm 04:17 PM

Python を使用した XML データのフィルタリングと並べ替えの実装 はじめに: XML は、データをタグと属性の形式で保存する、一般的に使用されるデータ交換形式です。 XML データを処理するとき、多くの場合、データのフィルタリングと並べ替えが必要になります。 Python には、XML データを処理するための便利なツールとライブラリが多数用意されています。この記事では、Python を使用して XML データをフィルタリングおよび並べ替える方法を紹介します。 XML ファイルの読み取り 始める前に、XML ファイルを読み取る必要があります。 Python には XML 処理ライブラリが多数ありますが、

Python で XML データを CSV 形式に変換する Python で XML データを CSV 形式に変換する Aug 11, 2023 pm 07:41 PM

Python の XML データを CSV 形式に変換する XML (ExtensibleMarkupLanguage) は、データの保存と送信に一般的に使用される拡張可能なマークアップ言語です。 CSV (CommaSeparatedValues) は、データのインポートとエクスポートに一般的に使用されるカンマ区切りのテキスト ファイル形式です。データを処理するとき、分析や処理を容易にするために、XML データを CSV 形式に変換する必要がある場合があります。 Pythonは強力です

PHP を使用して XML データをデータベースにインポートする PHP を使用して XML データをデータベースにインポートする Aug 07, 2023 am 09:58 AM

PHP を使用した XML データのデータベースへのインポート はじめに: 開発中、さらなる処理や分析のために外部データをデータベースにインポートする必要がよくあります。一般的に使用されるデータ交換形式として、XML は構造化データの保存と送信によく使用されます。この記事では、PHP を使用して XML データをデータベースにインポートする方法を紹介します。ステップ 1: XML ファイルを解析する まず、XML ファイルを解析し、必要なデータを抽出する必要があります。 PHP には XML を解析するためのいくつかの方法が用意されており、最も一般的に使用されるのは Simple を使用する方法です。

Python は XML と JSON 間の変換を実装します Python は XML と JSON 間の変換を実装します Aug 07, 2023 pm 07:10 PM

Python は XML と JSON 間の変換を実装します はじめに: 日常の開発プロセスでは、異なる形式間でデータを変換する必要があることがよくあります。 XML と JSON は一般的なデータ交換形式であり、Python ではさまざまなライブラリを使用して XML と JSON の間で変換できます。この記事では、一般的に使用されるいくつかの方法をコード例とともに紹介します。 1. Python で XML を JSON に変換するには、xml.etree.ElementTree モジュールを使用できます。

Python を使用した XML でのエラーと例外の処理 Python を使用した XML でのエラーと例外の処理 Aug 08, 2023 pm 12:25 PM

Python を使用した XML でのエラーと例外の処理 XML は、構造化データの保存と表現に使用される一般的に使用されるデータ形式です。 Python を使用して XML を処理すると、エラーや例外が発生することがあります。この記事では、Python を使用して XML のエラーと例外を処理する方法を紹介し、参考用のサンプル コードをいくつか示します。 Try-Except ステートメントを使用して XML 解析エラーを捕捉する Python を使用して XML を解析すると、時々、次のようなエラーが発生することがあります。

Python は XML 内の特殊文字とエスケープ シーケンスを解析します Python は XML 内の特殊文字とエスケープ シーケンスを解析します Aug 08, 2023 pm 12:46 PM

Python は XML 内の特殊文字とエスケープ シーケンスを解析します XML (eXtensibleMarkupLanguage) は、異なるシステム間でデータを転送および保存するために一般的に使用されるデータ交換形式です。 XML ファイルを処理する場合、特殊文字やエスケープ シーケンスが含まれる状況に遭遇することが多く、これにより解析エラーやデータの誤解が生じる可能性があります。したがって、Python を使用して XML ファイルを解析する場合は、これらの特殊文字とエスケープ シーケンスの処理方法を理解する必要があります。 1. 特殊文字と

See all articles