java中使用sax解析xml的解決方法-XML/RSS教程-PHP中文網

首頁

後端開發

XML/RSS教程

java中使用sax解析xml的解決方法

高洛峰

Jan 11, 2017 pm 12:56 PM

在java中，原生解析xml文檔的方式有兩種，分別是：Dom解析和Sax解析

Dom解析功能強大，可增刪改查，操作時會將xml文檔以文檔對象的方式讀取到內存中，因此適用於小文檔

Sax解析是從頭到尾逐行逐行逐行逐個元素讀取內容，修改較為不便，但適用於只讀的大文檔

本文主要講解Sax解析，其餘放在後面

Sax採用事件驅動的方式解析文件。簡單點說，如同在電影院看電影一樣，從頭到尾看一遍就完了，不能回退（Dom可來來回回讀取）

在看電影的過程中，每遇到一個情節，一段淚水，一次擦肩，你都會調動大腦和神經去接收或處理這些訊息

同樣，在Sax的解析過程中，讀取到文檔開頭、結尾，元素的開頭和結尾都會觸發一些回調方法，你可以在這些回調方法中進行對應事件處理

這四個方法是：startDocument() 、 endDocument()、 startElement()、 endElement

此外，光讀取到節點處是不夠的，我們還需要characters()方法來仔細處理元素內包含的內容

將這些回調方法集合起來，便形成了一個類，這個類也就是我們需要的觸發器

一般從Main方法中讀取文檔，卻在觸發器中處理文檔，這就是所謂的事件驅動解析方法

java中使用sax解析xml的解決方法

如上圖，在觸發器中，首先開始讀取文檔，然後開始逐個解析元素，每個元素中的內容會返回到characters()方法

接著結束元素讀取，所有元素讀取完後，結束文檔解析

現在我們開始創建觸發器這個類，要創建這個類首先需要繼承DefaultHandler

創建SaxHandler，並覆蓋相應方法：

import org.xml.sax.Attributes; 
import org.xml.sax.SAXException; 
import org.xml.sax.helpers.DefaultHandler; 

  
public class SaxHandler extends DefaultHandler { 

    /* 此方法有三个参数 
       arg0是传回来的字符数组，其包含元素内容 
       arg1和arg2分别是数组的开始位置和结束位置 */ 
    @Override 
    public void characters(char[] arg0, int arg1, int arg2) throws SAXException { 
        String content = new String(arg0, arg1, arg2); 
        System.out.println(content); 
        super.characters(arg0, arg1, arg2); 
    } 

    @Override 
    public void endDocument() throws SAXException { 
        System.out.println("\n…………结束解析文档…………"); 
        super.endDocument(); 
    } 

    /* arg0是名称空间 
       arg1是包含名称空间的标签，如果没有名称空间，则为空 
       arg2是不包含名称空间的标签 */ 
    @Override 
    public void endElement(String arg0, String arg1, String arg2) 
            throws SAXException { 
        System.out.println("结束解析元素  " + arg2); 
        super.endElement(arg0, arg1, arg2); 
    } 

    @Override 
    public void startDocument() throws SAXException { 
        System.out.println("…………开始解析文档…………\n"); 
        super.startDocument(); 
    } 

    /*arg0是名称空间 
      arg1是包含名称空间的标签，如果没有名称空间，则为空 
      arg2是不包含名称空间的标签 
      arg3很明显是属性的集合 */
    @Override
    public void startElement(String arg0, String arg1, String arg2, 
            Attributes arg3) throws SAXException { 
        System.out.println("开始解析元素 " + arg2); 
        if (arg3 != null) { 
            for (int i = 0; i < arg3.getLength(); i++) { 
                 // getQName()是获取属性名称， 
                System.out.print(arg3.getQName(i) + "=\"" + arg3.getValue(i) + "\""); 
            } 
        } 
        System.out.print(arg2 + ":"); 
        super.startElement(arg0, arg1, arg2, arg3); 
    } 
}

登入後複製

XML文檔：

<?xml version="1.0" encoding="UTF-8"?>  
<books>  
   <book id="001">  
      <title>Harry Potter</title>  
      <author>J K. Rowling</author>  
   </book>  
   <book id="002">  
      <title>Learning XML</title>  
      <author>Erik T. Ray</author>  
   </book>  
</books>

登入後複製

TestDemo測試類別：

import java.io.File; 

import javax.xml.parsers.SAXParser; 
import javax.xml.parsers.SAXParserFactory; 

  
public class TestDemo { 

    public static void main(String[] args) throws Exception { 
        // 1.实例化SAXParserFactory对象 
        SAXParserFactory factory = SAXParserFactory.newInstance(); 
        // 2.创建解析器 
        SAXParser parser = factory.newSAXParser(); 
        // 3.获取需要解析的文档，生成解析器,最后解析文档 
        File f = new File("books.xml"); 
        SaxHandler dh = new SaxHandler(); 
        parser.parse(f, dh); 
    } 
}

登入後複製

輸出結果：

…………开始解析文档………… 

开始解析元素 books 
books:  

开始解析元素 book 
id="001"book:  

开始解析元素 title 
title:Harry Potter 
结束解析元素  title 

        
开始解析元素 author 
author:J K. Rowling 
结束解析元素  author 

     
结束解析元素  book 

     
开始解析元素 book 
id="002"book:  

开始解析元素 title 
title:Learning XML 
结束解析元素  title 

        
开始解析元素 author 
author:Erik T. Ray 
结束解析元素  author 

     
结束解析元素  book 

  
结束解析元素  books 

…………结束解析文档…………

登入後複製

上面的雖然正確顯示了執行流程，但是輸出卻很亂

為了更加清晰的執行此流程，我們還可以重寫SaxHandler，使其將原先的xml文檔還原一遍

重寫的SaxHandler類別：

import org.xml.sax.Attributes; 
import org.xml.sax.SAXException; 
import org.xml.sax.helpers.DefaultHandler; 

  
public class SaxHandler extends DefaultHandler { 

    @Override
    public void characters(char[] arg0, int arg1, int arg2) throws SAXException { 
        System.out.print(new String(arg0, arg1, arg2)); 
        super.characters(arg0, arg1, arg2); 
    } 

    @Override
    public void endDocument() throws SAXException { 
        System.out.println("\n结束解析"); 
        super.endDocument(); 
    } 

    @Override
    public void endElement(String arg0, String arg1, String arg2) 
            throws SAXException { 
        System.out.print("</"); 
        System.out.print(arg2); 
        System.out.print(">"); 
        super.endElement(arg0, arg1, arg2); 
    } 

    @Override
    public void startDocument() throws SAXException { 
        System.out.println("开始解析"); 
        String s = "<?xml version=\"1.0\" encoding=\"UTF-8\"?>"; 
        System.out.println(s); 
        super.startDocument(); 
    } 

    @Override
    public void startElement(String arg0, String arg1, String arg2, 
            Attributes arg3) throws SAXException { 

        System.out.print("<"); 
        System.out.print(arg2); 

        if (arg3 != null) { 
            for (int i = 0; i < arg3.getLength(); i++) { 
                System.out.print(" " + arg3.getQName(i) + "=\"" + arg3.getValue(i) + "\""); 
            } 
        } 
        System.out.print(">"); 
        super.startElement(arg0, arg1, arg2, arg3); 
    } 

}

登入後複製

更多java中使用sax解析xml的解決方法相關文章請關注PHP中文網！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

Java教學

1659

CakePHP 教程

1415

Laravel 教程

1310

PHP教程

1258

C# 教程

1232

Related knowledge

確保您的XML/RSS提要：全面的安全清單 Apr 08, 2025 am 12:06 AM

確保XML/RSSfeeds安全性的方法包括：1.數據驗證，2.加密傳輸，3.訪問控制，4.日誌和監控。這些措施通過網絡安全協議、數據加密算法和訪問控制機制來保護數據的完整性和機密性。

高級XML/RSS教程：ACE您的下一次技術採訪 Apr 06, 2025 am 12:12 AM

XML是一種用於數據存儲和交換的標記語言，RSS是基於XML的格式，用於發布更新內容。 1.XML定義數據結構，適合數據交換和存儲。 2.RSS用於內容訂閱，解析時使用專門庫。 3.解析XML可使用DOM或SAX，生成XML和RSS需正確設置元素和屬性。

RSS文檔工具：構建，驗證和發布提要 Apr 09, 2025 am 12:10 AM

如何構建、驗證和發布RSSfeeds？ 1.構建：使用Python腳本生成RSSfeed，包含標題、鏈接、描述和發布日期。 2.驗證：使用FeedValidator.org或Python腳本檢查RSSfeed是否符合RSS2.0標準。 3.發布：將RSS文件上傳到服務器，或使用Flask動態生成並發布RSSfeed。通過這些步驟，你可以有效管理和分享內容。

是否有基於JSON的RSS替代方案？ Apr 10, 2025 am 09:31 AM

JSONFeed是一種基於JSON的RSS替代方案，其優勢在於簡潔性和易用性。 1)JSONFeed使用JSON格式，易於生成和解析。 2)它支持動態生成，適用於現代Web開發。 3)使用JSONFeed可以提升內容管理效率和用戶體驗。

XML在RSS中的優勢：技術深度潛水 Apr 23, 2025 am 12:02 AM

XML在RSS中具有結構化數據、可擴展性、跨平台兼容性和解析驗證的優勢。 1）結構化數據確保內容的一致性和可靠性；2）可擴展性允許添加自定義標籤以適應內容需求；3）跨平台兼容性使其在不同設備上無縫工作；4）解析和驗證工具確保Feed的質量和完整性。

從XML到可讀的內容：揭開RSS feed的神秘面紗 Apr 11, 2025 am 12:03 AM

rssfeedsarexmldocuments usedforcontentAggregation and distribution.totransformthemintoreadableContent：1）parsethethexmlusinglibrarieslibrariesliblarieslikeparserinparserinpython.2）andledifferentifferentrssssssssssssssssssssssssssssssssssssssssssssssersions andpotentionparsingrorS.3）

用XML建造供稿：RSS的動手指南 Apr 14, 2025 am 12:17 AM

使用XML構建RSSfeed的步驟如下：1.創建根元素並設置版本；2.添加channel元素及其基本信息；3.添加條目（item）元素，包括標題、鏈接和描述；4.轉換XML結構為字符串並輸出。通過這些步驟，你可以從零開始創建一個有效的RSSfeed，並通過添加額外的元素如發布日期和作者信息來增強其功能。