首頁 後端開發 XML/RSS教程 解析XML檔案的幾種方式對比的詳細介紹

解析XML檔案的幾種方式對比的詳細介紹

Mar 31, 2017 pm 02:45 PM

工作上常常需要用到解析XML文件、前幾天面試被問到了一些擴充知識,大跌眼鏡。沒有回答的讓人滿意、特此記錄學習一下。 

特點:DOM需要一次載入XML檔案到記憶體。 
      SAX不需要一次載入,分析能夠立即開始,而不是等待所有的資料被處理。 
      JDOM  大量使用了Java的集合物件,大幅提升了Java程式設計師的工作效率28原則。 
      DOM4J 目前使用的最多,我們的專案也是在用DOM4j來解析。 

1)DOM(JAXP Crimson解析器) 
    DOM是以平台和語言無關的方式表示XML文件的官方W3C標準。 DOM是以層次結構組織的節點或資訊片段的集合。這個層次結構允許開發人員在樹中尋找特定資訊。分析該結構通常需要載入整個文件和建構層次結構,然後才能做任何工作。由於它是基於資訊層次的,因而DOM被認為是基於樹或基於物件的。 DOM以及廣義的基於樹的處理具有幾個優點。首先,由於樹在記憶體中是持久的,因此可以修改它以便應用程式能對資料和結構作出更改。它還可以在任何時候在樹中上下導航,而不是像SAX那樣是一次性的處理。 DOM使用起來也要簡單得多。 

    2)SAX 

    SAX處理的優點非常類似串流媒體的優點。分析能夠立即開始,而不是等待所有的資料被處理。而且,由於應用程式只是在讀取數據時檢查數據,因此不需要將數據儲存在記憶體中。這對於大型文件來說是個巨大的優點。事實上,應用程式甚至不必解析整個文件;它可以在某個條件滿足時停止解析。一般來說,SAX還比它的替代者DOM快許多。 

    選擇DOM還是選擇SAX? 對於需要自己編寫程式碼來處理XML文件的開發人員來說, 選擇DOM還是SAX解析模型是一個非常重要的設計決策。 DOM採用建立樹狀結構的方式存取XML文檔,而SAX採用的事件模型。 

    DOM解析器將XML文件轉換成包含其內容的樹,並且可以對樹進行遍歷。用DOM解析模型的優點是程式設計容易,開發人員只需要呼叫建立樹的指令,然後利用navigation APIs存取所需的樹節點來完成任務。可以很容易的添加和修改樹中的元素。然而由於使用DOM解析器的時候需要處理整個XML文檔,所以對效能和記憶體的要求比較高,尤其是遇到很大的XML文件的時候。由於它的遍歷能力,DOM解析器常用於XML文件需要頻繁的改變的服務。

    SAX解析器採用了基於事件的模型,它在解析XML文件的時候可以觸發一系列的事件,當發現給定的tag的時候,它可以激活一個回調方法,告訴該方法制定的標籤已經找到。 SAX對記憶體的要求通常會比較低,因為它讓開發人員自己來決定所要處理的tag.特別是當開發人員只需要處理文件中所包含的部分資料時,SAX這種擴展能力得到了更好的體現。但用SAX解析器的時候編碼工作會比較困難,很難同時存取同一個文件中的多處不同資料。 

    3)JDOM www.jdom.org 

    JDOM的目的是成為Java特定文件模型,它簡化與XML的交互並且比使用DOM實現更快。由於是第一個Java特定模型,JDOM一直被大力推廣和促進。正在考慮透過“Java規範請求JSR-102”將它最終用作“Java標準擴展”。從2000年初就已經開始了JDOM開發。 

    JDOM與DOM主要有兩方面不同。首先,JDOM只使用特定類別而不使用介面。這在某些方面簡化了API,但也限制了靈活性。第二,API大量使用了Collections類,簡化了那些已經熟悉這些類別的Java開發者的使用。 

#    JDOM文件聲明其目的是「使用20%(或更少)的精力解決80%(或更多)Java/XML問題」(根據學習曲線假定為20%)。 JDOM對於大多數Java/XML應用程式來說當然是有用的,而且大多數開發者發現API比DOM容易理解得多。 JDOM還包括對程式行為的相當廣泛檢查以防止使用者做任何在XML中無意義的事。然而,它仍需要您充分理解XML以便做一些超出基本的工作(或甚至理解某些情況下的錯誤)。這也許是比學習DOM或JDOM介面都更有意義的工作。 

    JDOM本身則不包含解析器。它通常使用SAX2解析器來解析和驗證輸入XML文件(儘管它還可以將先前構造的DOM表示作為輸入)。它包含一些轉換器以將JDOM表示輸出成SAX2事件流、DOM模型或XML文字文件。 JDOM是在Apache許可證變體下發布的開放原始碼。 

    4)DOM4J dom4j.sourceforge.net 

    雖然DOM4J代表了完全獨立的開發結果,但最初,它是JDOM的智慧分支。它合併了許多超出基本XML文件表示的功能,包括整合的XPath#支援、XML Schema支援以及用於大型文件或串流文件的基於事件的處理。它還提供了建置文件表示的選項,它透過DOM4J API和標準DOM介面具有並行存取功能。從2000下半年開始,它就一直處於開發之中。 

    為支援所有這些功能,DOM4J使用介面和抽象基本類別方法。 DOM4J大量使用了API中的Collections類,但是在許多情況下,它還提供一些替代方法以允許更好的效能或更直接的編碼方法。直接好處是,雖然DOM4J付出了更複雜的API的代價,但它提供了比JDOM大得多的靈活性。 

    在增加彈性、XPath整合和對大文件處理的目標時,DOM4J的目標與JDOM是一樣的:針對Java開發者的易用性和直覺操作。它也致力於成為比JDOM更完整的解決方案,實現本質上處理所有Java/XML問題的目標。在完成該目標時,它比JDOM更少強調防止不正確的應用程式行為。 

    DOM4J是一個非常非常優秀的Java XML API,具有效能優異、強大且極端易用使用的特點,同時它也是一個開放原始碼的軟體。如今你可以看到越來越多的Java軟體都在使用DOM4J來讀寫XML,特別值得一提的是連Sun的JAXM也在用DOM4J. 

    2…比較 

#    1)DOM4J效能最好,連Sun的JAXM也在用DOM4J.目前許多開源專案中大量採用DOM4J,例如大名鼎鼎的Hibernate也用DOM4J來讀取XML設定檔。如果不考慮可攜性,那就採用DOM4J. 

    2)JDOM和DOM在效能測試時表現不佳,在測試10M文件時記憶體溢位。在小文檔情況下也值得考慮使用DOM和JDOM.雖然JDOM的開發者已經說明他們期望在正式發行版前專注性能問題,但是從性能觀點來看,它確實沒有值得推薦之處。另外,DOM仍是一個非常好的選擇。 DOM實作廣泛應用於多種程式語言。它也是許多其它與XML相關的標準的基礎,因為它正式獲得W3C推薦(與基於非標準的Java模型相對),所以在某些類型的專案中可能也需要它(如在JavaScript中使用DOM)。 

    3)SAX表現較好,這要依賴它特定的解析方式-事件驅動。一個SAX偵測即將到來的XML流,但並沒有載入到記憶體(當然當XML流被讀入時,會有部分文件暫時隱藏在記憶體中)。
   3. 四種xml操作方式的基本使用方法 

xml檔:

<?xml version="1.0" encoding="GB2312"?> 
<RESULT> 
<VALUE> 
   <NO>A1234</NO> 
   <ADDR>XX号</ADDR> 
</VALUE> 
<VALUE> 
   <NO>B1234</NO> 
   <ADDR>XX组</ADDR> 
</VALUE> 
</RESULT>
登入後複製

1)DOM 

#
import java.io.*; 
import java.util.*; 
import org.w3c.dom.*; 
import javax.xml.parsers.*; 

public class MyXMLReader{ 
 public static void main(String arge[]){ 

  long lasting =System.currentTimeMillis(); 
  try{ 
   File f=new File("data_10k.xml"); 
   DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); 
   DocumentBuilder builder=factory.newDocumentBuilder(); 
   Document doc = builder.parse(f); 
   NodeList nl = doc.getElementsByTagName("VALUE"); 
   for (int i=0;i<nl.getLength();i++){ 
    System.out.print("车牌号码:" + doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue()); 
    System.out.println("车主地址:" + doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue()); 
   } 
  }catch(Exception e){ 
   e.printStackTrace(); 
}
登入後複製

2 )SAX 

import org.xml.sax.*; 
import org.xml.sax.helpers.*; 
import javax.xml.parsers.*; 

public class MyXMLReader extends DefaultHandler { 

 java.util.Stack tags = new java.util.Stack(); 
 public MyXMLReader() { 
  super(); 
} 

 public static void main(String args[]) { 
  long lasting = System.currentTimeMillis(); 
  try { 
   SAXParserFactory sf = SAXParserFactory.newInstance(); 
   SAXParser sp = sf.newSAXParser(); 
   MyXMLReader reader = new MyXMLReader(); 
   sp.parse(new InputSource("data_10k.xml"), reader); 
  } catch (Exception e) { 
   e.printStackTrace(); 
  } 

  System.out.println("运行时间:" + (System.currentTimeMillis() - lasting) + "毫秒");} 
  public void characters(char ch[], int start, int length) throws SAXException { 
  String tag = (String) tags.peek(); 
  if (tag.equals("NO")) { 
   System.out.print("车牌号码:" + new String(ch, start, length)); 
} 
if (tag.equals("ADDR")) { 
  System.out.println("地址:" + new String(ch, start, length)); 
} 
} 

  public void startElement(String uri,String localName,String qName,Attributes attrs) { 
  tags.push(qName);} 
}
登入後複製

3) JDOM 

import java.io.*; 
import java.util.*; 
import org.jdom.*; 
import org.jdom.input.*; 

public class MyXMLReader { 

 public static void main(String arge[]) { 
  long lasting = System.currentTimeMillis(); 
  try { 
   SAXBuilder builder = new SAXBuilder(); 
   Document doc = builder.build(new File("data_10k.xml")); 
   Element foo = doc.getRootElement(); 
   List allChildren = foo.getChildren(); 
   for(int i=0;i<allChildren.size();i++) { 
    System.out.print("车牌号码:" + ((Element)allChildren.get(i)).getChild("NO").getText()); 
    System.out.println("车主地址:" + ((Element)allChildren.get(i)).getChild("ADDR").getText()); 
   } 
  } catch (Exception e) { 
   e.printStackTrace(); 
} 

}
登入後複製

4)DOM4J 

import java.io.*; 
import java.util.*; 
import org.dom4j.*; 
import org.dom4j.io.*; 

public class MyXMLReader { 

 public static void main(String arge[]) { 
  long lasting = System.currentTimeMillis(); 
  try { 
   File f = new File("data_10k.xml"); 
   SAXReader reader = new SAXReader(); 
   Document doc = reader.read(f); 
   Element root = doc.getRootElement(); 
   Element foo; 
   for (Iterator i = root.elementIterator("VALUE"); i.hasNext() { 
    foo = (Element) i.next(); 
    System.out.print("车牌号码:" + foo.elementText("NO")); 
    System.out.println("车主地址:" + foo.elementText("ADDR")); 
   } 
  } catch (Exception e) { 
   e.printStackTrace(); 
} 
)
登入後複製

以上是解析XML檔案的幾種方式對比的詳細介紹的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.聊天命令以及如何使用它們
1 個月前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

深度對比:Vivox100和Vivox100Pro,哪個比較值得購買? 深度對比:Vivox100和Vivox100Pro,哪個比較值得購買? Mar 22, 2024 pm 02:06 PM

在當今智慧型手機市場上,消費者面臨越來越多的選擇。隨著科技的不斷發展,手機廠商推出了越來越多的型號和款式,其中Vivox100和Vivox100Pro無疑是備受關注的兩款產品。兩款手機都來自知名品牌Vivox,但在功能、性能和價格上卻有著一定的區別,那麼在面對這兩款手機時,究竟哪個更值得購買呢? Vivox100和Vivox100Pro在外觀設計上有著明顯的差

SOL幣和BCH幣那個比較有潛力? SOL幣和BCH幣有什麼差別? SOL幣和BCH幣那個比較有潛力? SOL幣和BCH幣有什麼差別? Apr 25, 2024 am 09:07 AM

目前被幣圈看好的潛力幣除了SOL幣還有BCH幣,SOL是Solana區塊鏈平台的原生代幣,BCH是BitcoinCash專案的代幣,它是比特幣的一個分叉貨幣。因為有不同的技術特性、應用場景和發展方向,投資人在二者之前做出選擇也比較困難,就想透過分析SOL幣和BCH那個更有潛力?再進行投資。但幣種的比較是要根據市場、發展前景、專案實力等方面綜合分析的。接下來小編為大家詳細說。 SOL幣和BCH那個比較有潛力?相較而言SOL幣更有潛力,確定SOL幣和BCH那個更有潛力是一個複雜的問題,因為這取決於許

Windows10與Windows11效能比較:哪個更勝一籌? Windows10與Windows11效能比較:哪個更勝一籌? Mar 28, 2024 am 09:00 AM

Windows10與Windows11效能比較:哪個更勝一籌?隨著科技的不斷發展與進步,作業系統也不斷更新和升級。微軟公司作為全球最大的作業系統開發人員之一,其發布的Windows系列作業系統一直備受用戶關注。在2021年,微軟發布了Windows11作業系統,引發了廣泛的討論和關注。那麼,究竟Windows10與Windows11在效能方面有何不同,哪個

華為、中興、天貓、小米電視盒對比 華為、中興、天貓、小米電視盒對比 Feb 02, 2024 pm 04:42 PM

電視盒子作為連接網路和電視的重要裝置,近年來變得越來越受歡迎。隨著智慧電視的普及,消費者對天貓、小米、中興和華為等電視盒品牌越來越青睞。為了幫助讀者選擇最適合自己的電視盒,本文將深入比較這四款電視盒子的特色與優點。一、華為電視盒:智慧影音體驗卓越能夠提供流暢的觀影體驗,華為電視盒擁有強大的處理器和高清畫質。如在線視頻,並且內置了豐富的應用程序,音樂和遊戲等,它支援多種音頻和視頻格式。華為電視盒子也具備語音控制功能,同時,讓操作更加便利。可以輕鬆將手機上的內容投射到電視螢幕上,它的一鍵投

Vivox100和Vivox100Pro比較評測:你更傾向哪一款? Vivox100和Vivox100Pro比較評測:你更傾向哪一款? Mar 22, 2024 pm 02:33 PM

Vivox100和Vivox100Pro比較評測:你更傾向哪一款?隨著智慧型手機的不斷普及和功能的日益強大,人們對手機配件的需求也日漸增長。作為手機配件中不可或缺的一部分,耳機在人們的日常生活和工作中扮演著重要的角色。而在眾多耳機品牌中,Vivox100和Vivox100Pro是備受矚目的兩款產品。今天,我們將對這兩款耳機進行詳細的對比評測,看看它們的優點和缺點

Go語言與其他程式語言的效能比較及優劣勢 Go語言與其他程式語言的效能比較及優劣勢 Mar 07, 2024 pm 12:54 PM

標題:Go語言與其他程式語言的效能比較及優劣勢隨著電腦科技的不斷發展,程式語言的選擇越來越關鍵,其中效能是一個重要的考量。本文將以Go語言為例,與其他常見的程式語言進行效能對比,並分析各自的優劣勢。一、Go語言概述Go語言是由Google開發的開源程式語言,具有快速編譯、高效並發、簡潔易讀等特點,適合用於開發網路服務、分散式系統、雲端運算等領域。 Go

xml檔案是幹嘛的 xml檔案是幹嘛的 Aug 03, 2023 am 09:38 AM

XML檔案是用來描述和傳輸資料的一種標記語言。它以其可擴展性、可讀性和靈活性而聞名,廣泛應用於Web應用程式、資料交換和Web服務。 XML的格式和結構使得資料的組織和解釋變得簡單明了,從而提高了資料的交換和共享效率 。

天璣6020在對比中超越驍龍處理器嗎 天璣6020在對比中超越驍龍處理器嗎 Mar 18, 2024 pm 12:36 PM

天璣6020在對比中超越驍龍處理器嗎隨著智慧型手機市場的不斷發展,處理器作為手機性能的關鍵組成部分,一直備受關注。在眾多處理器中,華為麒麟、高通驍龍一直是備受矚目的品牌。最近,華為發布了新一代麒麟處理器天璣6020,引起了廣泛的關注和爭論。那麼,天璣6020在對比中是否超越驍龍處理器呢?驍龍處理器一直以其強大的性能和優秀的功耗控製而著稱,成為了許多手機廠商的首

See all articles