目錄
關鍵字:Java解析xml、解析xml四種方法、DOM、SAX、JDOM、DOM4j、XPath
【引言】
一、【基礎知識-掃盲】
二、【DOM、SAX、JDOM、DOM4j簡單使用介紹】
三、【效能測試】
四、【比較】
五、【小插曲XPath】
首頁 後端開發 XML/RSS教程 詳細介紹解析Xml四種方法的範例程式碼

詳細介紹解析Xml四種方法的範例程式碼

Mar 23, 2017 pm 04:36 PM
xml

關鍵字:Java解析xml、解析xml四種方法、DOM、SAX、JDOM、DOM4j、XPath

【引言】

目前在Java中用於解析XML的技術很多,主流的有DOM、SAX、JDOM、DOM4j,下文主要介紹這4種解析XML文檔技術的使用、優缺點及效能測試。

一、【基礎知識-掃盲】

sax、dom是兩種對xml文檔進行解析的方法(沒有具體實現,只是介面),所以只有它們是無法解析xml文件的;jaxp只是api,它進一步封裝了sax、dom兩種接口,並且提供了DomcumentBuilderFactory/DomcumentBuilder和SAXParserFactory/SAXParser(預設使用xerces解釋器)。

二、【DOM、SAX、JDOM、DOM4j簡單使用介紹】

1、【DOM(Document Object Model) 】
W3C 提供的接口,它將整個XML文件讀入內存,建立一個DOM樹來對各個節點(Node)進行操作。
範例程式碼:

<?xml version="1.0" encoding="UTF-8"?>  
<university name="pku">  
    <college name="c1">  
        <class name="class1">  
            <student name="stu1" sex=&#39;male&#39; age="21" />  
            <student name="stu2" sex=&#39;female&#39; age="20" />  
            <student name="stu3" sex=&#39;female&#39; age="20" />  
        </class>  
        <class name="class2">  
            <student name="stu4" sex=&#39;male&#39; age="19" />  
            <student name="stu5" sex=&#39;female&#39; age="20" />  
            <student name="stu6" sex=&#39;female&#39; age="21" />  
        </class>  
    </college>  
    <college name="c2">  
        <class name="class3">  
            <student name="stu7" sex=&#39;male&#39; age="20" />  
        </class>  
    </college>  
    <college name="c3">  
    </college>  
</university>
登入後複製

後文程式碼中有使用到text.xml(該文檔放在src路徑下,既編譯後在classes路徑下),都是指該xml文檔。

package test.xml;  
import java.io.File;  
import java.io.FileNotFoundException;  
import java.io.FileOutputStream;  
import java.io.IOException;  
import java.io.InputStream;  
import javax.xml.parsers.DocumentBuilder;  
import javax.xml.parsers.DocumentBuilderFactory;  
import javax.xml.parsers.ParserConfigurationException;  
import javax.xml.transform.Transformer;  
import javax.xml.transform.TransformerConfigurationException;  
import javax.xml.transform.TransformerException;  
import javax.xml.transform.TransformerFactory;  
import javax.xml.transform.dom.DOMSource;  
import javax.xml.transform.stream.StreamResult;  
import org.w3c.dom.Document;  
import org.w3c.dom.Element;  
import org.w3c.dom.Node;  
import org.w3c.dom.NodeList;  
import org.w3c.dom.Text;  
import org.xml.sax.SAXException;  
/** 
 * dom读写xml 
 * @author whwang 
 */  
public class TestDom {  
    public static void main(String[] args) {  
        read();  
        //write();   
    }  
    public static void read() {  
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  
        try {  
            DocumentBuilder builder = dbf.newDocumentBuilder();  
            InputStream in = TestDom.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.parse(in);  
            // root <university>   
            Element root = doc.getDocumentElement();  
            if (root == null) return;  
            System.err.println(root.getAttribute("name"));  
            // all college node   
            NodeList collegeNodes = root.getChildNodes();  
            if (collegeNodes == null) return;  
            for(int i = 0; i < collegeNodes.getLength(); i++) {  
                Node college = collegeNodes.item(i);  
                if (college != null && college.getNodeType() == Node.ELEMENT_NODE) {  
                    System.err.println("\t" + college.getAttributes().getNamedItem("name").getNodeValue());  
                    // all class node   
                    NodeList classNodes = college.getChildNodes();  
                    if (classNodes == null) continue;  
                    for (int j = 0; j < classNodes.getLength(); j++) {  
                        Node clazz = classNodes.item(j);  
                        if (clazz != null && clazz.getNodeType() == Node.ELEMENT_NODE) {  
                            System.err.println("\t\t" + clazz.getAttributes().getNamedItem("name").getNodeValue());  
                            // all student node   
                            NodeList studentNodes = clazz.getChildNodes();  
                            if (studentNodes == null) continue;  
                            for (int k = 0; k < studentNodes.getLength(); k++) {  
                                Node student = studentNodes.item(k);  
                                if (student != null && student.getNodeType() == Node.ELEMENT_NODE) {  
                                    System.err.print("\t\t\t" + student.getAttributes().getNamedItem("name").getNodeValue());  
                                    System.err.print(" " + student.getAttributes().getNamedItem("sex").getNodeValue());  
                                    System.err.println(" " + student.getAttributes().getNamedItem("age").getNodeValue());  
                                }  
                            }  
                        }  
                    }  
                }  
            }  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (FileNotFoundException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
    public static void write() {  
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  
        try {  
            DocumentBuilder builder = dbf.newDocumentBuilder();  
            InputStream in = TestDom.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.parse(in);  
            // root <university>   
            Element root = doc.getDocumentElement();  
            if (root == null) return;  
            // 修改属性   
            root.setAttribute("name", "tsu");  
            NodeList collegeNodes = root.getChildNodes();  
            if (collegeNodes != null) {  
                for (int i = 0; i <collegeNodes.getLength() - 1; i++) {  
                    // 删除节点   
                    Node college = collegeNodes.item(i);  
                    if (college.getNodeType() == Node.ELEMENT_NODE) {  
                        String collegeName = college.getAttributes().getNamedItem("name").getNodeValue();  
                        if ("c1".equals(collegeName) || "c2".equals(collegeName)) {  
                            root.removeChild(college);  
                        } else if ("c3".equals(collegeName)) {  
                            Element newChild = doc.createElement("class");  
                            newChild.setAttribute("name", "c4");  
                            college.appendChild(newChild);  
                        }  
                    }  
                }  
            }  
            // 新增节点   
            Element addCollege = doc.createElement("college");  
            addCollege.setAttribute("name", "c5");  
            root.appendChild(addCollege);  
            Text text = doc.createTextNode("text");  
            addCollege.appendChild(text);  
            // 将修改后的文档保存到文件   
            TransformerFactory transFactory = TransformerFactory.newInstance();  
            Transformer transFormer = transFactory.newTransformer();  
            DOMSource domSource = new DOMSource(doc);  
            File file = new File("src/dom-modify.xml");  
            if (file.exists()) {  
                file.delete();  
            }  
            file.createNewFile();  
            FileOutputStream out = new FileOutputStream(file);           
            StreamResult xmlResult = new StreamResult(out);  
            transFormer.transform(domSource, xmlResult);  
            System.out.println(file.getAbsolutePath());  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        } catch (TransformerConfigurationException e) {  
            e.printStackTrace();  
        } catch (TransformerException e) {  
            e.printStackTrace();  
        }  
    }  
}
登入後複製


#程式碼只要稍做修改,即可變得更簡潔,無需一直寫if來判斷是否有子節點。

2、【SAX (Simple API for XML) 】
SAX不用將整個文件載入到內存,基於事件驅動的API(Observer模式),使用者只需要註冊自己感興趣的事件。 SAX提供EntityResolver, DTDHandler, ContentHandler, ErrorHandler接口,分別用於監聽解析實體事件、DTD處理事件、正文處理事件和處理出錯事件,與AWT類似, SAX也提供了一個對這4個介面預設的類別DefaultHandler(這裡的預設實現,其實就是一個空方法),一般只要繼承DefaultHandler,重寫自己感興趣的事件即可。
範例程式碼:

package test.xml;  
import java.io.IOException;  
import java.io.InputStream;  
import javax.xml.parsers.ParserConfigurationException;  
import javax.xml.parsers.SAXParser;  
import javax.xml.parsers.SAXParserFactory;  
import org.xml.sax.Attributes;  
import org.xml.sax.InputSource;  
import org.xml.sax.Locator;  
import org.xml.sax.SAXException;  
import org.xml.sax.SAXParseException;  
import org.xml.sax.helpers.DefaultHandler;  
/** 
 * 
 * @author whwang 
 */  
public class TestSAX {  
    public static void main(String[] args) {  
        read();  
        write();  
    }  
    public static void read() {  
        try {  
            SAXParserFactory factory = SAXParserFactory.newInstance();  
            SAXParser parser = factory.newSAXParser();  
            InputStream in = TestSAX.class.getClassLoader().getResourceAsStream("test.xml");  
            parser.parse(in, new MyHandler());  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
    public static void write() {  
        System.err.println("纯SAX对于写操作无能为力");  
    }  
}  
// 重写对自己感兴趣的事件处理方法   
class MyHandler extends DefaultHandler {  
    @Override  
    public InputSource resolveEntity(String publicId, String systemId)  
            throws IOException, SAXException {  
        return super.resolveEntity(publicId, systemId);  
    }  
    @Override  
    public void notationDecl(String name, String publicId, String systemId)  
            throws SAXException {  
        super.notationDecl(name, publicId, systemId);  
    }  
    @Override  
    public void unparsedEntityDecl(String name, String publicId,  
            String systemId, String notationName) throws SAXException {  
        super.unparsedEntityDecl(name, publicId, systemId, notationName);  
    }  
    @Override  
    public void setDocumentLocator(Locator locator) {  
        super.setDocumentLocator(locator);  
    }  
    @Override  
    public void startDocument() throws SAXException {  
        System.err.println("开始解析文档");  
    }  
    @Override  
    public void endDocument() throws SAXException {  
        System.err.println("解析结束");  
    }  
    @Override  
    public void startPrefixMapping(String prefix, String uri)  
            throws SAXException {  
        super.startPrefixMapping(prefix, uri);  
    }  
    @Override  
    public void endPrefixMapping(String prefix) throws SAXException {  
        super.endPrefixMapping(prefix);  
    }  
    @Override  
    public void startElement(String uri, String localName, String qName,  
            Attributes attributes) throws SAXException {  
        System.err.print("Element: " + qName + ", attr: ");  
        print(attributes);  
    }  
    @Override  
    public void endElement(String uri, String localName, String qName)  
            throws SAXException {  
        super.endElement(uri, localName, qName);  
    }  
    @Override  
    public void characters(char[] ch, int start, int length)  
            throws SAXException {  
        super.characters(ch, start, length);  
    }  
    @Override  
    public void ignorableWhitespace(char[] ch, int start, int length)  
            throws SAXException {  
        super.ignorableWhitespace(ch, start, length);  
    }  
    @Override  
    public void processingInstruction(String target, String data)  
            throws SAXException {  
        super.processingInstruction(target, data);  
    }  
    @Override  
    public void skippedEntity(String name) throws SAXException {  
        super.skippedEntity(name);  
    }  
    @Override  
    public void warning(SAXParseException e) throws SAXException {  
        super.warning(e);  
    }  
    @Override  
    public void error(SAXParseException e) throws SAXException {  
        super.error(e);  
    }  
    @Override  
    public void fatalError(SAXParseException e) throws SAXException {  
        super.fatalError(e);  
    }  
    private void print(Attributes attrs) {  
        if (attrs == null) return;  
        System.err.print("[");  
        for (int i = 0; i < attrs.getLength(); i++) {  
            System.err.print(attrs.getQName(i) + " = " + attrs.getValue(i));  
            if (i != attrs.getLength() - 1) {  
                System.err.print(", ");  
            }  
        }  
        System.err.println("]");  
    }  
}
登入後複製

3、【JDOM】
JDOM與DOM非常類似,它是處理XML的純JAVA API,API大量使用了Collections類,且JDOM僅使用具體類別而不使用介面。 JDOM 它本身不包含解析器。它通常使用 SAX2 解析器來解析和驗證輸入 XML 文件(儘管它還可以將先前構造的 DOM 表示作為輸入)。它包含一些轉換器以將JDOM 表示輸出成SAX2 事件流、DOM 模型或XML 文字文件
範例程式碼:

package test.xml;  
import java.io.File;  
import java.io.FileOutputStream;  
import java.io.IOException;  
import java.io.InputStream;  
import java.util.List;  
import org.jdom.Attribute;  
import org.jdom.Document;  
import org.jdom.Element;  
import org.jdom.JDOMException;  
import org.jdom.input.SAXBuilder;  
import org.jdom.output.XMLOutputter;  
/** 
 * JDom读写xml 
 * @author whwang 
 */  
public class TestJDom {  
    public static void main(String[] args) {  
        //read();   
        write();  
    }  
    public static void read() {  
        try {  
            boolean validate = false;  
            SAXBuilder builder = new SAXBuilder(validate);  
            InputStream in = TestJDom.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.build(in);  
            // 获取根节点 <university>   
            Element root = doc.getRootElement();  
            readNode(root, "");  
        } catch (JDOMException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
    @SuppressWarnings("unchecked")  
    public static void readNode(Element root, String prefix) {  
        if (root == null) return;  
        // 获取属性   
        List<Attribute> attrs = root.getAttributes();  
        if (attrs != null && attrs.size() > 0) {  
            System.err.print(prefix);  
            for (Attribute attr : attrs) {  
                System.err.print(attr.getValue() + " ");  
            }  
            System.err.println();  
        }  
        // 获取他的子节点   
        List<Element> childNodes = root.getChildren();  
        prefix += "\t";  
        for (Element e : childNodes) {  
            readNode(e, prefix);  
        }  
    }  
    public static void write() {  
        boolean validate = false;  
        try {  
            SAXBuilder builder = new SAXBuilder(validate);  
            InputStream in = TestJDom.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.build(in);  
            // 获取根节点 <university>   
            Element root = doc.getRootElement();  
            // 修改属性   
            root.setAttribute("name", "tsu");  
            // 删除   
            boolean isRemoved = root.removeChildren("college");  
            System.err.println(isRemoved);  
            // 新增   
            Element newCollege = new Element("college");  
            newCollege.setAttribute("name", "new_college");  
            Element newClass = new Element("class");  
            newClass.setAttribute("name", "ccccc");  
            newCollege.addContent(newClass);  
            root.addContent(newCollege);  
            XMLOutputter out = new XMLOutputter();  
            File file = new File("src/jdom-modify.xml");  
            if (file.exists()) {  
                file.delete();  
            }  
            file.createNewFile();  
            FileOutputStream fos = new FileOutputStream(file);  
            out.output(doc, fos);  
        } catch (JDOMException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
}
登入後複製

4、【DOM4j】
dom4j是目前在xml解析方面是最優秀的(Hibernate、Sun的JAXM也都使用dom4j來解析XML),它合併了許多超出基本XML 文件表示的功能,包括集成的XPath 支援、XML Schema支援以及用於大文件或串流文件的基於事件的處理
範例程式碼:

package test.xml;  
import java.io.File;  
import java.io.FileWriter;  
import java.io.IOException;  
import java.io.InputStream;  
import java.util.List;  
import org.dom4j.Attribute;  
import org.dom4j.Document;  
import org.dom4j.DocumentException;  
import org.dom4j.DocumentHelper;  
import org.dom4j.Element;  
import org.dom4j.ProcessingInstruction;  
import org.dom4j.VisitorSupport;  
import org.dom4j.io.SAXReader;  
import org.dom4j.io.XMLWriter;  
/** 
 * Dom4j读写xml 
 * @author whwang 
 */  
public class TestDom4j {  
    public static void main(String[] args) {  
        read1();  
        //read2();   
        //write();   
    }  
    public static void read1() {  
        try {  
            SAXReader reader = new SAXReader();  
            InputStream in = TestDom4j.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = reader.read(in);  
            Element root = doc.getRootElement();  
            readNode(root, "");  
        } catch (DocumentException e) {  
            e.printStackTrace();  
        }  
    }  
    @SuppressWarnings("unchecked")  
    public static void readNode(Element root, String prefix) {  
        if (root == null) return;  
        // 获取属性   
        List<Attribute> attrs = root.attributes();  
        if (attrs != null && attrs.size() > 0) {  
            System.err.print(prefix);  
            for (Attribute attr : attrs) {  
                System.err.print(attr.getValue() + " ");  
            }  
            System.err.println();  
        }  
        // 获取他的子节点   
        List<Element> childNodes = root.elements();  
        prefix += "\t";  
        for (Element e : childNodes) {  
            readNode(e, prefix);  
        }  
    }  
    public static void read2() {  
        try {  
            SAXReader reader = new SAXReader();  
            InputStream in = TestDom4j.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = reader.read(in);  
            doc.accept(new MyVistor());  
        } catch (DocumentException e) {  
            e.printStackTrace();  
        }  
    }  
    public static void write() {  
        try {  
            // 创建一个xml文档   
            Document doc = DocumentHelper.createDocument();  
            Element university = doc.addElement("university");  
            university.addAttribute("name", "tsu");  
            // 注释   
            university.addComment("这个是根节点");  
            Element college = university.addElement("college");  
            college.addAttribute("name", "cccccc");  
            college.setText("text");  
            File file = new File("src/dom4j-modify.xml");  
            if (file.exists()) {  
                file.delete();  
            }  
            file.createNewFile();  
            XMLWriter out = new XMLWriter(new FileWriter(file));  
            out.write(doc);  
            out.flush();  
            out.close();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
}  
class MyVistor extends VisitorSupport {  
    public void visit(Attribute node) {  
        System.out.println("Attibute: " + node.getName() + "="  
                + node.getValue());  
    }  
    public void visit(Element node) {  
        if (node.isTextOnly()) {  
            System.out.println("Element: " + node.getName() + "="  
                    + node.getText());  
        } else {  
            System.out.println(node.getName());  
        }  
    }  
    @Override  
    public void visit(ProcessingInstruction node) {  
        System.out.println("PI:" + node.getTarget() + " " + node.getText());  
    }  
}
登入後複製

 

三、【效能測試】

環境:AMD4400+ 2.0 +GHz主頻JDK6.0
運作參數:-Xms400m -Xmx400m
xml檔案大小:10.7M
結果:
DOM: >581297ms
SAX: 8829ms
JDOM: 581297ms
DOM4j: 5309ms
時間包含IO的,只是進行了簡單的測試,僅供參考! ! ! !

四、【比較】

1、【DOM】
DOM是基於樹的結構,通常需要載入整文檔和建構DOM樹,然後才能開始工作。
優點:
    a、由於整棵樹在記憶體中,因此隨機存取xml文件可以隨機存取
    b、對xml文件進行修改作業
    c、較sax,dom使用也較簡單。
缺點:
    a、整份文件必須一次解析完
    a、由於整份文件都需要載入內存,對於大文檔成本高
2、【SAX】
SAX類似串流媒體,它基於事件驅動的,因此無需將整個文件載入內存,用戶只需要監聽自己感興趣的事件。
優點:
    a、無需將整個xml文檔載入內存,因此消耗內存少
    b、可註冊多個ContentHandler
缺點:
    a、隨機的存取xml中的節點
    b、無法修改文件
3、【JDOM】
JDOM是純Java的處理XML的API,其API中大量使用Collections類,
優點:
    a、DOM方式的優點
    b、具有SAX的Java規則
缺點
    a、DOM方式的缺點
4、【DOM4J】
#這4

###4、【DOM4J】######這4中xml解析方式中,最優秀的一個,集易用、效能於一身。 ##########

五、【小插曲XPath】

XPath 是一门在 XML 文档中查找信息的语言, 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素,并且 XQueryXPointer 同时被构建于 XPath 表达之上。因此,对 XPath 的理解是很多高级 XML 应用的基础。
XPath非常类似对数据库操作的SQL语言,或者说JQuery,它可以方便开发者抓起文档中需要的东西。(dom4j也支持xpath)
示例代码:

package test.xml;  
import java.io.IOException;  
import java.io.InputStream;  
import javax.xml.parsers.DocumentBuilder;  
import javax.xml.parsers.DocumentBuilderFactory;  
import javax.xml.parsers.ParserConfigurationException;  
import javax.xml.xpath.XPath;  
import javax.xml.xpath.XPathConstants;  
import javax.xml.xpath.XPathExpression;  
import javax.xml.xpath.XPathExpressionException;  
import javax.xml.xpath.XPathFactory;  
import org.w3c.dom.Document;  
import org.w3c.dom.NodeList;  
import org.xml.sax.SAXException;  
public class TestXPath {  
    public static void main(String[] args) {  
        read();  
    }  
    public static void read() {  
        try {  
            DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  
            DocumentBuilder builder = dbf.newDocumentBuilder();  
            InputStream in = TestXPath.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.parse(in);  
            XPathFactory factory = XPathFactory.newInstance();  
            XPath xpath = factory.newXPath();  
            // 选取所有class元素的name属性   
            // XPath语法介绍: http://w3school.com.cn/xpath/   
            XPathExpression expr = xpath.compile("//class/@name");  
            NodeList nodes = (NodeList) expr.evaluate(doc, XPathConstants.NODESET);  
            for (int i = 0; i < nodes.getLength(); i++) {  
                System.out.println("name = " + nodes.item(i).getNodeValue());  
                    }  
        } catch (XPathExpressionException e) {  
            e.printStackTrace();  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
}
登入後複製

六、【补充】

注意4种解析方法对TextNode(文本节点)的处理:

1、在使用DOM时,调用node.getChildNodes()获取该节点的子节点,文本节点也会被当作一个Node来返回,如:

<?xml version="1.0" encoding="UTF-8"?>  
<university name="pku">  
    <college name="c1">  
        <class name="class1">  
            <student name="stu1" sex=&#39;male&#39; age="21" />  
            <student name="stu2" sex=&#39;female&#39; age="20" />  
            <student name="stu3" sex=&#39;female&#39; age="20" />  
        </class>  
    </college>  
</university>
登入後複製
package test.xml;  
import java.io.FileNotFoundException;  
import java.io.IOException;  
import java.io.InputStream;  
import java.util.Arrays;  
import javax.xml.parsers.DocumentBuilder;  
import javax.xml.parsers.DocumentBuilderFactory;  
import javax.xml.parsers.ParserConfigurationException;  
import org.w3c.dom.Document;  
import org.w3c.dom.Element;  
import org.w3c.dom.Node;  
import org.w3c.dom.NodeList;  
import org.xml.sax.SAXException;  
/** 
 * dom读写xml 
 * @author whwang 
 */  
public class TestDom2 {  
    public static void main(String[] args) {  
        read();  
    }  
    public static void read() {  
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();  
        try {  
            DocumentBuilder builder = dbf.newDocumentBuilder();  
            InputStream in = TestDom2.class.getClassLoader().getResourceAsStream("test.xml");  
            Document doc = builder.parse(in);  
            // root <university>   
            Element root = doc.getDocumentElement();  
            if (root == null) return;  
//          System.err.println(root.getAttribute("name"));   
            // all college node   
            NodeList collegeNodes = root.getChildNodes();  
            if (collegeNodes == null) return;  
            System.err.println("university子节点数:" + collegeNodes.getLength());  
            System.err.println("子节点如下:");  
            for(int i = 0; i < collegeNodes.getLength(); i++) {  
                Node college = collegeNodes.item(i);  
                if (college == null) continue;  
                if (college.getNodeType() == Node.ELEMENT_NODE) {  
                    System.err.println("\t元素节点:" + college.getNodeName());  
                } else if (college.getNodeType() == Node.TEXT_NODE) {  
                    System.err.println("\t文本节点:" + Arrays.toString(college.getTextContent().getBytes()));  
                }  
            }  
        } catch (ParserConfigurationException e) {  
            e.printStackTrace();  
        } catch (FileNotFoundException e) {  
            e.printStackTrace();  
        } catch (SAXException e) {  
            e.printStackTrace();  
        } catch (IOException e) {  
            e.printStackTrace();  
        }  
    }  
}
登入後複製


输出的结果是:

 
university子节点数:3  
子节点如下:  
    文本节点:[10, 9]  
    元素节点:college  
    文本节点:[10]
登入後複製

其中\n的ASCII码为10,\t的ASCII码为9。结果让人大吃一惊,university的子节点数不是1,也不是2,而是3,这3个子节点都是谁呢?为了看得更清楚点,把xml文档改为:

 
<?xml version="1.0" encoding="UTF-8"?>  
<university name="pku">11  
    <college name="c1">  
        <class name="class1">  
            <student name="stu1" sex=&#39;male&#39; age="21" />  
            <student name="stu2" sex=&#39;female&#39; age="20" />  
            <student name="stu3" sex=&#39;female&#39; age="20" />  
        </class>  
    </college>22  
</university>
登入後複製

还是上面的程序,输出结果为:

 
university子节点数:3  
子节点如下:  
    文本节点:[49, 49, 10, 9]  
    元素节点:college  
    文本节点:[50, 50, 10]
登入後複製


其中数字1的ASCII码为49,数字2的ASCII码为50。

2、使用SAX来解析同DOM,当你重写它的public void characters(char[] ch, int start, int length)方法时,你就能看到。

3、JDOM,调用node.getChildren()只返回子节点,不包括TextNode节点(不管该节点是否有Text信息)。如果要获取该节点的Text信息,可以调用node.getText()方法,该方法返回节点的Text信息,也包括\n\t等特殊字符

4、DOM4j同JDOM

以上是詳細介紹解析Xml四種方法的範例程式碼的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
4 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

能否用PowerPoint開啟XML文件 能否用PowerPoint開啟XML文件 Feb 19, 2024 pm 09:06 PM

XML檔可以用PPT開啟嗎? XML,即可擴展標記語言(ExtensibleMarkupLanguage),是一種廣泛應用於資料交換和資料儲存的通用標記語言。與HTML相比,XML更加靈活,能夠定義自己的標籤和資料結構,使得資料的儲存和交換更加方便和統一。而PPT,即PowerPoint,是微軟公司開發的一種用於創建簡報的軟體。它提供了圖文並茂的方

使用Python實現XML資料的合併與去重 使用Python實現XML資料的合併與去重 Aug 07, 2023 am 11:33 AM

使用Python實現XML資料的合併和去重XML(eXtensibleMarkupLanguage)是一種用於儲存和傳輸資料的標記語言。在處理XML資料時,有時候我們需要將多個XML檔案合併成一個,或移除重複的資料。本文將介紹如何使用Python實現XML資料的合併和去重的方法,並給出對應的程式碼範例。一、XML資料合併當我們有多個XML文件,需要將其合

使用Python實現XML資料的篩選和排序 使用Python實現XML資料的篩選和排序 Aug 07, 2023 pm 04:17 PM

使用Python實現XML資料的篩選和排序引言:XML是一種常用的資料交換格式,它以標籤和屬性的形式儲存資料。在處理XML資料時,我們經常需要對資料進行篩選和排序。 Python提供了許多有用的工具和函式庫來處理XML數據,本文將介紹如何使用Python實現XML資料的篩選和排序。讀取XML檔案在開始之前,我們需要先讀取XML檔案。 Python有許多XML處理函式庫,

Python中的XML資料轉換為CSV格式 Python中的XML資料轉換為CSV格式 Aug 11, 2023 pm 07:41 PM

Python中的XML資料轉換為CSV格式XML(ExtensibleMarkupLanguage)是一種可擴充標記語言,常用於資料的儲存與傳輸。而CSV(CommaSeparatedValues)則是一種以逗號分隔的文字檔案格式,常用於資料的匯入和匯出。在處理資料時,有時需要將XML資料轉換為CSV格式以便於分析和處理。 Python作為一種功能強大

使用PHP將XML資料匯入資料庫 使用PHP將XML資料匯入資料庫 Aug 07, 2023 am 09:58 AM

使用PHP將XML資料匯入資料庫引言:在開發中,我們經常需要將外部資料匯入到資料庫中進行進一步的處理和分析。而XML作為一種常用的資料交換格式,也常被用來儲存和傳輸結構化資料。本文將介紹如何使用PHP將XML資料匯入資料庫。步驟一:解析XML文件首先,我們需要解析XML文件,擷取所需的資料。 PHP提供了幾種解析XML的方式,其中最常用的是使用Simple

Python實作XML與JSON之間的轉換 Python實作XML與JSON之間的轉換 Aug 07, 2023 pm 07:10 PM

Python實作XML與JSON之間的轉換導語:在日常的開發過程中,我們常常需要將資料在不同的格式之間轉換。 XML和JSON是常見的資料交換格式,在Python中,我們可以使用各種函式庫來實作XML和JSON之間的相互轉換。本文將介紹幾種常用的方法,並附帶程式碼範例。一、XML轉JSON在Python中,我們可以使用xml.etree.ElementTree模

使用Python處理XML中的錯誤和異常 使用Python處理XML中的錯誤和異常 Aug 08, 2023 pm 12:25 PM

使用Python處理XML中的錯誤和異常XML是一種常用的資料格式,用於儲存和表示結構化的資料。當我們使用Python處理XML時,有時可能會遇到一些錯誤和異常。在本篇文章中,我將介紹如何使用Python來處理XML中的錯誤和異常,並提供一些範例程式碼供參考。使用try-except語句捕捉XML解析錯誤當我們使用Python解析XML時,有時候可能會遇到一些

Python解析XML中的特殊字元和轉義序列 Python解析XML中的特殊字元和轉義序列 Aug 08, 2023 pm 12:46 PM

Python解析XML中的特殊字元和轉義序列XML(eXtensibleMarkupLanguage)是一種常用的資料交換格式,用於在不同系統之間傳輸和儲存資料。在處理XML檔案時,經常會遇到包含特殊字元和轉義序列的情況,這可能會導致解析錯誤或誤解資料。因此,在使用Python解析XML檔案時,我們需要了解如何處理這些特殊字元和轉義序列。一、特殊字元和

See all articles