python XML解析-Python教學-PHP中文網

首頁

後端開發

Python教學

python XML解析

高洛峰

Nov 23, 2016 pm 01:58 PM

什麼是XML？

XML 指可擴充標記語言（eXtensible Markup Language）。你可以透過本站學習XML教學

XML 被設計用來傳輸和儲存資料。

XML是一套定義語意標記的規則，這些標記將文件分成許多部件並對這些部件加以標識。

它也是元標記語言，即定義了用於定義其他與特定領域有關的、語義的、結構化的標記語言的句法語言。

python對XML的解析

常見的XML程式介面有DOM和SAX，這兩種介面處理XML檔案的方式不同，當然使用場合也不同。

python有三種方法解析XML，SAX，DOM，以及ElementTree:

1.SAX (simple API for XML )

pyhton 標準庫包含SAX解析器，SAX用事件驅動模型，透過在解析XML的過程中觸發一個個的事件並呼叫使用者定義的回呼函數來處理XML檔案。

2.DOM(Document Object Model)

將XML資料在記憶體中解析成一個樹，透過對樹的操作來操作XML。

3.ElementTree(元素樹)

ElementTree就像一個輕量級的DOM，具有方便友好的API。程式碼可用性好，速度快，消耗記憶體少。

註：因DOM需要將XML資料映射到記憶體中的樹，一是比較慢，二是比較耗內存，而SAX流式讀取XML文件，比較快，佔用內存少，但需要用戶實現回調函數（handler）。

本章節所使用的XML實例檔案movies.xml內容如下：

DVD

2003

PG🠎

about a US-Japan war

但

1989

ion>

Anime, Action

DVD

🎠

Vash the Stampede!

VHS

Viewable boredom

Viewable >

python使用SAX解析xml

SAX是一種基於事件驅動的API。

利用SAX解析XML文件牽涉到兩個部分:解析器和事件處理器。

解析器負責讀取XML文檔,並向事件處理器發送事件,如元素開始跟元素結束事件;

而事件處理器則負責對事件作出相應,對傳遞的XML資料進行處理。

1、對大型文件進行處理；

2、只需要文件的部分內容，或只需從文件中得到特定資訊。

3、想建立自己的物件模型的時候。

在python中使用sax方式處理xml要先引入xml.sax中的parse函數，還有xml.sax.handler中的ContentHandler。

ContentHandler類別方法介紹

characters(content)方法

調用時機：

從行開始，遇到標籤之前，存在字符，content的值為這些字串。

從一個標籤，遇到下一個標籤之前，存在字符，content的值為這些字串。

從一個標籤，遇到行結束符之前，存在字符，content的值為這些字串。

標籤可以是開始標籤，也可以是結束標籤。

startDocument()方法

文檔啟動的時候呼叫。

endDocument()方法

解析器到達文件結尾時呼叫。

startElement(name, attrs)方法

遇到XML開始標籤時調用，name是標籤的名字，attrs是標籤的屬性值字典。

endElement(name)方法

遇到XML結束標籤時呼叫。

make_parser方法

以下方法建立一個新的解析器物件並回傳。

xml.sax.make_parser( [parser_list] )

參數說明:list

list一個SAX 解析器並解析xml文件：

xml.sax.parse( xmlfile, contenthandler[, errorhandler])

hand3pyk

一個ContentHandler的對象

errorhandler - 如果指定該參數，errorhandler必須是一個SAX ErrorHandler物件

parseString方法

parseString方法建立一個XML解析器並解析xml字串：

[, errorhandler])

參數說明:

xmlstring - xml字串

contenthandler 鈴

Python解析XML實例

#!/usr/bin/python

import xml.sax

__init__(self):

self .CurrentData = ""

self.type = ""

self.format self.rating = ""

self.stars = ""

self.description = ""

# 元素開始事件處理

def startElement(self, tag, attributes): if tag == "movie":

print "***** Movie*****"

title = attributes["title"]

def endElement(self, tag):

if self. CurrentData == "type":

print "類型:", self.type

"Format:", self.format

elif self.CurrentData == " year":

print "Year:", self.year

elif , self.rating

elif self.CurrentData == "stars":

print "Stars:", self.stars

elif self.CurrentData == "description": elif self.CurrentData == "description": elif self.CurrentData == "description": elif self.CurrentData == "description": elif self.CurrentData == "description": elif self.CurrentData == "description": description

self.CurrentData = ""

# 內容事件處理

def characters(self, content):

if self.CurrentData == "type":

if self.CurrentData == "format":

? self. rating = 內容

elif self.CurrentData== 「星星」：

== 「說明」：

self.description = 內容

if ( __name__ == 「__main__」 ):

# 一個 XMLReader

parser = xml. xml.sax.handler.feature_namespaces, 0)

# 重寫ContextHandler

Handler = MovieHandler （）

parser.setContenthandler（處理程序）

.S.

以上程式碼執行結果：

**** ***

標題：敵人背後

類型：戰爭、驚悚

格式：DVD

年份：2003

評級：PG

* ****電影*****

標題：變形金剛

類型：動畫、科幻小說

格式：DVD

年份：1989

：一部科普小說

*****電影*****

標題：Trigun

類型：動畫、動作

格式：DVD

評級：PG

星星：10

描述：V the Stampede！

*****電影*****

標題：伊什塔爾

類型：喜劇

格式：VHS

評級：PG

星星：2

描述：可見的無聊

完整的SAX API文件請查閱Python SAX APIs

使用xml.dom解析xml

文件物件模型（Document Object Model，簡稱DOM），是W3C組織推薦的處理可置標語言的標準程式設計接口。

一個DOM的解析器在解析一個XML 文檔時，一次性讀取整個文檔，把文檔中所有元素保存在內存中的一個樹結構裡修改，之後你可以利用DOM 提供的不同的函數來讀取或文件的內容和結構，也可以把過的內容寫入xml檔。

python中用xml.dom.minidom來修改xml文件，實例如下：

#!/usr/bin/python

7% .minidom

# 使用minidom解析器開啟XML 文件

DOMTree = xml.dom.minidom.parse("movies.xml")

集合=Copf.ree.documentElement). :

print "根元素 : %s" % collection.getAttribute("shelf")

# # 列印每部電影的細節

對於電影中的電影：

印刷「*****電影*****」

if movie.hasAttribute( "title % movie.getAttribute("title")

type = movie.getElementsByTagName('type')[0]

)類型=print movie. getElementsByTagName('format')[0]

print "格式： %s" % format.childNodes[0].data

” % rating.childNodes[0].data

描述= movie.getElementsByTagName('description')[0]

以上程式執行結果如下：

Root element : New Arrivals

*****Movie*****

Title: Enemy Behindvie*****

Title: Enemy Behind骨Rating : PG

Description: Talk about a US-Japan war

*****Movie*****

Title: Transformers

Type:

Description: A schientific fiction

*****Movie*****

Title: Trigun

Type: Anime, Action

55:

Type: Anime, Action

55: the;

*****Movie*****

Title: Ishtar

Type: Comedy

Format: VHS

Rating: PG

Description:

Rating: PG

Description:

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

AI Hentai Generator

免費產生 AI 無盡。

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

gmail信箱登陸入口在哪裡

7488

CakePHP 教程

1377

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

如何解決Linux終端中查看Python版本時遇到的權限問題？ Apr 01, 2025 pm 05:09 PM

Linux終端中查看Python版本時遇到權限問題的解決方法當你在Linux終端中嘗試查看Python的版本時，輸入python...

在Python中如何高效地將一個DataFrame的整列複製到另一個結構不同的DataFrame中？ Apr 01, 2025 pm 11:15 PM

在使用Python的pandas庫時，如何在兩個結構不同的DataFrame之間進行整列複製是一個常見的問題。假設我們有兩個Dat...

如何在10小時內通過項目和問題驅動的方式教計算機小白編程基礎？ Apr 02, 2025 am 07:18 AM

如何在10小時內教計算機小白編程基礎？如果你只有10個小時來教計算機小白一些編程知識，你會選擇教些什麼�...

Uvicorn是如何在沒有serve_forever()的情況下持續監聽HTTP請求的？ Apr 01, 2025 pm 10:51 PM

Uvicorn是如何持續監聽HTTP請求的？ Uvicorn是一個基於ASGI的輕量級Web服務器，其核心功能之一便是監聽HTTP請求並進�...

Python中如何通過字符串動態創建對象並調用其方法？ Apr 01, 2025 pm 11:18 PM

在Python中，如何通過字符串動態創建對象並調用其方法？這是一個常見的編程需求，尤其在需要根據配置或運行...

哪些流行的Python庫及其用途？ Mar 21, 2025 pm 06:46 PM

本文討論了諸如Numpy，Pandas，Matplotlib，Scikit-Learn，Tensorflow，Tensorflow，Django，Blask和請求等流行的Python庫，並詳細介紹了它們在科學計算，數據分析，可視化，機器學習，網絡開發和H中的用途

FastAPI中如何處理逗號分隔的列表查詢參數？ Apr 02, 2025 am 06:51 AM

fastapi ...

如何在使用 Fiddler Everywhere 進行中間人讀取時避免被瀏覽器檢測到？ Apr 02, 2025 am 07:15 AM

使用FiddlerEverywhere進行中間人讀取時如何避免被檢測到當你使用FiddlerEverywhere...

See all articles

python XML解析

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題