python解析XML檔實例（圖）-Python教學-PHP中文網

python解析XML檔實例（圖）

PHPz

發布： 2017-04-23 16:44:51

原創

3417 人瀏覽過

如下使用xml.etree.ElementTree模組來解析XML檔。 ElementTree模組中提供了兩個類別用來完成這個目的：

#ElementTree 表示整個XML檔案（一個樹形結構）
Element 表示樹中的一個元素（結點）

我們操作如下XML檔： migapp.xml

#我們操作如下XML檔： python解析XML檔實例（圖） migapp.xml

我們可以透過以下方式導入ElementTree模組： import xml.etree.ElementTree as ET

或也可以只導入parse解析器： from xml.etree.ElementTree import parse

首先需要打開一個xml文件，本地文件使用open函數，如果是互聯網文件，則使用urlopen:

f = open( ' migapp.xml ' , ' rt ' , encoding= ' utf -8 ' )

然後對XML進行解析。 1 解析XML檔

1.1 python解析XML檔實例（圖）解析根元素

tree = ET.parse(f)
root = tree.getroot()
print(&#39;root.tag =&#39;, root.tag)
print(&#39;root.attrib =&#39;, root.attrib)

登入後複製

1.2 python解析XML檔實例（圖）解析根的兒子

for child in root:      # 仅可以解析出root的儿子，不能解析出root的子孙
    print(child.tag)
    print(child.attrib) # attrib is a dict

登入後複製

1.3 python解析XML檔實例（圖）透過索引解析根的子孫

print(root[1][1].tag)
print(root[1][1].text)

登入後複製

1.4 python解析XML檔實例（圖）迭代解析出所有的指定element

for element in root.iter(&#39;environment&#39;):
    print(element.attrib)

登入後複製

#1.5 python解析XML檔實例（圖）幾個有用的方法

# element.findall()解析出指定element的所有儿子
# element.find()解析出指定element的第一个儿子
# element.get()解析出指定element的属性attrib
for environment in root.findall(&#39;environment&#39;):
    first_variable = environment.find(&#39;variable&#39;)
    print(first_variable.get(&#39;name&#39;))

登入後複製

#2 修改XML檔假設我們需要為每個text元素新增一個屬性size="50"，修改其text為"Benxin Tuzi"，新增一個子元素date="2016 /01/16"

for text in root.iter(&#39;text&#39;):
    text.set(&#39;size&#39;, &#39;50&#39;)
    text.text = &#39;Benxin Tuzi&#39;
    text.append(ET.Element(&#39;date&#39;, attrib={}, text=&#39;2016/01/16&#39;))
tree.write(&#39;output.xml&#39;)

登入後複製

python解析XML檔實例（圖） migapp.xml

中的部分：

##output.xml python解析XML檔實例（圖）中對應的部分：

3 說明事項

#不要使用xml.py作為檔案名，否則此時會發生如下錯誤：

ImportError: No module named 'xml.etree'; 'xml' is not a package

分析：

這是由於import時會先在目前路徑下尋找，此時發現存在xml.py模組，而我們自己寫的xml.py當然不是一個package

注意：

刪除xml.py後仍然不能成功解釋，那是因為當前路徑中也產生了xml.pyc，而該檔案的優先權要高於xml.py，因此解譯器還是優先在xml.pyc中尋找，因此必須將該檔案也刪除掉，成功解決問題。

結論：

檔案名稱盡量不要與套件名稱或模組名稱同名，即使你在腳本中不使用該模組或套件，否則可能發生奇怪的錯誤。

ElementTree模組中提供的許多解析函數都需要預先將整個XML文件讀入記憶體中，這對於大型XML解析而言，不是一件好事，尤其是當我們從網路、管道中讀取XML時，非阻塞式的解析非常重要。此時，我們可以使用ElementTree模組中的XMLPullParse類別來處理。當然我們也可以選擇ElementTree模組的iterparse()來代替，該方法在解析大型XML時也不需要全部讀入記憶體。 ##########

以上是python解析XML檔實例（圖）的詳細內容。更多資訊請關注PHP中文網其他相關文章！