python與XML的結合實作教程-Python教學-PHP中文網

首頁

後端開發

Python教學

python與XML的結合實作教程

php中世界最好的语言

Apr 09, 2018 pm 02:34 PM

python 教學結合

這次帶給大家python與XML的結合實踐教程，python與XML結合實踐的注意事項有哪些，下面就是實戰案例，一起來看一下。

這個專案的名稱與其叫做萬能的XML不如叫做自動建立網站，根據一份XML文件，生成對應目錄結構的網站，不過只有html還是太過於簡單了，如果要是可以連帶生成css那就比較強大了。這個有待後續研發，先來研究下怎麼html網站架構。既然是透過XML結構產生網站，那所有的事情都應該由這個XML檔來。先來看下這個XML文件，website.xml：

<website>
 <page name="index" title="Home page">
 <h1>Welcome to my Home page</h1>
 <p>Hi, there. My name is Mr.gumby,and this is my home page,here are some of my int:</p>
 <ul>
  <li><a href="interests/shouting.html" rel="external nofollow" >Shouting</a></li>
  <li><a href="interests/sleeping.html" rel="external nofollow" >Sleeping</a></li>
  <li><a href="interests/eating.html" rel="external nofollow" >Eating</a></li>
 </ul>
 </page>
 <directory name="interests">
  <page name="shouting" title="Shouting">
   <h1>shouting page</h1>
   <p>....</p>
  </page>
  <page name="sleeping" title="Sleeping">
   <h1>sleeping page</h1>
   <p>...</p>
  </page>
  <page name="eating" title="Eating">
    <h1>Eating page</h1>
    <p>....</p>
  </page>
 </directory>
</website>

登入後複製

有了這個文件，下面應該來看怎麼透過這個文件產生網站。

首先我們要解析這個xml文件，python解析xml和在java中一樣，有兩種方式，SAX和DOM，兩種處理方式不同點在於速度和範圍，前者講究的是效率，每次只處理文檔的一小部分，快速而能有效的利用內存，後者是相反的處理方式，先把所有的文檔載入到內存，然後再進行處理，速度比較慢，也比較消耗內存，唯一的好處就是可以操作整個文件。

在python中使用sax方式處理xml要先引入xml.sax中的parse函數，還有xml.sax.handler中的ContentHandler，後面的這個類別是要和parse函數來配合使用的。使用方式如下： parse('xxx.xml',xxxHandler),這裡面的xxxHandler要繼承上面的ContentHandler，不過只要繼承就行，不需要有所作為。然後這個parse函數在處理xml檔案的時候，會呼叫xxxHandler中的startElement函數和endElement函數來一個xml中的標籤的開始和結束，中間的過程使用一個名為characters的函數來處理標籤內部的所有字串。

有了上面的這些認識，我們已經知道如何處理xml文件了，然後再來看那個罪惡的源頭website.xml文件，分析其結構，只有兩個節點：page和directory，很明顯page表示一個頁面，directory表示一個目錄。

所以處理這個xml檔案的思路就變的清晰了。讀取xml檔的每一個節點，然後判斷是page還是directory如果是page則建立html頁面，然後把節點中的內容寫到檔案裡。如果遇到directory就建立一個資料夾，然後再處理其內部的page節點（如果有的話）。
下面來看這部分程式碼，書中的實作比較複雜，比較靈活。先來看，然後在分析。

from xml.sax.handler import ContentHandler
from xml.sax import parse
import os
class Dispatcher:
    def dispatch(self, prefix, name, attrs=None):
        mname = prefix + name.capitalize()
        dname = 'default' + prefix.capitalize()
        method = getattr(self, mname, None)
        if callable(method): args = ()
        else:
            method = getattr(self, dname, None)
            args = name,
        if prefix == 'start': args += attrs,
        if callable(method): method(*args)
    def startElement(self, name, attrs):
        self.dispatch('start', name, attrs)
    def endElement(self, name):
        self.dispatch('end', name)
class WebsiteConstructor(Dispatcher, ContentHandler):
    passthrough = False
    def init(self, directory):
        self.directory = [directory]
        self.ensureDirectory()
    def ensureDirectory(self):
        path = os.path.join(*self.directory)
        print path
        print '----'
        if not os.path.isdir(path): os.makedirs(path)
    def characters(self, chars):
        if self.passthrough: self.out.write(chars)
    def defaultStart(self, name, attrs):
        if self.passthrough:
            self.out.write('<&#39; + name)
            for key, val in attrs.items():
                self.out.write(&#39; %s="%s"&#39; %(key, val))
            self.out.write(&#39;>')
    def defaultEnd(self, name):
        if self.passthrough:
            self.out.write('</%s>' % name)
    def startDirectory(self, attrs):
        self.directory.append(attrs['name'])
        self.ensureDirectory()
    def endDirectory(self):
        print 'endDirectory'
        self.directory.pop()
    def startPage(self, attrs):
        print 'startPage'
        filename = os.path.join(*self.directory + [attrs['name']+'.html'])
        self.out = open(filename, 'w')
        self.writeHeader(attrs['title'])
        self.passthrough = True
    def endPage(self):
        print 'endPage'
        self.passthrough = False
        self.writeFooter()
        self.out.close()
    def writeHeader(self, title):
        self.out.write('<html>\n <head>\n  <title>')
        self.out.write(title)
        self.out.write('</title>\n </head>\n <body>\n')
    def writeFooter(self):
        self.out.write('\n </body>\n</html>\n')
parse('website.xml',WebsiteConstructor('public_html'))

登入後複製

看起來這個程式上面分析的複雜了一些，不過偉人毛毛說過，任何複雜的程序都是紙老虎。那我們再來分析一下這個程式。

首先看到這個程式是有兩個類，其實完全可以當作一個類，因為有了繼承。

然後再來看它多了些什麼，除了我們分析出來的startElement和endElement以及characters，多出來了startPage，endPage;startDirectory，endDirectory;defaultStart，defaultEnd;ensureDirectory;writeHeader，writeFooter;和dispatch，這些個函數。除了dispatch，前面的函數都很好理解，每一對函數都是單純的處理對應的html標籤以及xml節點。而dispatch比較複雜，複雜之處在於他是用來動態拼合函數並且執行的。

dispatch的處理想法是，首先根據傳遞的參數（就是操作名稱以及節點名稱）判斷是否存在對應的函數如startPage，如果不存在則執行default 操作名稱：如defaultStart。

一個函數一個函數搞清楚之後，就知道整個處理流程是什麼樣子了。先建立一個public_html的文件，存放整個網站，然後讀xml的節點，透過startElement和endElement呼叫dispatch進行處理。然後就是dispatch怎麼呼叫具體的處理函數了。到此為止，這個專案算是分析完了。

主要掌握的內容一個是python中使用SAX處理XML，另一個就是python中的函數的使用，例如getattr，傳參數時的星號…

相信看了本文案例你已經掌握了方法，更多精彩請關注php中文網其它相關文章！

熱AI工具

Undresser.AI Undress

人工智慧驅動的應用程序，用於創建逼真的裸體照片

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

免費脫衣圖片

Clothoff.io

AI脫衣器

Video Face Swap

使用我們完全免費的人工智慧換臉工具，輕鬆在任何影片中換臉！

熱工具

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

中文版，非常好用

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學

1666

CakePHP 教程

1425

Laravel 教程

1324

PHP教程

1272

C# 教程

1251

Related knowledge

PHP和Python：解釋了不同的範例 Apr 18, 2025 am 12:26 AM

PHP主要是過程式編程，但也支持面向對象編程（OOP）；Python支持多種範式，包括OOP、函數式和過程式編程。 PHP適合web開發，Python適用於多種應用，如數據分析和機器學習。

在PHP和Python之間進行選擇：指南 Apr 18, 2025 am 12:24 AM

PHP適合網頁開發和快速原型開發，Python適用於數據科學和機器學習。 1.PHP用於動態網頁開發，語法簡單，適合快速開發。 2.Python語法簡潔，適用於多領域，庫生態系統強大。

sublime怎麼運行代碼python Apr 16, 2025 am 08:48 AM

在 Sublime Text 中運行 Python 代碼，需先安裝 Python 插件，再創建 .py 文件並編寫代碼，最後按 Ctrl B 運行代碼，輸出會在控制台中顯示。

Python vs. JavaScript：學習曲線和易用性 Apr 16, 2025 am 12:12 AM

Python更適合初學者，學習曲線平緩，語法簡潔；JavaScript適合前端開發，學習曲線較陡，語法靈活。 1.Python語法直觀，適用於數據科學和後端開發。 2.JavaScript靈活，廣泛用於前端和服務器端編程。

PHP和Python：深入了解他們的歷史 Apr 18, 2025 am 12:25 AM

PHP起源於1994年，由RasmusLerdorf開發，最初用於跟踪網站訪問者，逐漸演變為服務器端腳本語言，廣泛應用於網頁開發。 Python由GuidovanRossum於1980年代末開發，1991年首次發布，強調代碼可讀性和簡潔性，適用於科學計算、數據分析等領域。

Golang vs. Python：性能和可伸縮性 Apr 19, 2025 am 12:18 AM

Golang在性能和可擴展性方面優於Python。 1)Golang的編譯型特性和高效並發模型使其在高並發場景下表現出色。 2)Python作為解釋型語言，執行速度較慢，但通過工具如Cython可優化性能。

vscode在哪寫代碼 Apr 15, 2025 pm 09:54 PM

在 Visual Studio Code（VSCode）中編寫代碼簡單易行，只需安裝 VSCode、創建項目、選擇語言、創建文件、編寫代碼、保存並運行即可。 VSCode 的優點包括跨平台、免費開源、強大功能、擴展豐富，以及輕量快速。

notepad 怎麼運行python Apr 16, 2025 pm 07:33 PM

在 Notepad 中運行 Python 代碼需要安裝 Python 可執行文件和 NppExec 插件。安裝 Python 並為其添加 PATH 後，在 NppExec 插件中配置命令為“python”、參數為“{CURRENT_DIRECTORY}{FILE_NAME}”，即可在 Notepad 中通過快捷鍵“F6”運行 Python 代碼。

See all articles

python與XML的結合實作教程

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題