詳細介紹xml中的空格之完全解說
提示:我提取了《xslt從入門到精通》中關於空格解釋的核心部分,藉以拋磚引玉,希望大家踴躍參與討論。談談你對空格的理解。
只適合對xml檔案結構有一定了解的學者,不適合初學者。請依照從上到下的順序閱讀。
對html檔案而言,空格不重要;然而,對xml而言,預設立場就是要保留空格結點(空格結點的解釋見下文)。
根據xml規範的規定,所謂空格是四個字元的任意組合序列:
-----------------------」 --
空格字元(space),對應字元值為#x20
傳回字元(Carriage Return),對應字元值為#xD
新行字元(Newline),對應字元值為#xA
跳格字元(Tab),對應字元值為#x9。
xml檔案的空格也會形成結點,也就是空格結點。空格結點屬於文字結點類型。
對xml和xslt而言,空格結點會牽涉到兩個議題:
-----------------------
#1。在xml輸入檔中決定哪些空格是重要的,xslt處理器要看見這些空格結點。而決定的金鑰就是xml:space屬性。
2。在xsl範本檔案中決定哪些空格是重要的,xslt處理器要將它複製到結果樹中,而決定的金鑰就是xsl:strip-space
和xsl:PReserve-space這兩個指令。
「重要與不重要的空格結點」
-----------------------「
若某元件的內容只能放元件,則該元件中的空格結點就是不重要的(Insignificant);
如果某元件的內容是#PCDATA的類型,則其內的空格結點應視為重要的(Signficant)。
至於組件內容混雜了文字內容和組件的情況則無從評判,應視組件及其內容之語義而定。
xslt處理器接觸到xml輸入檔案之前,會先由xml分析器進行分析
—————————————————————— --
(1)xml:space屬性可以改變後續接手的xml應用程式處理空格結點的模式,例如,xslt處理器就會受xml:space屬性影響。
(2)xml檔案中任何一列標記或內容尾端的結尾的結尾符號全部會換成單一新行字元(#xA)。
(3)屬性值交給xml應用程式之前,xml分析器也應該先對屬性值做規範化的操作。這是因為不同的作業系統每一行文字列的結尾字元有不同的組合,例如,windows系統會由返回字元呵新行字元組成結尾符號,而Unix系統則僅由新行字元群組
成結尾符號。 xml分析器在讀取xml檔案之後,便先行將所有結尾符號換成單一新行字符,不僅統一了不同系統間不同結尾符號設計的差異性,同時也簡化了後續xml應用程式的的操作難度。這樣一個處理過程稱為「規範化(Normalization)」。
a,每一文字列的結尾符號都要規範化成單一的新行字元(#xA)。
b,任何一個空格符(#x20、#xD、#xA、#x9)都應換成一個空格字元(#x20)。
c,屬性值中若含有字參碼,則應替換成該參考字符,例如,
會換成新行字符(#xA)。
d,屬性值若含有實體參考,則應以其替換文字替換。
e,除此之外,任何字元都應直接放入規範化屬性值中。
f,最後,如果屬性類型不是CDATA,則xml分析器應該再進一步把屬性值前後的空格字元序列刪除,而且屬性值中間若有空格序列,也應該替換成單一空格字元。
xslt處理器把xml輸入檔案和xsl範本檔案的結構樹建好之後,會現把元件中相鄰的文字結點合併成單一的文字結點,然後再把一些文字結點抽掉。然而,如果文字結點符合下列條件之一,就會被保留下來:
————————————————————————
(1)文字結點的父組件是空格保留組件名稱集(Set Of Whitespace-preserving Element Names)中的一員。
(2)文字結點中至少有一個非空格符號。
(3)文字結點的某個祖先元件中有xml:space屬性,其值為preserve,而且較近的祖先元件中沒有其他xml:space屬性值為default。除此之外的文字結點逗會被抽走。
對xsl範本而言,所謂的空格保留元件名稱集只有一個xsl:text元件可用。 xsl模板檔案的空格結點都會被刪除,但是,如果空格結點出現在xsl:text元件中就會被保留下來。
以上就是詳細介紹xml中的空格之完全解說的內容,更多相關內容請關注PHP中文網(www.php.cn)!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

XML檔可以用PPT開啟嗎? XML,即可擴展標記語言(ExtensibleMarkupLanguage),是一種廣泛應用於資料交換和資料儲存的通用標記語言。與HTML相比,XML更加靈活,能夠定義自己的標籤和資料結構,使得資料的儲存和交換更加方便和統一。而PPT,即PowerPoint,是微軟公司開發的一種用於創建簡報的軟體。它提供了圖文並茂的方

Python中的XML資料轉換為CSV格式XML(ExtensibleMarkupLanguage)是一種可擴充標記語言,常用於資料的儲存與傳輸。而CSV(CommaSeparatedValues)則是一種以逗號分隔的文字檔案格式,常用於資料的匯入和匯出。在處理資料時,有時需要將XML資料轉換為CSV格式以便於分析和處理。 Python作為一種功能強大

全角空格與半角空格的不同之處在我們使用文字處理軟體或編輯文字內容的時候,有時候會遇到空格這個概念。空格在排版和格式化文字時是一個很基礎的元素,不過很多人可能不知道全角空格和半角空格的差別。在日常使用中,我們或許能感受到全角空格和半角空格在不同的情境下會產生不同的效果,但可能並沒有意識到這其中的細微差別。首先,全角空格和半角空格的差別在於它們所佔據的寬

使用Python處理XML中的錯誤和異常XML是一種常用的資料格式,用於儲存和表示結構化的資料。當我們使用Python處理XML時,有時可能會遇到一些錯誤和異常。在本篇文章中,我將介紹如何使用Python來處理XML中的錯誤和異常,並提供一些範例程式碼供參考。使用try-except語句捕捉XML解析錯誤當我們使用Python解析XML時,有時候可能會遇到一些

Python解析XML中的特殊字元和轉義序列XML(eXtensibleMarkupLanguage)是一種常用的資料交換格式,用於在不同系統之間傳輸和儲存資料。在處理XML檔案時,經常會遇到包含特殊字元和轉義序列的情況,這可能會導致解析錯誤或誤解資料。因此,在使用Python解析XML檔案時,我們需要了解如何處理這些特殊字元和轉義序列。一、特殊字元和

C#開發中如何處理XML和JSON資料格式,需要具體程式碼範例在現代軟體開發中,XML和JSON是廣泛應用的兩種資料格式。 XML(可擴展標記語言)是一種用於儲存和傳輸資料的標記語言,而JSON(JavaScript物件表示)是一種輕量級的資料交換格式。在C#開發中,我們經常需要處理和操作XML和JSON數據,本文將重點放在如何使用C#處理這兩種數據格式,並附上

Go語言是一種簡單、有效率、並發性強的程式語言,它是由Google開發的開源語言。在Go語言中,空格的使用是非常重要的,它能夠提高程式碼的可讀性和易於維護性。本文將介紹如何正確地在Go語言中使用空格,並提供具體的程式碼範例。為什麼需要正確使用空格在程式設計過程中,空格的使用對於程式碼的可讀性和美觀性非常重要。恰當地使用空格可以讓程式碼更加清晰、易讀,從而減

使用PHPXML函數處理XML資料:解析XML資料:simplexml_load_file()和simplexml_load_string()載入XML檔案或字串。存取XML資料:利用SimpleXML物件的屬性和方法來取得元素名稱、屬性值和子元素。修改XML資料:使用addChild()和addAttribute()方法新增元素和屬性。序列化XML資料:asXML()方法將SimpleXML物件轉換為XML字串。實戰案例:解析產品饋送XML,提取產品信息,轉換並將其儲存到資料庫中。
