如何載入有外國和特殊字元的文檔?
文件可以包含外國字符,例如:
foreign characters (úóí?)
例如 磲 的外國字符序列。外國字元可以是 UTF-8 編碼或用不同編碼指定,如下所示:
foreign characters (磲)
現在可以正確載入了。
其他字元是保留在 XML 中的,並且需要以不同的方式處理。以下的 XML:
This & that
產生以下錯誤:
此處不允許有空格。
行0000001: This & that
位置 0000012: ----------^
位置 0000012: ----------^
位置。您需要替換稱為“實體”的特殊字元序列。
This & that
下面的字符需要對應的實體:
『& & 引號字元被用作標記中屬性值的定界符,因此通常不能在屬性值的內部使用。例如,下面的內容將傳回錯誤:
此處的單引號既用作屬性定界符,又在屬性值本身。為了修正這個問題,可以將屬性定界符換成雙引號:
"。
也可以透過將文字放在CDATA 節中來處理元素內容中的特殊字元。下面的內容是正確的:
在本範例模型中,XML 物件模型將CDATA 節點顯示xml 節點的子節點,它將返回字符串
作為nodeValue。
如何在Visual Studio 6.0 C++ 中使用MSXML COM 組件?
IX 可以定義了所有介面*的介面並定義它在應用程式中使用它們了。 :
Copyright ? 2000, Microsoft Inc, All rights reserved.
碼: xC00CE002
Copyright ?2000, ...
Copyright ? 2000, Microsoft Inc, All rights reserved.
頁要載入它,需要將它貼上並貼上測試到下載的屬性。 」中,關閉DTD 驗證,然後按一下「驗證」。請注意文件將加載,並且版權字元將顯示在validator 頁面的末尾的DOM 樹中。
%HTMLENT;
〜%HTMLENT〜%HTMLENT]% 將它定義為一切以便在XML 文件中使用它們。
在元素內容中如何處理空白字元?
XML DOM 有三種存取元素文字內容的方式:
屬性 行為
nodeValue 按照原始的 XML 來源中指定的那樣,傳回 TEXT、CDATA、COMMENT 和 PI 節點上的原始文字內容(包括空白字元)。對於 ELEMENT 節點和 DOCUMENT 本身,則傳回空值。
資料 與 nodeValue 相同
文字 重複連接指定子樹中的多個 TEXT 和 CDATA 節點並傳回組合結果。
preserveWhiteSpace = true when the document is loaded
preserveWhiteSpace=true preserveWhiteSpace=true preserveWhiteSpace=false preserveWhite Space :space=default xml:space=preserve xml:space=default
保留 保留確保=false
xml:space=preserve xml:space=default xml:space=preserve xml :space=default
半保留 半保留並截斷 半保留 半保留並截斷
t Janen
tSmith n tSmith n重要的空白字符,因為它是文字內容的一部分,因此有不可忽略的重要含義。所以在本例中,文字屬性回傳下列結果:
保留"nt JanentSmith n"
"
半保留並截斷"Jane Smith"
CDATA and xml:space="preserve" subtree boundaries
n
t Jane n
t Smith ]>n
]>n
"Jane Smith "
在此,且與 標記之間的不重要的空白字元將包括在內,與 CDATA 節點的內容無關。如果以下列內容取代 CDATA,那麼將傳回相同結果:
Smith
實體是特殊的
實體是作為 DTD 的一部分載入和分析的,並且顯示在 DOCTYPE 節點下。它們不一定要有任何 xml:space 範圍。例如:
Jane n
tn">
]> &Jane]
ELEMENT: foo
ATTRIBUTE: xml:space ="preserve" ENTITYREF: Jane
請注意,在DOCTYPE 內部ENTITY 節點下顯露的DOM 樹不包含任何WHITESPACE 節點。 ="preserve" 的範圍內也是如此。 :space 屬性,或文件preserveWhiteSpace 開關必須設為true。
有幾種方式可以處理屬性中的空白字元?
attrNode.value
getAttribute("name") 傳回和原始文件中完全相同的內容(和擴充的實體)。
attrNode.nodeTypedValue Null
attrNode.text 除了前導和尾部的空白字元已經截斷之外,其他與 nodeValue 相同。
CDATA ID、IDREF、IDREFS、ENTITY、ENTITIES、NOTATION、枚舉規範在半數化規格代表將新行和tab 字元轉換為空格,但多個空格不會退化為一個空格。
以上就是XML入門的常見問題(三)的內容,更多相關內容請關注PHP中文網(www.php.cn)!