首頁 後端開發 XML/RSS教程 XML結構與文法入門的具體分享

XML結構與文法入門的具體分享

Mar 24, 2017 pm 05:09 PM

現在我們暫且使用「記事本」來建立我們的XML檔吧。先看一個XML檔:

範例1:

〈?xml version="1.0" encoding="gb2312" ?〉
〈参考资料〉
〈书籍〉
〈名称〉XML入门精解〈/名称〉
〈作者〉张三〈/作者〉
〈价格 货币单位="人民币"〉20.00〈/价格〉
〈/书籍〉
〈书籍〉
〈名称〉XML语法〈/名称〉
〈!--此书即将出版--〉
〈作者〉李四〈/作者〉
〈价格 货币单位="人民币"〉18.00〈/价格〉
〈/书籍〉
〈/参考资料〉
登入後複製

這是一個典型的XML文件,編輯好後儲存為一個以.xml為後綴的文件。我們可以將此文件分為文件序言(Prolog)和文件主體兩個大的部分。在此文件中的第一行即是文件序言。該行是XML檔案必須聲明的東西,而且也必須位於XML檔案的第一行,它主要是告訴XML解析器如何運作。其中,version是標明此XML檔案所用的標準的版本號,必須要有;encoding指明了此XML檔案中所使用的字元類型,可以省略,在你省略此聲明的時候,後面的字元碼必須是Unicode字元碼(建議不要省略)。因為我們在這個例子中使用的是GB2312字元碼,所以encoding這個聲明也不能省略。在文件序言部分還有一些聲明語句,我們在後面給予介紹。

檔案的其餘部分都是屬於檔案主體,XML檔案的內容資訊存放在此。我們可以看到,文件主體是由開始的〈參考資料〉和結束的〈/參考資料”控制標記所組成,這個稱為XML文件的「根元素」;〈書〉是作為直屬於根元素下的“子元素」;在〈書本〉下又有〈名稱〉、〈作者〉、〈價格〉這些子元素。貨幣單位是〈價格〉元素中的一個“屬性”,“人民幣”則是“屬性值”。

〈!--此書即將出版--〉這一句同HTML一樣,是註釋,在XML檔裡,註解部分是放在「〈!--」與「--〉」標記之間的部分。

大家可以看到,XML檔是相當簡單的。就像HTML一樣,XML檔案也是由一系列的標記組成,不過,XML檔案中的標記是我們自訂的標記,具有明確的意義,我們可以對標記中的內容的含義作出說明。

對XML檔案有了初步的印象之後,我們就來詳細地談一談XML檔案的語法。在講語法之前,我們必須要了解一個重要的概念,就是XML解析器(XML Parse)。

1.XML解析器

解析器的主要功能是檢查XML檔案是否有結構上的錯誤,剝離XML檔案中的標記,讀出正確的內容,以交給下一步的應用程式處理。 XML是一種用來結構化檔案資訊的標記語言,XML規格中對於如何標記檔案的結構性有一個詳細的法則,解析器就是根據這些法則寫成的軟體(多用Java寫成)。就像HTML一樣,在瀏覽器中,必須有HTML的解析器,這樣瀏覽器才能夠「讀懂」各種用HTML標記所組成的網頁,將它們顯示在我們面前。如果有瀏覽器的HTML解析器讀不懂的標記,將會傳回給我們錯誤訊息

由於現在的HTML標記實際上相當混亂,存在大量不規範的標記(有的網頁用IE能正常顯示,而用Netscape Navigator則不行),所以從一開始,XML的設計者就嚴格規定了XML的語法和結構,我們寫的XML檔案必須遵循這些規定,否則XML解析器將毫不留情地給你顯示錯誤訊息。

有兩種XML文件,一種是Well-Formed XML文件,一種是Validating XML檔。

如果一個XML檔案符合XML規範中的某些相關法則,且沒有使用DTD(檔案格式定義-後詳述)時,可稱這份文件為Well-Formed。而如果一個XML檔是Well-Formed,且正確地使用了DTD,DTD中的語法又是正確的,那麼這個檔就是Validating。對應兩種XML文件,有兩種XML解析器,一種是Well-Formed 解析器,一種是Validating解析器。 IE 5中就內含Validating解析器,Validating解析器也可用來解析Well-Formed XML檔。

檢查它是否滿足了Well-Formed的條件。我們可以將剛才編輯的第一個XML 檔案用IE 5以上版本的瀏覽器開啟。

大家可能要問為什麼在瀏覽器中的顯示和我的來源檔案一樣?沒錯,因為對於XML文件,我們黿齬匭乃 的內容,而它的顯示形式是交給CSS或XSL來完成的。這裡,我們並沒有給這個XML文件定義它的CSS或XSL文件,所以它按照原來的形式來顯示。實際上,對於電子資料交換,僅僅需要一個XML檔案即可,如果要將它以某種形式顯示出來,我們就必須編輯CSS或XSL檔案(這個問題會在以後討論)。

2.Well-Formed的XML檔案

我們知道,XML必須是Well-Formed的,才能夠被解析器正確地解析出來,顯示在瀏覽器中。那什麼是Well-Formed的XML檔呢?主要有下面幾個準則,我們在建立XML檔案的時候,必須滿足它們。

1.XML文件的第一行必须是声明该文件是XML文件以及它所使用的XML规范版本。在文件的前面不能够有其它元素或者注释。

2.在XML文件中有且只能够有一个根元素。我们的第一个例子中,〈参考资料〉... 〈/参考资料〉就是此XML文件的根元素。

3.在XML文件中的标记必须正确地关闭,也就是说,在XML文件中,控制标记必 须有与之对应的结束标记。如:〈名称〉标记必须有对应的〈/名称〉结束标记,不像HTML,某些标记的结束标记可有可无。如果在XML文件中遇到自成一个单元的标记,就是类似于HTML 中的〈img src=.....〉的这些没有结束标记的时候,XML把它称为“空元素”,必须用这样的写法:〈空元素名/〉,如果元素中含有属性时写法则为:〈空元素名 属性名=“属性值”/〉。

4.标记之间不得交叉。在以前的HTML文件中,可以这样写:

〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉和〈H〉
登入後複製

标记之间有相互重叠的区域,而在XML中,是严格禁止这样标记交错的写法,标记必须以规则性的次序来出现。

5.属性值必须要用“ ”号括起来。如第一个例子中的“1.0”、“gb2312”、“人民币”。都是用“ ”号括起来了的,不能漏掉。

6.控制标记、指令和属性名称等英文要区分大小写。与HTML不同的是,在HTML中, 类似〈B〉和〈b〉的标记含义是一样的,而在XML中,类似〈name〉、〈NAME〉或〈Name〉这样的标记是不同的。

7.我们知道,在HTML文件中,如果我们要浏览器原封不动地将我们所输入的东西显示出来,可以将这些东西放到〈pre〉〈/pre〉或者〈xmp〉〈/xmp〉标记中间。这对于我们创建HTML教学的网页是必不可少的,因为网页中要显示HTML的源代码。而在XML中,要实现这样的功能,就必须使用CDATA标记。在CDATA标记中的信息被解析器原封不动地传给应用程序,并且不解析该段信息中的任何控制标记。CDATA区域是由:“〈![CDATA[”为开始标记,以“>〉”为结束标记。例如:例2中的源码,除了“〈![CDATA[”和“>〉”符号,其余的内容解析器将原封不动地交给下游的应用程序,即使CDATA区域中的开始和结尾的空白以及换行字符等,都同样会被转交(注意CDATA是大写的字符)。

例2:

〈![CDATA[飞翔的xml〉〉〉〉〉,:-)
oooo〈〈〈〈〈〈〈
>〉
登入後複製

8.XML处理空白字符和HTML不一样。HTML标准规定,不管有多少个空白,都当作一个空白来处理;而在XML中规定,所有标记以外的空白,解析器都要忠实地交给下游的应用程序处理。这样,我们有时必须摒弃编写HTML文件时的缩排习惯,因为缩排的空格,解析器也要处理。如:

〈作者〉张三〈/作者〉
和
〈作者〉
张三
〈/作者〉
登入後複製

上述内容对于解析器来说是不同的(后者在〈作者〉〈/作者〉标记之内除了张三这个字符以外,还包括两个换行记号以及“张三”前的文字缩排符号)。所以解析器在去掉标记后将信息传给应用程序将有不同的处理结果。

如果我们想明确地告诉XML程序,标记中的空白有明确的含义,不要随便去掉(如在一些诗中,空格有它具体的意义),则可在标记中加入一个XML内置的属性——xml:space 。如(注意属性名称和值的大小写):

〈诗歌 xml:space="preserver"〉
祖国啊! 祖国!
我的祖国!
〈/诗歌〉
登入後複製

另外,在XML文件中,如果要用到表1的特殊字符,必须用相应符号代替。

表1:

特殊字符     替代符号
 &&       &
 <       &it;
 >       >
 "       "
 &#39;      &apos;
登入後複製

小结:

符合上述规定的XML文件就是Well-Formed的XML文件。这是编写XML文件的最基本要求。可以看到XML文件的语法规定比HTML要严格多了。由于有这样的严格规定,软件工程师编写XML的解析器就容易多了,不像编写HTML语言的解析器,必须费尽心思去适应不同的网页写法,提高自己浏览器的适应能力。实际上,这对于我们初学者来说,也是一件好事。该怎样就怎样,不必像原来那样去疑惑各种HTML的写法。

我們看到,在XML檔案中,用的大多都是自訂的標記。但大家考慮一下,如果兩個同產業的公司A和B要用XML檔案互相交換數據,A公司用〈價格〉標記來表示他們產品的價格訊息,而B公司可能用〈售價〉來表示價格資訊.如果一個XML應用程式來讀取他們各自的XML檔案中的信息時,如果它只知道〈價格〉標記裡表示的是價格信息,那麼B公司的價格信息就讀不出來,必將產生錯誤。顯然,對於想利用XML檔案來交換資訊的實體來說,他們之間必須有一個約定——即編寫XML檔案可以用哪些標記,母元素中能夠包含哪些子元素,各個元素出現的順序,元素中的屬性怎樣定義等。這樣他們在用XML交換資料時才能夠暢通無阻。這種約定稱為DTD(Document Type Definition,文件格式定義)。可以把DTD看成編寫XML檔的模板。對於同產業之間的XML資料交換,有一個固定的DTD將會方便很多。比如說,如果網路上的各大電子商場的XML網頁都遵循同一個DTD時,那麼我們就可以輕鬆地依據這個DTD 編寫一個應用程序,去網上將我們感興趣的東西自動抓回來。事實上已經有了好幾個定義好的DTD,如前面所說的MathML、SMIL等。

如果一個XML檔是Well-Formed的,而且它是正確的依據某個DTD建立的,那麼,這個XML檔就被稱為:Validating XML檔。對應的解析器就稱為:Validating Parser。

以上是XML結構與文法入門的具體分享的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

能否用PowerPoint開啟XML文件 能否用PowerPoint開啟XML文件 Feb 19, 2024 pm 09:06 PM

XML檔可以用PPT開啟嗎? XML,即可擴展標記語言(ExtensibleMarkupLanguage),是一種廣泛應用於資料交換和資料儲存的通用標記語言。與HTML相比,XML更加靈活,能夠定義自己的標籤和資料結構,使得資料的儲存和交換更加方便和統一。而PPT,即PowerPoint,是微軟公司開發的一種用於創建簡報的軟體。它提供了圖文並茂的方

C#開發中如何處理XML和JSON資料格式 C#開發中如何處理XML和JSON資料格式 Oct 09, 2023 pm 06:15 PM

C#開發中如何處理XML和JSON資料格式,需要具體程式碼範例在現代軟體開發中,XML和JSON是廣泛應用的兩種資料格式。 XML(可擴展標記語言)是一種用於儲存和傳輸資料的標記語言,而JSON(JavaScript物件表示)是一種輕量級的資料交換格式。在C#開發中,我們經常需要處理和操作XML和JSON數據,本文將重點放在如何使用C#處理這兩種數據格式,並附上

如何使用 PHP 函數處理 XML 資料? 如何使用 PHP 函數處理 XML 資料? May 05, 2024 am 09:15 AM

使用PHPXML函數處理XML資料:解析XML資料:simplexml_load_file()和simplexml_load_string()載入XML檔案或字串。存取XML資料:利用SimpleXML物件的屬性和方法來取得元素名稱、屬性值和子元素。修改XML資料:使用addChild()和addAttribute()方法新增元素和屬性。序列化XML資料:asXML()方法將SimpleXML物件轉換為XML字串。實戰案例:解析產品饋送XML,提取產品信息,轉換並將其儲存到資料庫中。

在Java中使用Jackson函式庫將POJO轉換為XML? 在Java中使用Jackson函式庫將POJO轉換為XML? Sep 18, 2023 pm 02:21 PM

Jackson是一個基於Java的函式庫,它對於將Java物件轉換為JSON以及將JSON轉換為Java物件非常有用。 JacksonAPI比其他API更快,需要更少的記憶體區域,並且適合大型物件。我們使用XmlMapper類別的writeValueAsString()方法將POJO轉換為XML格式,並且需要將對應的POJO實例作為參數傳遞給此方法。語法publicStringwriteValueAsString(Objectvalue)throwsJsonProcessingException範例imp

lambda 表達式的語法和結構有什麼特色? lambda 表達式的語法和結構有什麼特色? Apr 25, 2024 pm 01:12 PM

Lambda表達式是無名稱的匿名函數,其語法為:(parameter_list)->expression。它們具有匿名性、多樣性、柯里化和閉包等特徵。在實際應用中,Lambda表達式可用於簡潔地定義函數,如求和函數sum_lambda=lambdax,y:x+y,並透過map()函數應用於列表來進行求和操作。

深入解析MySQL.proc表的結構及用途 深入解析MySQL.proc表的結構及用途 Mar 15, 2024 pm 02:36 PM

MySQL.proc表是MySQL資料庫中儲存預存程序和函數資訊的系統表,透過深入了解其結構及用途,可以更好地理解預存程序和函數在MySQL中的運作機制,並進行相關的管理和最佳化。以下將詳細解析MySQL.proc表的結構及用途,並提供具體的程式碼範例。 1.MySQL.proc表的結構MySQL.proc表是一個系統表,儲存了所有預存程序和函數的定義和相關信息

您如何在PHP中解析和處理HTML/XML? 您如何在PHP中解析和處理HTML/XML? Feb 07, 2025 am 11:57 AM

本教程演示瞭如何使用PHP有效地處理XML文檔。 XML(可擴展的標記語言)是一種用於人類可讀性和機器解析的多功能文本標記語言。它通常用於數據存儲

XML 解析的 Java 函式庫比較:尋找最佳解決方案 XML 解析的 Java 函式庫比較:尋找最佳解決方案 Mar 09, 2024 am 09:10 AM

簡介XML(可擴展標記語言)是一種用於儲存和傳輸資料的流行格式。在Java中解析XML是許多應用程式的必要任務,從資料交換到文件處理。為了有效地解析XML,開發人員可以使用各種Java函式庫。本文將比較一些最受歡迎的XML解析函式庫,重點放在它們的特性、功能和效能,以幫助開發人員做出明智的選擇。 DOM(文件物件模型)解析函式庫JavaXMLDOMAPI:由oracle提供的標準DOM實作。它提供了一個物件模型,允許開發人員存取和操作XML文件。 DocumentBuilderFactoryfactory=D

See all articles