關於xml裡的encoding的詳解
前同天和同事在討論xml裡的encoding屬性和檔案格式的關係,終於徹底的弄清楚了。
以前理解的是,xml裡的encoding裡定義必須與檔案格式相符。即有這樣的xml Introduction xml encoding="utf-8" .. ?>,那麼,文件格式必須是一個utf-8文件,即文件的前兩個字節要是一個utf-8頭FF FE 。 (後來才弄清楚,FF FE不是utf-8的BOM。。就是說我的錯誤理解持續了相當長一段時間。。)
下面把討論的幾個階段大概說一下。
剛開始討論時,我很肯定的告訴他,encoding的值必須和文件格式(即BOM,BOM就是byte order mark的縮寫)相匹配,不然在解析XML時,可能會出現(比如文檔含有某個UNICODE字符,而encoding或BOM指定的格式不匹配,就會出錯,當時我是這樣的意思),然後他又告訴我,好像不是這樣,我用DELPHI創建的XML文件,沒有BOM,XML裡面有中文內容,encoding裡指定的是UTF-8,用IE可以正常打開啊。
他在發現他所建立的XML檔案沒有BOM時,有個有趣的地方,就是用UE開啟這類含有UNICODE字元的檔案時,UE會自動在檔案前面加上FF FE,使得檔案可以正常顯示,所以原本沒有BOM的文件,在UE下的十六進制下瀏覽,會看到多了個BOM,這個功能可以在UE的OPTIONS裡去掉的,想知道的可以自己去找找。
然後我有點大頭了,怎麼會這樣呢,然後想啊想,突然他發了一封訊息過來,內容如下:
W3C定義了三個XML解析器如何正確讀取XML檔案的編碼的規則:
1,如果文字封鎖有BOM(位元組順序標記,一般來說,如果儲存為unicode格式,則包含BOM,ANSI則無) ,就定義了檔案編碼
2,如果沒有BOM,就查看XML宣告的編碼屬性
3,如果上述兩個都沒有,就假定XML文擋採用UTF-8編碼
#有了這三條規則,那這個規則就清楚多了。
首先,XML解析器根據檔案的BOM來解析檔案;如果沒找到BOM,由用XML裡的encoding屬性指定的編碼;如果xml裡encoding沒指定的話,就預設用utf-8來解析文檔。然後又可以推出,BOM和ENCODING都有的話,則以BOM指定的為準。
啊!突然覺得有標準文件多好!雖然是那麼的理所當然。
至此,終於把xml裡的encoding和檔案格式的關係搞懂了。雖然這篇紀錄只有那幾百個字內容,但是我們當時在討論的時候,總時間差不多花了2個小時。 #
以上是關於xml裡的encoding的詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

XML檔可以用PPT開啟嗎? XML,即可擴展標記語言(ExtensibleMarkupLanguage),是一種廣泛應用於資料交換和資料儲存的通用標記語言。與HTML相比,XML更加靈活,能夠定義自己的標籤和資料結構,使得資料的儲存和交換更加方便和統一。而PPT,即PowerPoint,是微軟公司開發的一種用於創建簡報的軟體。它提供了圖文並茂的方

使用Python實現XML資料的合併和去重XML(eXtensibleMarkupLanguage)是一種用於儲存和傳輸資料的標記語言。在處理XML資料時,有時候我們需要將多個XML檔案合併成一個,或移除重複的資料。本文將介紹如何使用Python實現XML資料的合併和去重的方法,並給出對應的程式碼範例。一、XML資料合併當我們有多個XML文件,需要將其合

Python中的XML資料轉換為CSV格式XML(ExtensibleMarkupLanguage)是一種可擴充標記語言,常用於資料的儲存與傳輸。而CSV(CommaSeparatedValues)則是一種以逗號分隔的文字檔案格式,常用於資料的匯入和匯出。在處理資料時,有時需要將XML資料轉換為CSV格式以便於分析和處理。 Python作為一種功能強大

使用Python實現XML資料的篩選和排序引言:XML是一種常用的資料交換格式,它以標籤和屬性的形式儲存資料。在處理XML資料時,我們經常需要對資料進行篩選和排序。 Python提供了許多有用的工具和函式庫來處理XML數據,本文將介紹如何使用Python實現XML資料的篩選和排序。讀取XML檔案在開始之前,我們需要先讀取XML檔案。 Python有許多XML處理函式庫,

Python實作XML與JSON之間的轉換導語:在日常的開發過程中,我們常常需要將資料在不同的格式之間轉換。 XML和JSON是常見的資料交換格式,在Python中,我們可以使用各種函式庫來實作XML和JSON之間的相互轉換。本文將介紹幾種常用的方法,並附帶程式碼範例。一、XML轉JSON在Python中,我們可以使用xml.etree.ElementTree模

使用Python處理XML中的錯誤和異常XML是一種常用的資料格式,用於儲存和表示結構化的資料。當我們使用Python處理XML時,有時可能會遇到一些錯誤和異常。在本篇文章中,我將介紹如何使用Python來處理XML中的錯誤和異常,並提供一些範例程式碼供參考。使用try-except語句捕捉XML解析錯誤當我們使用Python解析XML時,有時候可能會遇到一些

Python解析XML中的特殊字元和轉義序列XML(eXtensibleMarkupLanguage)是一種常用的資料交換格式,用於在不同系統之間傳輸和儲存資料。在處理XML檔案時,經常會遇到包含特殊字元和轉義序列的情況,這可能會導致解析錯誤或誤解資料。因此,在使用Python解析XML檔案時,我們需要了解如何處理這些特殊字元和轉義序列。一、特殊字元和

C#開發中如何處理XML和JSON資料格式,需要具體程式碼範例在現代軟體開發中,XML和JSON是廣泛應用的兩種資料格式。 XML(可擴展標記語言)是一種用於儲存和傳輸資料的標記語言,而JSON(JavaScript物件表示)是一種輕量級的資料交換格式。在C#開發中,我們經常需要處理和操作XML和JSON數據,本文將重點放在如何使用C#處理這兩種數據格式,並附上
