この記事では、XML コード記述のエンコーディングと検証の問題を主に紹介します。HTML と同様に、XML ファイルのエンコーディングもプリアンブルで指定できます。
エンコーディング
エンコーディングは変換することです。 Unicode 文字は、等価なバイナリ表現のプロセスです。 XML ハンドラーは XML ドキュメントを読み取るとき、エンコード タイプに基づいてドキュメントをエンコードします。したがって、XML 宣言でエンコード タイプを指定する必要があります。
エンコーディングの種類
エンコーディングには主に2種類があります:
UTF-8
UTF-16
UTFはUCS変換形式を表し、UCS自体はユニバーサル文字セットを意味します。数値 8 または 16 は、文字を表すビット数を表します。 8 (1 バイト) または 16 (2 バイト) です。エンコード情報のないドキュメントの場合は、デフォルトで UTF-8 が使用されます。
構文
エンコーディング情報は、XML ドキュメントのプロローグに含まれています。 UTF-8 エンコードの構文は次のとおりです。
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>
UTF-16 エンコードの構文は次のとおりです。
<?xml version="1.0" encoding="UTF-16" standalone="no" ?>
例
次の例は、エンコード宣言を示しています。
<?xml version="1.0" encoding="UTF-8" standalone="no" ?>Tanmay Patil TutorialsPoint (011) 123-4567
上記のエンコードでは="UTF-8 " この例では、文字を表現するために 8 ビットを使用するように指定されています。 16 文字を使用するには、UTF-16 エンコーディングを使用します。
UTF-8 を使用してエンコードされた XML ファイルのサイズは、UTF-16 形式の XML ファイルよりも小さくなります。
検証
検証は、XML ドキュメントを検証するプロセスです。文書は、その内容が要素、属性、および関連する文書型定義 (DTD) と一致し、文書が b で表される制約に準拠する場合に、有効であるとみなされます。 XML パーサーを使用して検証を処理するには 2 つの方法があります。
整形式の XML ドキュメント
有効な XML ドキュメント
整形式の XML ドキュメント
XML ドキュメントは、次の規則に従っている場合、整形式とみなされます。
DTD のない XML ドキュメントは、amp(&)、apos (一重引用符)、g(>)、quot (二重引用符) を処理するために、事前定義された文字エンティティを使用する必要があります。
タグの順序に従う必要があります。たとえば、外側のタグを閉じる前に内側のタグを閉じる必要があります。
すべての開始タグには終了タグが必要か、または自己終了タグ (
以下は、整形式の XML ドキュメントの例です:
<?xml version="1.0" encoding="UTF-8" standalone="yes" ?> <!DOCTYPE address [ <!ELEMENT address (name,company,phone)> <!ELEMENT name (#PCDATA)> <!ELEMENT company (#PCDATA)> <!ELEMENT phone (#PCDATA)> ]> <address> <name>Tanmay Patil</name> <company>TutorialsPoint</company> <phone>(011) 123-4567</phone> </address>
上記の例は、以下の理由から整形式であると考えられます:
ドキュメント タイプを定義します。ここでのドキュメントタイプは要素タイプです。
address という名前のルート要素が含まれます。
各子要素の名前、会社、電話は、一目瞭然で正しく閉じられたタグです。
タグは正しい順序です。
以上がXML コード記述におけるエンコードと検証の問題の詳細な紹介の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。