XMLでのエンコードについて詳しく解説
昨日の同じ日にxmlのencoding属性とファイル形式の関係について同僚と議論していて、ようやくよく理解できました。
私のこれまでの理解では、XML のエンコード定義はファイル形式と一致する必要があると考えられていました。つまり、このような XML Introduction (FF FE は utf-8 の BOM ではないことが後でわかりました...つまり、私の誤解はかなり長い間続いたということです...)
議論のいくつかの段階について簡単に説明しましょう。
ディスカッションの初めに、私は彼に、エンコード値はファイル形式 (つまり、BOM、BOM はバイト オーダー マークの略語です) と一致する必要があることを確実に伝えました。そうしないと、XML を解析するときに、エンコード値が表示される可能性があります (たとえば、ドキュメント特定の UNICODE 文字が含まれており、エンコーディングまたは BOM で指定された形式が一致しない場合、エラーが発生します)、そして、XML ファイルはそうではないようだと私に言いました。 DELPHI で作成したものは BOM がなく、XML に中国語が含まれていましたが、指定されたエンコーディングは UTF-8 で、IE では正常に開くことができました。
彼が作成した XML ファイルに BOM がないことを発見したとき、興味深いことに、UE を使用して UNICODE 文字を含むそのようなファイルを開くと、ファイルが表示できるように UE がファイルの前に FF FE を自動的に追加するということでした。通常、UE で 16 進数の BOM がないファイルを参照すると、追加の BOM が表示されます。知りたい場合は、UE の OPTIONS で削除できます。
それから私は少し混乱しました、どうしてこんなことが起こるのでしょうか?そして考えて考えました、そして突然彼は次の内容のメッセージを送りました:
W3C は XML パーサーがどのようにエンコーディングを正しく読み取ることができるかについて 3 つのルールを定義します。 XML ファイル:
1. ドキュメントに BOM (一般的に言えば、Unicode 形式で保存されている場合は BOM が含まれますが、ANSI には含まれません) がある場合、ファイル エンコーディングが定義されます 2. BOM がない場合は、XML で宣言されたエンコード属性を確認してください
3. 上記のどちらも存在しない場合、XML ドキュメントは UTF-8 でエンコードされているとみなされます
これら 3 つのルールを使用すると、ルールがより明確になります。
まず、XML パーサーはファイルの BOM に従ってファイルを解析します。BOM が見つからない場合は、XML のエンコーディング属性で指定されたエンコーディングが使用されます。XML でエンコーディングが指定されていない場合は、UTF-8 が使用されます。ドキュメントを解析するためにデフォルトで使用されます。 BOM と ENCODING の両方がある場合は、BOM で指定されたものが優先されます。 ああ!突然、標準的なドキュメントがあればどんなに素晴らしいだろうと感じました。すごく自然なことなのに。
この時点で、XML におけるエンコードとファイル形式の関係がようやく理解できました。この記録には数百語しか含まれていませんが、議論していると合計時間は 2 時間近くかかりました。
以上がXMLでのエンコードについて詳しく解説の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









XML ファイルは PPT で開くことができますか? XML、Extensible Markup Language (Extensible Markup Language) は、データ交換とデータ ストレージで広く使用されている汎用マークアップ言語です。 HTML と比較して、XML はより柔軟であり、独自のタグとデータ構造を定義できるため、データの保存と交換がより便利で統一されます。 PPT (PowerPoint) は、プレゼンテーションを作成するために Microsoft によって開発されたソフトウェアです。包括的な方法を提供します。

Python を使用した XML データのフィルタリングと並べ替えの実装 はじめに: XML は、データをタグと属性の形式で保存する、一般的に使用されるデータ交換形式です。 XML データを処理するとき、多くの場合、データのフィルタリングと並べ替えが必要になります。 Python には、XML データを処理するための便利なツールとライブラリが多数用意されています。この記事では、Python を使用して XML データをフィルタリングおよび並べ替える方法を紹介します。 XML ファイルの読み取り 始める前に、XML ファイルを読み取る必要があります。 Python には XML 処理ライブラリが多数ありますが、

Python を使用した XML データのマージと重複排除 XML (eXtensibleMarkupLanguage) は、データの保存と送信に使用されるマークアップ言語です。 XML データを処理するとき、複数の XML ファイルを 1 つにマージしたり、重複データを削除したりする必要がある場合があります。この記事では、Python を使用して XML データのマージと重複排除を実装する方法と、対応するコード例を紹介します。 1. XML データのマージ 複数の XML ファイルがある場合、それらをマージする必要があります。

Python の XML データを CSV 形式に変換する XML (ExtensibleMarkupLanguage) は、データの保存と送信に一般的に使用される拡張可能なマークアップ言語です。 CSV (CommaSeparatedValues) は、データのインポートとエクスポートに一般的に使用されるカンマ区切りのテキスト ファイル形式です。データを処理するとき、分析や処理を容易にするために、XML データを CSV 形式に変換する必要がある場合があります。 Pythonは強力です

Python は XML と JSON 間の変換を実装します はじめに: 日常の開発プロセスでは、異なる形式間でデータを変換する必要があることがよくあります。 XML と JSON は一般的なデータ交換形式であり、Python ではさまざまなライブラリを使用して XML と JSON の間で変換できます。この記事では、一般的に使用されるいくつかの方法をコード例とともに紹介します。 1. Python で XML を JSON に変換するには、xml.etree.ElementTree モジュールを使用できます。

PHP を使用した XML データのデータベースへのインポート はじめに: 開発中、さらなる処理や分析のために外部データをデータベースにインポートする必要がよくあります。一般的に使用されるデータ交換形式として、XML は構造化データの保存と送信によく使用されます。この記事では、PHP を使用して XML データをデータベースにインポートする方法を紹介します。ステップ 1: XML ファイルを解析する まず、XML ファイルを解析し、必要なデータを抽出する必要があります。 PHP には XML を解析するためのいくつかの方法が用意されており、最も一般的に使用されるのは Simple を使用する方法です。

Python を使用した XML でのエラーと例外の処理 XML は、構造化データの保存と表現に使用される一般的に使用されるデータ形式です。 Python を使用して XML を処理すると、エラーや例外が発生することがあります。この記事では、Python を使用して XML のエラーと例外を処理する方法を紹介し、参考用のサンプル コードをいくつか示します。 Try-Except ステートメントを使用して XML 解析エラーを捕捉する Python を使用して XML を解析すると、時々、次のようなエラーが発生することがあります。

Python は XML 内の特殊文字とエスケープ シーケンスを解析します XML (eXtensibleMarkupLanguage) は、異なるシステム間でデータを転送および保存するために一般的に使用されるデータ交換形式です。 XML ファイルを処理する場合、特殊文字やエスケープ シーケンスが含まれる状況に遭遇することが多く、これにより解析エラーやデータの誤解が生じる可能性があります。したがって、Python を使用して XML ファイルを解析する場合は、これらの特殊文字とエスケープ シーケンスの処理方法を理解する必要があります。 1. 特殊文字と
