??.NET Framework では、XmlTextReader クラスと XmlTextWriter クラスが XML データの読み取りおよび書き込み制御を提供します。この記事では、XML ブラウザ (リーダー) のシステム構造と、それらが XMLDOM および SAX 指定子とどのように組み合わされるかについて説明します。また、ブラウザを使用して XML ドキュメントを分析および検証する方法、整形式の XML ドキュメントを作成する方法、関数を使用して Base64 および BinHex エンコーディングに基づいて大きな XML ドキュメントを読み書きする方法も示します。最後に、著者は、リーダーとライターを別のクラスにカプセル化する、ストリームベースの読み取り/書き込みアナライザーを実装する方法について説明します。
??約 3 年前、私はソフトウェア研究カンファレンスに参加しました。そのテーマは「XML がなければ、プログラミングの未来はない」でした。 XML は実際に段階的に開発されており、.NET Framework に組み込まれています。この記事では、.NET Framework で XML ドキュメントを処理するための API の役割とその内部特性について説明し、その後、一般的に使用される関数をいくつか紹介します。
??MSXML から .net XML へ
??.NET Framework が登場する前は、Windows 用の XML ドライバーを作成するために、COM ベースのクラス ライブラリである MSXML サービスを使用することに慣れていました。 .NET Framework のクラスとは異なり、MSXML クラス ライブラリのコードの一部は API よりも深く、オペレーティング システムの最下層に完全に埋め込まれています。 MSXML は確かにアプリケーションと通信できますが、外部環境と完全に統合することはできません。
??MSXML クラス ライブラリは win32 にインポートでき、CLR でも使用できますが、外部サーバー コンポーネントとしてのみ使用できます。ただし、.NET Framework に基づくアプリケーションは、XML クラスを直接使用してアプリケーションを .NET Framework の他の名前空間と統合でき、記述されたコードは簡単に参照できます。
??MSXML パーサーは、スタンドアロン コンポーネントとして、非同期分析などの高度な機能を提供します。この機能は、.NET Framework の XML クラスや .NET Framework の他のクラスには提供されていません。ただし、これに基づいて、NET Framework の XML クラスを他のクラスと簡単に統合できます。さらに効果を加えることができます。
??.NET Framework の XML クラスは、XML データの分析、クエリ、変換のための基本的な機能を提供します。 .NET Framework には、Xpath クエリと XSLT 変換をサポートするクラスのほか、XML ドキュメントの読み取り/書き込み用のクラスがあります。さらに、.NET Framework には、オブジェクトのシリアル化 (XmlSerializer および SoapFormatter クラス)、アプリケーション構成 (AppSettingsReader クラス)、データ ストレージ (DataSet クラス) など、XML を処理するための他のクラスも含まれています。この記事では、基本的な XML I/O 操作を実装するクラスについてのみ説明します。
??XML 分析モード
??XML はマークアップ言語であるため、特定の構文に従ってドキュメントに格納されている情報を分析して理解するためのツールが必要です。このツールは XML パーサーであり、マークされたテキストを読み取り、プラットフォーム固有のオブジェクトを返すコンポーネントです。
??すべての XML パーサーは、どのオペレーティング プラットフォームに属しているかに関係なく、ツリーベースのプロセッサーとイベントベースのプロセッサーの 2 つのカテゴリに分類されます。これら 2 つのカテゴリは通常、XMLDOM (Microsoft XML Document Object Model) と SAX (Simple API for XML) を使用して実装されます。 XMLDOM パーサーは、汎用のツリーベースの API であり、XML ドキュメントをメモリ内構造のツリーとして公開します。 SAX パーサーはイベントベースの API であり、XML データ ストリーム内の各要素を処理します (XML データをストリームに入れて処理します)。通常、DOM は SAX ストリームによってロードおよび実行できるため、これら 2 種類の処理は相互に排他的ではありません。
??一般に、SAX パーサーと XMLDOM パーサーは正反対であり、分析モードも大きく異なります。 XMLDOM はその機能コレクション内で明確に定義されており、拡張することはできません。大きなドキュメントを処理する場合、膨大な機能のコレクションを処理するために多くのメモリ領域が必要になります。
??SAX アナライザーは、クライアント アプリケーションを使用して、プラットフォーム固有のオブジェクトの既存のインスタンスを通じて分析イベントを処理します。 SAX パーサーはすべての処理を制御し、データをハンドラーに「プッシュ」し、ハンドラーは処理するデータを受け入れるか拒否します。このモードの利点は、必要なメモリ容量が非常に少ないことです。
??.NET Framework は XMLDOM モードを完全にサポートしていますが、SAX モードはサポートしていません。なぜ? .NET Framework は、XMLDOM パーサーと XML ブラウザーという 2 つの異なる分析モードをサポートしているためです。明らかに SAX パーサーをサポートしていませんが、それは SAX パーサーのような機能を提供しないという意味ではありません。 XML ブラウザを通じて SAX のすべての機能を簡単に実現し、より効果的に使用できます。 SAX パーサーとは異なり、.NET Framework ブラウザーはすべてクライアント アプリケーションで実行されます。このようにして、アプリケーション自体は、本当に必要なデータのみを「抽出」し、XML データ ストリームから飛び出すことができます。 SAX 分析モードは、アプリケーションにとって有用な情報と無用な情報をすべて処理します。
??ブラウザは .NET Framework ストリーミング モードに基づいて動作し、その動作方法はデータベース カーソルに似ています。興味深いことに、同様のカーソル解析パターンを実装するクラスは、.NET Framework の XMLDOM パーサーの基礎的なサポートを提供します。 2 つの抽象クラス XmlReader および XmlWriter は、XMLDOM クラス、ADO.NET ドライバー クラス、構成クラスを含む、.NET Framework のすべての XML クラスの基本クラスです。したがって、.NET Framework で XML データを処理するには 2 つの代替方法があります。 XmlReader クラスと XmlWriter クラスを使用して XML データを直接処理するか、XMLDOM モードを使用します。 .NET Framework でのドキュメントの読み方の詳細については、MSDN の 2002 年 8 月号の「Cutting Edge」コラム記事を参照してください。
上記は、.NET Framework で XML データを簡単に処理する (1-1) の内容です。さらに関連する内容については、PHP 中国語 Web サイト (www.php.cn) に注目してください。