XMLデータ読み込み方式の性能比較(2)-XML/RSS チュートリアル-php.cn

ホームページ

バックエンド開発

XML/RSS チュートリアル

XMLデータ読み込み方式の性能比較(2)

黄舟

Feb 13, 2017 pm 03:45 PM

前回は一般的なXMLの読み込み方法をまとめましたが、通常はXMLソースの全データを使う必要はないので、タイトルの頭文字でフィルタリングするなど、一部のデータを読み込んでみる実験をしてみました。そして発生位置。

3つのランダム読み取り方法では、クエリ条件を変更するだけです

XmlDocument:
var nodeList = doc.DocumentElement.SelectNodes("item[substring(title,1,1)=&#39;M&#39;][position() mod 10 = 0]");
　　XPathNavigator:
var nodeList = nav.Select("/channel/item[substring(title,1,1)=&#39;M&#39;][position() mod 10 = 0]");
　　Xml Linq:
var nodelist = from node in xd.XPathSelectElements("/channel/item[substring(title,1,1)=&#39;M&#39;][position() mod 10 = 0]")

ログイン後にコピー

XPathを使用すると、コードを1行変更するだけで済みます。 XPath は習得するのがかなり簡単で、SQL よりもはるかに単純です。 XPath ユーザー向けに W3C Shcool の構文紹介と MSDN の LINQ To XML を参照すれば、15 分でその秘密をマスターできるでしょう。

しかし、XmlReaderメソッドの場合は、Mで始まるタイトルを読み取ったり、10項目ごとに1項目を取得したりするので、長い間考えましたが、エレガントな実装方法が思いつきませんでした。 , そこで私はこれを行う必要がありました:

Code

static List<Channel> testXmlReader2()
{
    var lstChannel = new List<Channel>();
    var reader = XmlReader.Create(xmlStream);
    int n = 0;Channel channel = null;
Search:
    while (reader.Read())
    {
        if (reader.Name == "item" && reader.NodeType == XmlNodeType.Element)
        {  
            while (reader.Read())
            {
                if (reader.Name == "item") break;
                if (reader.NodeType != XmlNodeType.Element) continue;
                switch (reader.Name)
                {
                    case "title":
                        var title = reader.ReadString();
                        if (title[0] != &#39;M&#39;) goto Search;          
                        n++;
                        if (n % 10 != 0) goto Search; 
                        channel = new Channel();
                        channel.Title = title;
                        break;
                    case "link":
                        channel.Link = reader.ReadString();
                        break;
                    case "description":
                        channel.Description = reader.ReadString();
                        break;
                    case "content":
                        channel.Content = reader.ReadString();
                        break;
                    case "pubDate":
                        channel.PubDate = reader.ReadString();
                        break;
                    case "author":
                        channel.Author = reader.ReadString();
                        break;
                    case "category":
                        channel.Category = reader.ReadString();
                        break;
                    default:
                        break;
                }
                lstChannel.Add(channel);
            }
        }
    }
    return lstChannel;
}

ログイン後にコピー

コード構造が大幅に変更されていることがわかります。条件付きスクリーニングを実行するには、ローカル変数 n を追加し、エンティティクラスの初期化を調整し、コレクションステートメントの場所を追加する必要があり、長年忘れていた goto ステートメントを使用してジャンプする必要もありました。 (VB の方が優れています)。 Lao Zhao 氏の言葉を借りれば、ビジネスロジックはコードの実装にまで浸透しており、文法上のノイズが顔に突き当たります。

XmlTextReaderの実装プロキシクラスであるXmlTextReaderImp（内部、直接使用不可）は、数万行のコードを持つスーパークラスで、Xml文字レベルで直接実行される多数の操作をカプセル化しています。この操作は最下層に非常に近いため、マクロレベルで適切なコード最適化方法を見つけるのは困難です。フィルタリング条件、つまりビジネスロジックが複雑になれば、コードも全く異なり、わかりやすさと保守性は鏡のように変わります。

次に、時間のパフォーマンスを比較してみましょう:

XmlDocment    26ms    
XPathNavigator    26ms    
XmlTextReader    20ms    
Xml Linq    28ms

ログイン後にコピー

Document メソッドと Navigator メソッドの消費時間は大幅に短縮されましたが、Reader メソッドはまだ最初から読み取る必要があるため、大幅に短縮されていません。 3 ミリ秒の削減は、エンティティオブジェクト作成のオーバーヘッドと考えることができます。さらに奇妙なのは、Linq メソッドが変更されずに最後に落ちたことです。

さまざまなクエリ条件をテストできます。これらの 4 つのメソッドにはそれぞれ、Xml ソースのサイズに関連する独自のパフォーマンス制限があることがわかります。たとえば、最初の 2 つのメソッドでは、XmlDocument.Load メソッドの実行時間に依存します。私のマシンでは、Xml のロードに 23 ミリ秒かかります。 Linq メソッドは壊れないわけではありません。処理する結果が少ない場合、実行時間は 1 ～ 2 ミリ秒短縮されます。

ドキュメントメソッドとナビゲーターメソッドは、データ量が増えるとパフォーマンスが大幅に低下します。無駄なオブジェクトを大量に作成するためであることは容易に推測できます。各メソッドのメモリ使用量を見ると、すべてのデータをフィルタリングせずにロードした場合、Document メソッドは約 23.3M のメモリを使用するのに対し、Navigator メソッドは約 22.9M しか使用しないことがわかります。これは、パフォーマンスが低下する理由も説明します。 Document メソッドの減少はより顕著です。リーダーモードではデータが完全に読み込まれ、プログラムの起動自体のオーバーヘッドを除くと、必要なメモリは約 20.1M だけであり、前の 2 つの方法と比較して使用するメモリの量は半分未満です。 Linq 方式は、メモリの点でも驚くべきパフォーマンスを備えており、Reader 方式よりも 500k 未満多くなっています。

さらなる分析により、特別な必要がない限り、XmlTextReader は注意して使用する必要があるという結論が得られました。XmlTextReader は変更に対する準備が不十分であり、エラーが発生しやすいです。 Linq 方式を使用することを強くお勧めします。場合によっては、Navigator 方式よりも時間パフォーマンスが若干劣りますが、メモリ使用量のパフォーマンスが優れているため、第一の選択肢として確立されています。そして、Linq To XML は将来さらに強力になると信じています。

上記は XML データ読み取り方法のパフォーマンス比較 (2) です。さらに関連する内容については、PHP 中国語 Web サイト (www.php.cn) に注目してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7526

CakePHP チュートリアル

1378

Steamのアカウント名の形式は何ですか

Win11 Activation Key Permanent

NYTの接続はヒントと回答です

Related knowledge

PowerPoint を使用して XML ファイルを開くことはできますか? Feb 19, 2024 pm 09:06 PM

XML ファイルは PPT で開くことができますか? XML、Extensible Markup Language (Extensible Markup Language) は、データ交換とデータストレージで広く使用されている汎用マークアップ言語です。 HTML と比較して、XML はより柔軟であり、独自のタグとデータ構造を定義できるため、データの保存と交換がより便利で統一されます。 PPT (PowerPoint) は、プレゼンテーションを作成するために Microsoft によって開発されたソフトウェアです。包括的な方法を提供します。

Python を使用した XML データのマージと重複排除 Aug 07, 2023 am 11:33 AM

Python を使用した XML データのマージと重複排除 XML (eXtensibleMarkupLanguage) は、データの保存と送信に使用されるマークアップ言語です。 XML データを処理するとき、複数の XML ファイルを 1 つにマージしたり、重複データを削除したりする必要がある場合があります。この記事では、Python を使用して XML データのマージと重複排除を実装する方法と、対応するコード例を紹介します。 1. XML データのマージ複数の XML ファイルがある場合、それらをマージする必要があります。

Python を使用した XML データのフィルタリングと並べ替え Aug 07, 2023 pm 04:17 PM

Python を使用した XML データのフィルタリングと並べ替えの実装はじめに: XML は、データをタグと属性の形式で保存する、一般的に使用されるデータ交換形式です。 XML データを処理するとき、多くの場合、データのフィルタリングと並べ替えが必要になります。 Python には、XML データを処理するための便利なツールとライブラリが多数用意されています。この記事では、Python を使用して XML データをフィルタリングおよび並べ替える方法を紹介します。 XML ファイルの読み取り始める前に、XML ファイルを読み取る必要があります。 Python には XML 処理ライブラリが多数ありますが、

Python で XML データを CSV 形式に変換する Aug 11, 2023 pm 07:41 PM

Python の XML データを CSV 形式に変換する XML (ExtensibleMarkupLanguage) は、データの保存と送信に一般的に使用される拡張可能なマークアップ言語です。 CSV (CommaSeparatedValues) は、データのインポートとエクスポートに一般的に使用されるカンマ区切りのテキストファイル形式です。データを処理するとき、分析や処理を容易にするために、XML データを CSV 形式に変換する必要がある場合があります。 Pythonは強力です

PHP を使用して XML データをデータベースにインポートする Aug 07, 2023 am 09:58 AM

PHP を使用した XML データのデータベースへのインポートはじめに: 開発中、さらなる処理や分析のために外部データをデータベースにインポートする必要がよくあります。一般的に使用されるデータ交換形式として、XML は構造化データの保存と送信によく使用されます。この記事では、PHP を使用して XML データをデータベースにインポートする方法を紹介します。ステップ 1: XML ファイルを解析するまず、XML ファイルを解析し、必要なデータを抽出する必要があります。 PHP には XML を解析するためのいくつかの方法が用意されており、最も一般的に使用されるのは Simple を使用する方法です。

Python は XML と JSON 間の変換を実装します Aug 07, 2023 pm 07:10 PM

Python は XML と JSON 間の変換を実装しますはじめに: 日常の開発プロセスでは、異なる形式間でデータを変換する必要があることがよくあります。 XML と JSON は一般的なデータ交換形式であり、Python ではさまざまなライブラリを使用して XML と JSON の間で変換できます。この記事では、一般的に使用されるいくつかの方法をコード例とともに紹介します。 1. Python で XML を JSON に変換するには、xml.etree.ElementTree モジュールを使用できます。

Python を使用した XML でのエラーと例外の処理 Aug 08, 2023 pm 12:25 PM

Python を使用した XML でのエラーと例外の処理 XML は、構造化データの保存と表現に使用される一般的に使用されるデータ形式です。 Python を使用して XML を処理すると、エラーや例外が発生することがあります。この記事では、Python を使用して XML のエラーと例外を処理する方法を紹介し、参考用のサンプルコードをいくつか示します。 Try-Except ステートメントを使用して XML 解析エラーを捕捉する Python を使用して XML を解析すると、時々、次のようなエラーが発生することがあります。

Python は XML 内の特殊文字とエスケープシーケンスを解析します Aug 08, 2023 pm 12:46 PM

Python は XML 内の特殊文字とエスケープシーケンスを解析します XML (eXtensibleMarkupLanguage) は、異なるシステム間でデータを転送および保存するために一般的に使用されるデータ交換形式です。 XML ファイルを処理する場合、特殊文字やエスケープシーケンスが含まれる状況に遭遇することが多く、これにより解析エラーやデータの誤解が生じる可能性があります。したがって、Python を使用して XML ファイルを解析する場合は、これらの特殊文字とエスケープシーケンスの処理方法を理解する必要があります。 1. 特殊文字と

See all articles

XMLデータ読み込み方式の性能比較(2)

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック