テキスト ノードの取得: ドキュメントのテキスト ランドスケープの探索
getElementsByTagName() は HTML 要素を効率的に取得しますが、テキストへの直接のアクセスは提供しません。ノード。ただし、この問題を解決するには、さまざまなアプローチを完全に理解する必要があります。
ブラウザ ネイティブ メソッドの探索
最初は、次のようなネイティブ メソッドが必要になるかもしれません。テキスト ノードの場合は getElementsByTagName()。しかし、そのようなものは存在しません。これには、代替ソリューションを検討する必要があります。
DOM ツリーの走査
1 つのアプローチは、ツリー ウォーカー、反復走査または再帰走査などの手法を使用して DOM ツリーを走査することです。
CSS セレクターの活用とXPath
または、CSS セレクター (querySelectorAll) はテキスト ノードを取得できますが、要素を除外するには特別な処理が必要です。同様に、Xpath (document.evaluate) はソリューションを提供します。
パフォーマンスの比較
意思決定を容易にするために、さまざまな方法でパフォーマンス テストが実施されています。TreeWalker、再帰的トラバーサル、反復的トラバーサル、XPath、QuerySelectorAll、および GetElementsByTagName。結果は、TreeWalker が GetElementsByTagName と同等のパフォーマンスを提供し、一部のシナリオでは前者の方が優れていることを示しています。
追加リソース
詳細については、次のリソースを参照してください。
以上がHTML ドキュメントからテキスト ノードを効率的に取得するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。