PHP で HTML/XML を解析および処理する方法
ネイティブ XML 拡張子
-
DOM : XML の操作とクエリを可能にする強力な DOM APIドキュメント。
-
XMLReader: ドキュメント内の個々のノードへのアクセスを提供する XML プル パーサー。
-
XML パーサー: SAX スタイルの XML プッシュ パーサーこれにより、XML のイベント駆動型処理が可能になります。要素。
-
SimpleXML: プロパティ セレクターと配列反復子を使用して XML をオブジェクトに変換することにより、XML 解析を簡素化します。
サードパーティ ライブラリ (LibXML)ベース)
-
FluentDom: DOM 操作用の jQuery のような流暢なインターフェイス。
-
HtmlPageDom: のメソッドで DOMCrawler を拡張します。 HTMLの操作document.
-
phpQuery: jQuery スタイルの CSS セレクターベースの DOM API.
-
Laminas-Dom: DOM ドキュメントをクエリするための統合インターフェイスを提供しますXPath と CSS を使用するselectors.
-
fDOMDocument: 便宜上、例外とカスタム メソッドを使用して標準 DOM を拡張します。
-
Sabre/XML: XMLReader クラスと XMLWriter クラスをラップして拡張します。オブジェクト用マッピング。
-
FluidXML: XPath および流暢なプログラミング パターンを使用して XML を操作するための流暢な API。
サードパーティ(非 LibXML ベース)
-
PHP シンプル HTML DOM パーサー: 無効な HTML をサポートしますが、パフォーマンスが低くなります。
-
PHP HTML パーサー: CSS セレクターをサポートするシンプルな HTML パーサーですが、遅い。
HTML 5
-
HTML5DOMDocument: バグを修正し、HTML5 の DOMDocument ライブラリに機能を追加します。
-
HTML5:標準に準拠した HTML5 パーサーおよびライターは完全に PHP で書かれています。
正規表現 (最も推奨されない)
- 次の理由により HTML 解析には脆弱で推奨されません。構文的な
書籍
- PHP Architect's Guide to Webscraping with PHP
以上がPHP で HTML/XML を効率的に解析して処理する方法: どの方法を選択する必要がありますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。