PHP で DOMDocument を使用した HTML5 の解析
PHP の DOMDocument は HTML5 ドキュメントの解析に苦労し、
DOMDocument の制限事項:
残念ながら、DOMDocument には最新の HTML5 タグの解析がサポートされていません。これは、これらのタグを認識しない厳密な XML 仕様に準拠しています。
エラー報告の無効化:
DOMDocument に HTML5 の解析を強制することはできませんが、エラーを抑制することはできます。それが生成するメッセージ。 libxml_use_internal_errors を使用して、エラー報告を一時的に無効にします。
<code class="php">$dom = new DOMDocument; libxml_use_internal_errors(true); $dom->loadHTML('...'); libxml_clear_errors();</code>
このアプローチにより、エラーが発生することなく HTML5 を解析できます。ただし、HTML5 の解析が実際に有効になるわけではないことに注意することが重要です。これは、認識されないタグによって生成されたエラーをマスクするだけです。
代替アプローチ:
本物の HTML5 解析については、次のような他の解析ライブラリを検討することを検討してください。
これらのライブラリは特に HTML5 構文を処理し、HTML5 コード内の属性と値を変更できるようにします。
以上がPHP で DOMDocument を使用して HTML5 ドキュメントを解析するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。