PHP で HTML コードを解析する方法
HTML コードの解析は、特に特定の情報を抽出したい場合、複雑な作業になることがあります。 。正規表現は魅力的なオプションのように思えるかもしれませんが、多くの場合、コードが脆弱になり、予期しない結果が生じる可能性があります。この記事では、PHP ドキュメント オブジェクト モデル (DOM) を使用した HTML 解析へのより構造化されたアプローチに焦点を当てています。
PHP DOM を使用して見出しテキストを抽出する
HTML 見出し間のテキストを抽出すると、次のように DOM を利用できます。したがって:
$str = '<h1>
このコードは次のように出力します:
Heading 1 T2
見出し間の抽出
目的が見出し間のコンテンツを抽出することである場合、正規表現を利用できますが、適切なテストを確実に行ってください:
echo preg_replace("#<h1[^\>]*>.*?<\/h1>#", "", $str);
これは出力:
Lorem ipsum.The quick red fox...
結論
PHP DOM を利用すると、HTML コードを解析するための堅牢で信頼性の高い方法にアクセスできるようになります。正規表現は代替手段を提供しますが、最適な結果を得るには注意が必要です。
以上がPHP の DOM を使用して HTML コンテンツを確実に解析するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。