PHP 正規表現は、テキスト内のさまざまなパターンやルールを処理するために使用できる強力なツールです。 Web 開発では、ユーザー入力から HTML タグをフィルターで除外したり、Web コンテンツからプレーン テキストを抽出したりするなど、HTML タグを削除する必要が生じることがよくあります。このチュートリアルでは、PHP 正規表現を使用して HTML タグを削除する方法と、具体的なコード例を紹介します。
PHP では、正規表現を使用して HTML タグの一致と置換を行うことができます。以下は、テキストから HTML タグを削除する方法を示す簡単な例です。
$text = "<h1>Hello, <strong>World</strong>!</h1>"; $clean_text = preg_replace("/<.*?>/", "", $text); echo $clean_text;
この例では、preg_replace
関数を使用してテキスト内のすべての HTML タグを置き換えます。正規表現 /<.*?>/
は、任意の HTML タグと一致し、空の文字列に置き換えて、HTML タグを削除する効果を実現します。
他のタグやテキスト コンテンツを保持したまま、特定の HTML タグのみを削除したい場合があります。次の例は、<script>
タグと <style>
タグを削除する方法を示しています。
$text = "<h1>Hello, <script> ;alert('World');</script>!</h1>"; $clean_text = preg_replace("/<script(.*?)</script>|<style(.*?)</style>/is", "", $text); echo $clean_text;
この例では、特定の正規表現を使用します/<script(.*?)</script>|<style(.*?)< ;/style> ;/is
は、<script>
および <style>
タグとその内容を照合し、空の文字列に置き換えます。
HTML ドキュメント内のプレーン テキスト コンテンツを抽出する必要がある場合があります。つまり、すべての HTML タグを削除した後のテキストのみを保持します。次の例は、プレーン テキスト コンテンツを抽出する方法を示しています。
$html = "<p>これは <strong>太字</strong> および <em>斜体</em> のテキストです。< /p>"; $clean_text = ストリップタグ($html); echo $clean_text;
この例では、PHP の組み込み strip_tags
関数を使用して、すべての HTML タグを削除し、テキスト コンテンツのみを保持します。
このチュートリアルでは、PHP 正規表現を使用して HTML タグを削除する方法 (すべてのタグの削除、特定のタグの削除、プレーン テキスト コンテンツの抽出など) を学習しました。正規表現は、テキスト内の複雑なパターンやルールを扱う場合に非常に役立ちます。このチュートリアルがお役に立てば幸いです。
以上がPHP 正規表現チュートリアル: HTML タグを削除するための実践的なヒントの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。