正規表現を使用して PHP の HTML タグ間のコンテンツを抽出する方法-PHPチュートリアル-php.cn

正規表現を使用して PHP の HTML タグ間のコンテンツを抽出する方法

DDD

リリース： 2024-11-10 16:28:02

オリジナル

981 人が閲覧しました

How to Extract Content Between HTML Tags in PHP using Regular Expressions?

PHP での HTML タグ間のコンテンツの抽出

HTML を使用する場合、HTML タグ内に囲まれた特定のコンテンツを分離する必要がある場合があります。。 PHP でこれを実現するには、正規表現の機能を活用できます。

HTML タグのコンテンツの取得

マークされたさまざまなテキストと特定のコンテンツを含む HTML 文字列があるとします。 のような HTML タグのペアによって。目標は、これらのタグ内のコンテンツを抽出することです。

これを行うには、次の正規表現を使用できます:

$regex = '#<\s*?code\b[^>]*>(.*?)</code\b[^>]*>#s';

ログイン後にコピー

正規表現の分解

b は、単語の境界によりタイプミスやバリエーションが存在しないことを保証すると主張します。 Captured.
[^>]* は、コードの開始タグと終了タグ内の任意のコンテンツと一致します。
(.*?) は、貪欲ではない方法でタグ間のコンテンツをキャプチャします。
フラグを使用すると、正規表現で複数行のコンテンツをキャプチャできるようになります。

例使用法

次の HTML 文字列について考えてみましょう。

$content = "Lorem ipsum dolor sit amet, consectetur adipiscing elit. <code>Donec sed erat vel diam ultricies commodo. Nunc venenatis tellus eu quam suscipit quis fermentum dolor vehicula.</code>"

ログイン後にコピー

この文字列に正規表現を適用すると、 内のコンテンツを正常に抽出できます。タグ:


$code = preg_match($regex, $content, $matches);
ログイン後にコピー
抽出されたコンテンツは $matches 配列に保存されます。その後、抽出した文字列に対して必要な操作を実行し、それを元の HTML コンテンツに再挿入できます。
以上が正規表現を使用して PHP の HTML タグ間のコンテンツを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。