PHP での HTML タグ間のコンテンツの抽出
HTML を使用する場合、HTML タグ内に囲まれた特定のコンテンツを分離する必要がある場合があります。 。 PHP でこれを実現するには、正規表現の機能を活用できます。
HTML タグのコンテンツの取得
マークされたさまざまなテキストと特定のコンテンツを含む HTML 文字列があるとします。 のような HTML タグのペアによって
。目標は、これらのタグ内のコンテンツを抽出することです。
これを行うには、次の正規表現を使用できます:
$regex = '#<\s*?code\b[^>]*>(.*?)</code\b[^>]*>#s';
正規表現の分解
例使用法
次の HTML 文字列について考えてみましょう。
$content = "Lorem ipsum dolor sit amet, consectetur adipiscing elit. <code>Donec sed erat vel diam ultricies commodo. Nunc venenatis tellus eu quam suscipit quis fermentum dolor vehicula.</code>"
この文字列に正規表現を適用すると、 内のコンテンツを正常に抽出できます。タグ:
$code = preg_match($regex, $content, $matches);
抽出されたコンテンツは $matches 配列に保存されます。その後、抽出した文字列に対して必要な操作を実行し、それを元の HTML コンテンツに再挿入できます。
以上が正規表現を使用して PHP の HTML タグ間のコンテンツを抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。