PHP を使用した HTML タグ間のコンテンツの抽出
正規表現を使用して文字列から特定のコンテンツを抽出するのは難しい場合があります。 間のコンテンツを取得する必要があるとします。
タグ。 PHP でこれを実現する方法を見てみましょう。
正規表現パターンを理解する
タグ間のコンテンツを抽出するには、次の正規表現パターンを使用します。
'#<\s*?code\b[^>]*>(.*?)</code\b[^>]*>#s'
ログイン後にコピー
パターン:
-
b: のようなタイプミスを確認します。 </li>
<li>
<strong><sup><a href="https://www.php.cn/link/d58f36f7679f85784d8b010ff248f898" rel="nofollow" target="_blank">1</a></sup>*:</strong> 属性 (クラスなど) を持つタグのコンテンツをキャプチャします。</li>
<li>
<strong>(.*?):</strong> タグ内の実際のコンテンツを貪欲でない一致。</li>
<li>
<strong>b:</strong> 繰り返しますが、これによりタイプミスが捕捉されなくなります。</li>
<li>
<strong>s:</strong> 's' フラグはパターンを有効にします。改行を含むコンテンツをキャプチャします。</li>
</ul>
<p><strong>すべてを置くTogether:</strong></p>
<div class="code" style="position:relative; padding:0px; margin:0px;"><pre class="brush:php;toolbar:false">$regex = '#<\s*?code\b[^>]*>(.*?)</code\b[^>]*>#s';
$content = "Lorem ipsum dolor sit amet, consectetur adipiscing elit. <code>Donec sed erat vel diam ultricies commodo. Nunc venenatis tellus eu quam suscipit quis fermentum dolor vehicula.";
preg_match($regex, $content, $matches);
$code = $matches[1];
ログイン後にコピー
抽出されたコンテンツの操作と再挿入
コンテンツを抽出したら、抽出された文字列と親文字列の両方に対して操作を実行できます。 。抽出されたコンテンツを親文字列に再挿入するには、部分文字列の置換などの文字列操作テクニックを使用できます。
たとえば、 内のコンテンツを置き換えてみましょう。 "MODIFIED" のタグ:
$replacedContent = str_replace($matches[0], "MODIFIED", $content);
ログイン後にコピー
結論
提供された正規表現を利用することで、PHP の特定の HTML タグ間のコンテンツを効果的に抽出できます。この手法は、さまざまな文字列解析シナリオで有用であることがわかります。
以上がPHP を使用して `` タグ間のコンテンツを抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。