ホームページ > バックエンド開発 > PHPチュートリアル > PHP 正規表現: HTML のすべての見出しと段落を一致させる方法

PHP 正規表現: HTML のすべての見出しと段落を一致させる方法

王林
リリース: 2023-06-22 19:22:02
オリジナル
992 人が閲覧しました
<p>HTML タグは最近の Web サイトでよく使用されており、これらのタグにはタイトルや段落などのさまざまな要素が含まれています。 PHP 開発者であれば、後で使用するために HTML ファイルからすべての見出しと段落タグを抽出する必要が生じたことがあるかもしれません。ここで正規表現が役に立ちます。この記事では、PHP 正規表現を使用して HTML のすべての見出しと段落を照合する方法を説明します。 </p> <p>まず、HTML のタイトルと段落のタグが何であるかを知る必要があります。 HTML タグにはさまざまなタイトル要素と段落要素が含まれており、最も一般的なものは、タイトルを表すために使用される h1、h2、h3 およびその他のタグであり、段落を表すために使用されるのは p タグです。この記事では、これらの最も一般的に使用されるタグのみに焦点を当てます。 </p> <p>次に、PHP 正規表現を使用して HTML のタイトル タグと段落タグを照合する方法を見てみましょう。以下のコードは、HTML ファイルを読み取り、正規表現を使用してファイル内のすべての見出しと段落を照合する単純な PHP スクリプトを示しています。 </p><div class="code" style="position:relative; padding:0px; margin:0px;"><pre class='brush:php;toolbar:false;'><?php // 读入 HTML 文件 $html = file_get_contents('example.html'); // 正则表达式匹配所有标题和段落 $pattern = '/<(hd|p)[^>]*>(.*?)</>/si'; preg_match_all($pattern, $html, $matches); // 显示所匹配的结果 print_r($matches[0]); ?></pre><div class="contentsignin">ログイン後にコピー</div></div><p>このコード スニペットの正規表現<code>/<(hd|p) [^>]*>(.*?)</ >/si</code> 次のことができます: </p><ul><li> <code><</code> と <code>></code> メタキャラクターは、HTML タグの先頭と末尾を一致させるために使用されます。 </li><li><code>hd|p</code> は、すべての見出し (h1、h2、h3 など) と段落 (p) タグに一致することを意味します。 </li><li><code>[^>]*</code> は、<code>></code> を除くタグ内のすべての文字に一致します。<code>></code> はタグの開始点であるためです。 . 開始位置の区切り文字。 </li><li><code>(.*?)</code> タグの途中にあるテキストを一致させるには、非貪欲一致を使用します。 </li><li><code></ ></code> は、開始タグに対応する終了タグを一致させることを意味します。 <code> </code> は、以前に指定したタグ (つまり、<code>hd|p</code>) と一致することを意味します。 </li></ul><p>この正規表現では、2 つのパターン修飾子 <code>s</code> と <code>i</code> を使用します。このうち、<code>s</code> は、<code>.</code> メタキャラクターが改行を含むすべての文字と一致するように、「ドット マッチング モード」をオンにするために使用されます。また、<code>i</code> は、タグ名の大文字と小文字が一致結果に影響しないように、「大文字と小文字を区別しないモード」をオンにするために使用されます。 </p><p>スクリプトの実行が終了すると、一致するすべての見出しと段落タグが出力されます。結果は次のようになります。 </p><div class="code" style="position:relative; padding:0px; margin:0px;"><pre class='brush:php;toolbar:false;'>Array ( [0] => <h1>PHP 正则表达式</h1> [1] => <p>现代网站中常常会用到 HTML 标记,这些标记包含了各种元素,例如标题和段落等等。</p> [2] => <h2>标题2</h2> [3] => <p>段落2</p> [4] => <h3>标题3</h3> [5] => <p>段落3</p> )</pre><div class="contentsignin">ログイン後にコピー</div></div><p> この結果では、PHP 正規表現が HTML 内のすべての見出しタグと段落タグに正常に一致したことがわかります。この正規表現には、HTML 内のリンク、画像、表の照合など、他のアプリケーション シナリオもあります。この記事が、HTML 内の要素を照合するための PHP 正規表現の使用についての理解を深めるのに役立つことを願っています。 </p>

以上がPHP 正規表現: HTML のすべての見出しと段落を一致させる方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート