HTML 解析のために正規表現内のオプションの空白を無視する方法

Mary-Kate Olsen
リリース: 2024-10-24 08:29:01
オリジナル
639 人が閲覧しました

How to Ignore Optional Whitespace in Regular Expressions for HTML Parsing?

正規表現内のオプションの空白

HTML またはテキスト データを解析する場合、特定の文字間の空白を無視することが必要になることがよくあります。ただし、正規表現を使用すると難しい場合があります。

s を使用した解決策?および s* 量指定子

文字間のオプションの空白を一致させるには、量指定子 s? を使用します。 s*.

  • s は、任意の空白文字 (スペース、タブ、改行など) に一致します。
  • ? は、前の文字は 1 回出現することも、まったく出現しないこともあります。
  • * は、前の文字が 0 回以上出現する可能性があることを意味します。

次の HTML タグの空白を無視するには:

<code class="html"><a href="/wiki/File:Sky1.png" title="File:Sky1.png">
<img alt="Sky1.png" src="http://media-mcw.cursecdn.com/thumb/5/56/Sky1.png/150px-Sky1.png" width="150" height="84">
</a></code>
ログイン後にコピー

次の正規表現を使用します:

'#<a href\s?="(.*?)" title\s?="(.*?)"><img alt\s?="(.*?)" src\s?="(.*?)"[\s*]width\s?="150"[\s*]height\s?="(.*?)"></a>#'
ログイン後にコピー

この式では、属性名と属性の間にオプションの空白を使用できます。

文字クラスに関する注意

元のコードでは文字クラス [s が使用されていました。 』が予想外の結果を引き起こした。文字クラスはそのメンバーのいずれかと 1 回一致しますが、 量指定子を使用すると複数回一致することができます。 [s] を s に置き換えることで、空白文字のみが一致し、数量指定子がそれらの文字に具体的に適用されるようになります。

以上がHTML 解析のために正規表現内のオプションの空白を無視する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート
私たちについて 免責事項 Sitemap
PHP中国語ウェブサイト:福祉オンライン PHP トレーニング,PHP 学習者の迅速な成長を支援します!