如何在 HTML 解析中忽略正規表示式中的可選空格?

Mary-Kate Olsen
發布: 2024-10-24 08:29:01
原創
639 人瀏覽過

How to Ignore Optional Whitespace in Regular Expressions for HTML Parsing?

正規表示式中的可選空格

解析 HTML 或文字資料時,通常需要忽略某些字元之間的空格。然而,使用正規表示式這可能具有挑戰性。

使用 s 的解?和s* 量詞

要匹配字元之間的可選空格,請使用量詞s?和s*.

  • s 匹配任何空白字元(空格、製表符、換行符等)。
  • ? 表示前面的字元可能出現一次或完全不出現。
  • * 表示前面的字元可能出現零次或多次。

範例

要忽略下列HTML 標記中的空格:

<code class="html"><a href="/wiki/File:Sky1.png" title="File:Sky1.png">
<img alt="Sky1.png" src="http://media-mcw.cursecdn.com/thumb/5/56/Sky1.png/150px-Sky1.png" width="150" height="84">
</a></code>
登入後複製

使用下列正規表示式:

'#<a href\s?="(.*?)" title\s?="(.*?)"><img alt\s?="(.*?)" src\s?="(.*?)"[\s*]width\s?="150"[\s*]height\s?="(.*?)"></a>#'
登入後複製

使用下列正規表示式:

此表達式允許在屬性名稱和屬性名稱之間使用可選的空格它們的值,以及屬性值和周圍的HTML 標籤之間的關係。

字元類註解原始程式碼使用字元類別 [s ],這導致了意想不到的結果。字元類別與其任何成員匹配一次,並且

量詞允許它出現多次。透過將 [s] 替換為 s,您可以確保僅匹配空白字符,並且量詞專門應用於它們。

以上是如何在 HTML 解析中忽略正規表示式中的可選空格?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!