首頁 > 後端開發 > C++ > 如何使用正規表示式從標籤中提取 href 值?

如何使用正規表示式從標籤中提取 href 值?

Linda Hamilton
發布: 2025-01-10 06:19:40
原創
701 人瀏覽過

How to Extract href Values from  Tags Using Regular Expressions?

利用正規表示式找出<a>連結的'href'值

從HTML中提取連結通常可以使用簡單的模式,例如"(?>.?)"。但是,當試圖專門取得'href'屬性時,這種方法就顯得力不從心了。

為了解決這個問題,我們可以使用更精確的正規表示式來定位<a>標籤內的'href'值。下面是一個有效的模式:

<code><a\s+(?:[^>]*?\s+)?href=(["'])(.*?)</code>
登入後複製

這個正規表示式的運作方式如下:

  • 找出起始的<a>標籤。
  • 可選匹配'href'屬性之前的任何屬性或空格。
  • 捕捉起始引號(單引號或雙引號)。
  • 匹配引號之間的任何字符,並將它們作為一個群組捕獲(這包括連結的URL)。
  • 確保結束引號與起始引號相符。

使用此正規表示式,您可以從如下所示的連結中提取'href'值:

<code><a ....="" href="https://www.php.cn/link/3d7a8f67f51564c349478f7d52abee3b"></a>
<a ....="" href="http://https://www.php.cn/link/3d7a8f67f51564c349478f7d52abee3b"></a>
<a ....="" href="https://https://www.php.cn/link/3d7a8f67f51564c349478f7d52abee3b"></a></code>
登入後複製

但是,需要注意的是,此正規表示式也會符合不包含所需「?」和「=」字元的連結。如果這是一個問題,則可能需要額外的過濾。

以上是如何使用正規表示式從標籤中提取 href 值?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板