如何使用 BeautifulSoup 從嵌套 HTML 元素中提取'href”屬性?

Linda Hamilton
發布: 2024-10-28 17:52:29
原創
931 人瀏覽過

How to Extract 'href' Attributes from Nested HTML Elements Using BeautifulSoup?

如何使用 BeautifulSoup 提取「href」屬性

處理 HTML 資料時,檢索「href」屬性等特定資訊至關重要。在這種情況下,我們有兩個標籤,一個帶有嵌套元素,目標是從“a”標籤中提取“href”屬性,忽略文字內容。

要使用 BeautifulSoup 實現這一點,您可以使用「find_all」方法。此方法可讓您根據各種條件(包括屬性)搜尋標籤。程式碼如下:

from bs4 import BeautifulSoup

html = '''<a href="some_url">next</a>
<span class="class"><a href="another_url">later</a></span>'''

soup = BeautifulSoup(html)

for a in soup.find_all('a', href=True):
    print("Found the URL:", a['href'])
登入後複製

此程式碼迭代所有具有 'href' 屬性的 'a' 標籤,並列印每個標籤的 'href' 屬性的值。輸出將為:

Found the URL: some_url
Found the URL: another_url
登入後複製

或者,如果您想檢索具有'href' 屬性的所有標籤,無論其名稱如何,您可以使用:

href_tags = soup.find_all(href=True)
登入後複製

此方法傳回HTML文檔中所有具有“href”屬性的標籤的清單。

以上是如何使用 BeautifulSoup 從嵌套 HTML 元素中提取'href”屬性?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!