Comment extraire les attributs \'href\' des éléments HTML imbriqués à l'aide de BeautifulSoup ?

Linda Hamilton
Libérer: 2024-10-28 17:52:29
original
931 Les gens l'ont consulté

How to Extract 'href' Attributes from Nested HTML Elements Using BeautifulSoup?

Comment extraire les attributs 'href' à l'aide de BeautifulSoup

Lorsque vous travaillez avec des données HTML, la récupération d'informations spécifiques telles que les attributs 'href' peut être cruciale . Dans ce cas, nous avons deux balises, une avec des éléments imbriqués, et le but est d'extraire l'attribut 'href' de la balise 'a', en ignorant le contenu du texte.

Pour y parvenir en utilisant BeautifulSoup, vous peut utiliser la méthode 'find_all'. Cette méthode vous permet de rechercher des balises en fonction de divers critères, notamment des attributs. Voici le code :

from bs4 import BeautifulSoup

html = '''<a href="some_url">next</a>
<span class="class"><a href="another_url">later</a></span>'''

soup = BeautifulSoup(html)

for a in soup.find_all('a', href=True):
    print("Found the URL:", a['href'])
Copier après la connexion

Ce code parcourt toutes les balises « a » avec un attribut « href » et imprime la valeur de l'attribut « href » pour chaque balise. Le résultat sera :

Found the URL: some_url
Found the URL: another_url
Copier après la connexion

Alternativement, si vous souhaitez récupérer toutes les balises avec un attribut 'href', quel que soit leur nom, vous pouvez utiliser :

href_tags = soup.find_all(href=True)
Copier après la connexion

Cette méthode renvoie une liste de toutes les balises avec un attribut 'href' dans le document HTML.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!