communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > développement back-end > Tutoriel Python > Comment extraire les attributs \'href\' en utilisant BeautifulSoup en Python ?

Comment extraire les attributs \'href\' en utilisant BeautifulSoup en Python ?

DDD

Libérer： 2024-10-28 21:42:02

original

356 Les gens l'ont consulté

How to extract

Extraction de l'attribut HREF avec BeautifulSoup

Dans ce scénario, vous souhaitez extraire l'attribut href "some_url" du contenu HTML suivant :

<code class="html"><a href="some_url">next</a>
<span class="class">...</span></code>

Copier après la connexion

Utilisation de la méthode find_all() de BeautifulSoup

Pour récupérer cet attribut spécifique, utilisez la méthode find_all() comme suit :

<code class="python">from bs4 import BeautifulSoup

html = '''<a href="some_url">next</a>
<span class="class"><a href="another_url">later</a></span>'''

soup = BeautifulSoup(html)

for a in soup.find_all('a', href=True):
    print("Found the URL:", a['href'])</code>

Copier après la connexion

Compatibilité Python 2 vers Python 3

Notez que ce code fonctionne à la fois pour Python 2 et Python 3. Cependant, dans les anciennes versions de BeautifulSoup (antérieures à la version 4), la méthode find_all() a été nommé findAll.

Récupération de toutes les balises avec des attributs HREF

Si vous souhaitez récupérer toutes les balises qui possèdent un attribut href, quel que soit leur nom de balise, omettez simplement le paramètre de nom de balise :

<code class="python">href_tags = soup.find_all(href=True)</code>

Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Article précédent：Comment convertir un objet modèle Django en un dictionnaire complet : quelle méthode est la meilleure ? Article suivant：Comment puis-je accéder dynamiquement au nom d'une fonction en Python ?

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Comment corriger le code d'erreur OneNote 0x803d0014 dans Windows?

2025-03-21 04:00:27
Comment utiliser Lambda dans Excel pour créer vos propres fonctions

2025-03-21 03:08:15
Verizon déploie des SMS satellites pour les téléphones Android

2025-03-21 03:07:13
Les nouvelles smartwatches Pebbleos ne seraient pas excellentes pour les propriétaires d'iPhone

2025-03-21 03:05:13
C'est la meilleure façon de rendre votre téléphone moins addictif

2025-03-21 03:04:11
6 étapes à prendre avant de vendre votre ordinateur portable Windows

2025-03-21 03:03:10
Le pixel 9a est officiel: voici 7 choses que vous devez savoir

2025-03-21 03:02:10
Windows 11 pourrait vous rappeler passivement que votre ordinateur est nul

2025-03-21 03:01:10
Monster Hunter Wilds: Comment obtenir du liquide monstre

2025-03-21 02:24:15
Racer Tokyo Xtreme: SP Battle, expliqué

2025-03-21 02:22:11

Derniers numéros

Qu'est-ce que les tests unitaires?

2025-03-20 18:33:31
Qu'est-ce que le verrouillage mondial des interprètes (GIL) dans Python?

2025-03-20 18:30:42
Qu'est-ce que le multithreading dans Python?

2025-03-20 18:29:37
Comment utilisez-vous re.search (), re.match () et re.findall ()?

2025-03-20 18:27:44
Quels sont les différents métacharacteurs dans les expressions régulières (par exemple,., *,?)?

2025-03-20 18:27:05

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal