communauté

Apprendre

Bibliothèque d'outils

Outils d'IA

Loisirs

Français

Maison > développement back-end > Tutoriel Python > Méthode Python pour extraire les hyperliens des pages Web

Méthode Python pour extraire les hyperliens des pages Web

高洛峰

Libérer： 2017-02-22 16:52:18

original

3318 Les gens l'ont consulté

De nombreuses personnes envisagent d'utiliser Python pour le développement de robots lorsqu'elles apprennent Python pour la première fois. Puisque vous souhaitez effectuer un robot d'exploration, vous devez d'abord explorer la page Web et extraire l'adresse du lien hypertexte de la page Web. Cet article partagera avec vous une méthode simple, à laquelle vous pourrez vous référer si nécessaire.

Ce qui suit est la méthode d'implémentation la plus simple. Tout d'abord, capturez la page Web cible, puis obtenez le lien hypertexte via une correspondance régulière de l'attribut href dans la balise a

Le code. est la suivante :

import urllib2
import re
 
url = &#39;http://www.sunbloger.com/&#39;
 
req = urllib2.Request(url)
con = urllib2.urlopen(req)
doc = con.read()
con.close()
 
links = re.findall(r&#39;href\=\"(http\:\/\/[a-zA-Z0-9\.\/]+)\"&#39;, doc)
for a in links:
  print a

Copier après la connexion

Pour plus d'articles liés à la méthode Python d'extraction d'hyperliens à partir de pages Web , veuillez faire attention au site Web PHP chinois !

Étiquettes associées：

python 网页超链接

Article précédent：Exemple de méthode d'initialisation de liste en Python Article suivant：Méthode Python pour résoudre les caractères chinois tronqués lorsque Fedora décompresse le zip

Déclaration de ce site Web

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Derniers articles par auteur

Exemples de paramètres HTML pour les effets de police gras, italique, souligné, barré et autres

1970-01-01 08:00:00
实现一个 Java 版的 Redis

1970-01-01 08:00:00
La démo d'applet WeChat la plus simple

1970-01-01 08:00:00
Introduction aux méthodes de fonctionnement simples de pandas.DataFrame (créer, indexer, ajouter et supprimer) en python

1970-01-01 08:00:00
WeChat Mini Program : Exemple de mise en œuvre de l'effet d'onglets

1970-01-01 08:00:00
Python construit des méthodes personnalisées pour embellir la sortie de la structure du dictionnaire

1970-01-01 08:00:00
HTML5 : utilisez Canvas pour traiter la vidéo en temps réel

1970-01-01 08:00:00
Asp.net utilise SignalR pour envoyer des images

1970-01-01 08:00:00
Tutoriel de développement de programmes WeChat Mini-App() et Page() Présentation des fonctions

1970-01-01 08:00:00
Explication détaillée de l'utilisation de Python Redis

1970-01-01 08:00:00

Derniers numéros

Comment construire une API REST avec Python?

2025-03-10 18:54:46
Comment utiliser la belle soupe pour analyser HTML?

2025-03-10 18:54:18
Comment utiliser les demandes pour faire des demandes HTTP dans Python?

2025-03-10 18:52:58
Comment effectuer l'apprentissage en profondeur avec TensorFlow ou Pytorch?

2025-03-10 18:52:30
Comment utiliser Django pour le développement Web dans Python?

2025-03-10 18:51:10

Rubriques connexes

Plus>

Recommandations populaires

Tutoriels populaires

Plus>

Tutoriels associés

Recommandations populaires

Derniers cours

Derniers téléchargements

Plus>

effets Web

Code source du site Web

Matériel du site Web

Modèle frontal