Quels sont les frameworks de robots pour python ?

爱喝马黛茶的安东尼
Libérer: 2019-06-20 09:49:35
original
8335 Les gens l'ont consulté

Quels sont les frameworks de robots pour python ?

Quels sont les frameworks de robots pour python ? Permettez-moi de vous présenter les dix principaux frameworks de robots d'exploration Python couramment utilisés :

1 Scrapy

Le framework Scrapy est un Python relativement mature. set Le framework d'exploration est un framework d'exploration d'informations rapide et de haut niveau développé à l'aide de Python, qui peut explorer efficacement les pages Web et extraire des données structurées.

Scrapy propose un large éventail d'applications, notamment le développement de robots, l'exploration de données, la surveillance des données, les tests automatisés, etc.

2. PySpider

est un puissant framework de robot d'exploration Web écrit par des Chinois en python. Les principales fonctionnalités sont les suivantes :

1. WebUI puissante, comprenant : un éditeur de script, un moniteur de tâches, un gestionnaire de projet et une visionneuse de résultats
2. , Redis, SQLite, Elasticsearch ; PostgreSQL avec SQLAlchemy, etc. ;
3. Utilisez RabbitMQ, Beanstalk, Redis et Kombu comme files d'attente de messages
4. ;
5. Prise en charge des robots distribués

3. Crawley

exploration à grande vitesse du contenu du site Web correspondant, prend en charge les bases de données relationnelles et non relationnelles, et les données peuvent être exportées au format JSON, XML, etc.

Recommandations associées : "Tutoriel vidéo Python"

4. >

Exploration visuelle Obtenez du contenu Web

5. Journal

Extraire des actualités, des articles et une analyse de contenu


6. goose

L'outil d'extraction d'articles écrit en java


7. Beautiful Soup

est célèbre et intègre certaines exigences courantes des robots. Inconvénients : JS ne peut pas être chargé.

Beautiful Soup est une bibliothèque Python qui peut extraire des données à partir de fichiers HTML ou XML. Elle peut implémenter les méthodes habituelles de navigation, de recherche et de modification de documents via votre convertisseur préféré. Des heures voire des jours de travail. Je l'utilise très fréquemment. L'obtention des éléments HTML est entièrement effectuée par bs4.

8. mécaniser

Avantages : JS peut être chargé. Inconvénients : La documentation manque cruellement. Cependant, à travers des exemples officiels et des méthodes essayées avec de la chair humaine, elle reste encore peu utilisable.


9. sélénium

Il s'agit d'un pilote qui appelle le navigateur. Grâce à cette bibliothèque, vous pouvez appeler directement le navigateur pour effectuer certaines opérations, comme la saisie d'un code de vérification.


10. cola

Un framework de robots distribué. La conception globale du projet est un peu mauvaise et le couplage entre modules est élevé.


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal