Introduction aux outils de ligne de commande courants de Scrapy

零下一度
Libérer: 2017-06-28 15:55:04
original
1521 Les gens l'ont consulté

Afficher toutes les commandes

scrapy -h
Copier après la connexion

Afficher les informations d'aide

scapy --help
Copier après la connexion

Afficher les informations sur la version

(venv)ql@ql:~$ scrapy version
Scrapy 1.1.2(venv)ql@ql:~$ 
(venv)ql@ql:~$ scrapy version -vScrapy    : 1.1.2lxml      : 3.6.4.0libxml2   : 2.9.4Twisted   : 16.4.0Python    : 2.7.12 (default, Jul  1 2016, 15:12:24) - [GCC 5.4.0 20160609]pyOpenSSL : 16.1.0 (OpenSSL 1.0.2g-fips  1 Mar 2016)Platform  : Linux-4.4.0-36-generic-x86_64-with-Ubuntu-16.04-xenial
(venv)ql@ql:~$
Copier après la connexion

Créer un nouveau projet

scrapy startproject spider_name

Build crawler genspider (generator spider)

Plusieurs araignées peuvent exister dans un projet, mais le nom doit être unique

scrapy genspider name domain# Par exemple : #scrapy genspider sohu sohu.org

Voir combien de robots d'exploration il y a dans le projet en cours

liste scrapy

voir Utiliser un navigateur pour ouvrir la page Web

vue scrapy www.baidu.com

commande shell, entrez dans l'environnement interactif scrpay

#Entrez l'environnement interactif de l'url scrapy shell www.dmoz.org/Computers/ Programming/Languages/Python/Books/

Entrez ensuite dans l'environnement interactif
Nous utilisons principalement la commande de réponse ici, par exemple, vous pouvez utiliser

response.xpath() #Brackets Ajoutez directement le chemin XPath

La commande runspider est utilisée pour exécuter directement le robot créé, et n'exécutera pas l'intégralité du projet

Nom du robot d'exploration Scrapy Runspider


Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal