Gemeinschaft

Lernen

Tools-Bibliothek

KI-Tools

Freizeit

Deutsch

Heim > Backend-Entwicklung > Python-Tutorial > Python打印scrapy蜘蛛抓取树结构的方法

Python打印scrapy蜘蛛抓取树结构的方法

WBOY

Freigeben： 2016-06-10 15:15:58

Original

1183 Leute haben es durchsucht

本文实例讲述了Python打印scrapy蜘蛛抓取树结构的方法。分享给大家供大家参考。具体如下：

通过下面这段代码可以一目了然的知道scrapy的抓取页面结构，调用也非常简单

#!/usr/bin/env python
import fileinput, re
from collections import defaultdict
def print_urls(allurls, referer, indent=0):
  urls = allurls[referer]
  for url in urls:
    print ' '*indent + referer
    if url in allurls:
      print_urls(allurls, url, indent+2)
def main():
  log_re = re.compile(r'<GET (.*&#63;)> \(referer: (.*&#63;)\)')
  allurls = defaultdict(list)
  for l in fileinput.input():
    m = log_re.search(l)
    if m:
      url, ref = m.groups()
      allurls[ref] += [url]
  print_urls(allurls, 'None')
main()

Nach dem Login kopieren

希望本文所述对大家的Python程序设计有所帮助。

Verwandte Etiketten：

python 抓取树结构

Quelle：php.cn

Vorheriger Artikel：Python实现把xml或xsl转换为html格式 Nächster Artikel：Python实现在线程里运行scrapy的方法

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Neueste Artikel des Autors

Was ist eine NullPointerException und wie behebe ich sie?

2024-10-22 09:46:29
Vom Anfänger zum Programmierer: Ihre Reise beginnt mit C-Grundlagen

2024-10-13 13:53:41
Webentwicklung mit PHP freischalten: Ein Leitfaden für Anfänger

2024-10-12 12:15:51
C entmystifizieren: Ein klarer und einfacher Weg für neue Programmierer

2024-10-11 22:47:31
Entfalten Sie Ihr Programmierpotenzial: C-Programmierung für absolute Anfänger

2024-10-11 19:36:51
Entfesseln Sie Ihren inneren Programmierer: C für absolute Anfänger

2024-10-11 15:50:41
Automatisieren Sie Ihr Leben mit C: Skripte und Tools für Anfänger

2024-10-11 15:07:41
PHP leicht gemacht: Ihre ersten Schritte in der Webentwicklung

2024-10-11 14:21:21
Erstellen Sie alles mit Python: Ein Leitfaden für Anfänger, um Ihrer Kreativität freien Lauf zu lassen

2024-10-11 12:59:11
Der Schlüssel zum Programmieren: Die Leistungsfähigkeit von Python für Anfänger freischalten

2024-10-11 12:17:31

Aktuelle Ausgaben

Python/MySQL kann Ganzzahldaten nicht korrekt beibehalten Hier ist kein Code erforderlich. Ich möchte eine sehr lange Zahl speichern, weil ich ein S...

Aus 2024-04-04 19:09:44

0

1

367

Mit Selenium möchten Sie im Unterricht auf die URL klicken und sie definieren Ich brauche heute noch einen Tipp. Ich versuche, Python/Selenium-Code zu erstellen und die...

Aus 2024-04-04 14:14:44

0

1

3492

Selenium + Python – Bild überexecute_script prüfen Ich muss mit Selenium in Python überprüfen, ob ein Bild auf der Seite angezeigt wird. Scha...

Aus 2024-04-03 09:32:15

0

1

375

So behalten Sie die ersten X Zeilen bei und löschen Tabellenzeilen Ich habe eine große Tabelle mit Millionen von Datensätzen in MySQLincident_archive. Ich mö...

Aus 2024-04-01 18:32:54

0

1

347

Wie kratze ich mit BeautifulSoup bestimmten Google Weather-Text? Wie finde ich mit BeautifulSoup den Kurstext „New York City, USA“ in Python? Ich habe vers...

Aus 2024-04-01 14:06:14

0

1

308

verwandte Themen

Mehr>

Beliebte Empfehlungen

Beliebte Tutorials

Mehr>

Verwandte Tutorials

Beliebte Empfehlungen

Aktuelle Kurse

Neueste Downloads

Mehr>

Web-Effekte

Quellcode der Website

Website-Materialien

Frontend-Vorlage