지역 사회

배우다

도구 라이브러리

AI 도구

여가

한국어

집 > 백엔드 개발 > 파이썬 튜토리얼 > Python打印scrapy蜘蛛抓取树结构的方法

Python打印scrapy蜘蛛抓取树结构的方法

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

풀어 주다： 2016-06-10 15:15:58

원래의

1233명이 탐색했습니다.

本文实例讲述了Python打印scrapy蜘蛛抓取树结构的方法。分享给大家供大家参考。具体如下：

通过下面这段代码可以一目了然的知道scrapy的抓取页面结构，调用也非常简单

#!/usr/bin/env python
import fileinput, re
from collections import defaultdict
def print_urls(allurls, referer, indent=0):
  urls = allurls[referer]
  for url in urls:
    print ' '*indent + referer
    if url in allurls:
      print_urls(allurls, url, indent+2)
def main():
  log_re = re.compile(r'<GET (.*&#63;)> \(referer: (.*&#63;)\)')
  allurls = defaultdict(list)
  for l in fileinput.input():
    m = log_re.search(l)
    if m:
      url, ref = m.groups()
      allurls[ref] += [url]
  print_urls(allurls, 'None')
main()

로그인 후 복사

希望本文所述对大家的Python程序设计有所帮助。

관련 라벨：

python 기다 트리 구조

이전 기사：Python实现把xml或xsl转换为html格式 다음 기사：Python实现在线程里运行scrapy的方法

본 웹사이트의 성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

저자별 최신 기사

LLMS 작동 방식 : 사후 훈련, 신경망, 환각 및 추론에 대한 사전 훈련

2025-02-26 03:58:14
나는 블록 체인과 AI를 결합하여 예술을 생성했습니다. 다음은 다음에 일어난 일입니다.

2025-02-26 03:38:10
고급 프롬프트 엔지니어링 : 사고 체인 (COT)

2025-02-26 03:17:10
sqlite에서 증강 증강 생성

2025-02-26 02:49:09
자신의 node.js api를 구축하기 위해 LLM 구동 보일러 플레이트를 사용하는 방법

2025-02-26 01:08:13
2024 년 코딩을위한 LLMS : 가격, 성과 및 최고를위한 전투

2025-02-26 00:46:10
비전 언어 모델을 제기합니다

2025-02-25 23:42:08
큰 언어 모델의 응답의 신뢰성을 측정하는 방법

2025-02-25 22:50:13
삶의 환상

2025-02-25 21:54:11
과학자들은 인간의 사고를 반영하는 큰 언어 모델에 대해 진지하게 생각합니다.

2025-02-25 20:45:11

최신 이슈

기계 학습 파이프 라인 구축과 관련된 단계를 설명하십시오.

2025-03-27 19:34:19
컴퓨터 비전에 Python을 어떻게 사용할 수 있습니까?

2025-03-27 19:31:56
감독 학습, 감독되지 않은 학습 및 강화 학습의 개념을 설명하십시오.

2025-03-27 19:27:19
Scikit-Learn, Tensorflow 또는 Pytorch와 같은 기계 학습 라이브러리에 대한 귀하의 경험을 설명하십시오.

2025-03-27 19:25:41
자동화를위한 스크립팅 언어에 대한 귀하의 경험을 설명하십시오.

2025-03-27 19:24:28

관련 주제

더>

인기 추천

인기 튜토리얼

더>

관련 튜토리얼

인기 추천

최신 강좌

최신 다운로드

더>

웹 효과

웹사이트 소스 코드

웹사이트 자료

프론트엔드 템플릿