python - Menggunakan Scrapy, bagaimana untuk meminta URL baharu dan memanggil semula fungsi yang ditentukan?-Soal Jawab Rangkaian PHP Cina

masyarakat

Belajar

Perpustakaan Alatan

Alat AI

Masa lapang

Melayu

python - Menggunakan Scrapy, bagaimana untuk meminta URL baharu dan memanggil semula fungsi yang ditentukan?

仅有的幸福

仅有的幸福 2017-06-28 09:25:02

0

1

942

Mengenai penggunaan Scrapy di bawah Python3

import re
import scrapy
from bs4 import BeautifulSoup
from scrapy.http import Request
from ..items import ZhibobaItem
import json
import lxml.html
import requests
import json


class Myspider(scrapy.Spider):
    name = 'zhiboba'
    allowed_domains = ['zhibo8.cc']
    json_url = 'https://bifen4pc.qiumibao.com/json/list.htm?85591'
    bash_url = 'https://www.zhibo8.cc/'

    def start_requests(self):
        yield Request(self.bash_url, self.parse_index)

    def parse_index(self, response):
        print("enter the parse_index")
        print(self.bash_url)
        ps = BeautifulSoup(response.text, 'lxml').find_all(label=re.compile("足球"))
        item = ZhibobaItem()
        for single_p in ps:
            item['label'] = single_p.get('label')
            item['sdate'] = single_p.get('data-time')
            item['linkurl'] = self.bash_url + single_p.find('a')['href']
            home_team = single_p.get_text().split()[2]
            item['home_team'] = home_team
            visit_team = single_p.get_text().split()[4]
            item['visit_team'] = visit_team
            print("quit the parse_index")
            print(self.json_url)
            yield Request(self.json_url, callback=self.get_score, meta={'home_team': home_team,
                                                                        'visit_team': visit_team
                                                                        })
    def get_score(self, response):
        print("enter the get_score")
        json_url = self.json_url
        wbdata = response.get(json_url).text
        data = json.loads(wbdata)
        news = data['list']
        print(wbdata)
        print("quit the get_score")

Apabila saya melaksanakan kod di atas, saya tidak berjaya memanggil json_url dan fungsi respons yang sepadan get_score. Apa yang salah?

仅有的幸福

仅有的幸福

membalas semua(1)

迷茫2017-06-28 09:27:02 Tingkat 1

Cuba ubah suaiallow_domains = [].

Suka +0

Tambah Balasan

Topik popular

Lagi>

Artikel popular

Tutorial Popular

Lagi>

Tutorial berkaitan

Cadangan popular

Kursus terkini

Muat turun terkini

Lagi>

kesan web

Kod sumber laman web

Bahan laman web

Templat hujung hadapan