python - Scrapy如何得到原始的start_url
代言
代言 2017-06-28 09:23:41
0
1
1044

Scrapy爬蟲時,由於重定向或是其他原因,會導致原始的start_url改變,怎樣才能得到原始的start_url##? #

def start_requests(self):
    start_url = 'your_scrapy_start_url'
    yield Request(start_url, self.parse)
    
def parse(self, response):
    item = YourItem()
    item['start_url'] = 原始请求的start_url
    yield item
代言
代言

全部回覆(1)
为情所困

參考文章:Scrapy爬蟲常見問題摘要

利用Request中的meta參數傳遞訊息

def start_requests(self):
    start_url = 'your_scrapy_start_url'
    yield Request(start_url, self.parse, meta={'start_url':start_url})
    
def parse(self, response):
    item = YourItem()
    item['start_url'] = response.meta['start_url']
    yield item
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板