利用python的scrapy框架中的css选择器获取不到元素内容
高洛峰
高洛峰 2017-04-18 10:12:41
0
2
784

利用python中的scrapy框架的css选择器对具体标签内容进行获取,但是获取不到内容。
当前网页源码(是js渲染之前的代码):

css选择器代码:urllist = response.css('ul.nav li a::attr(href)')[0::3].extract()
运行结果是:
urllist===================[]
urllist长度============ 0
css选择器内的代码应该是没有错误的,为什么获取不到内容?
由于怀疑是css选择器出现了问题,因此替换xpath选择器,
xpath选择器代码:urllist=response.xpath('//ul[@class ="nav"]/li/a/@href').extract()
但是运行结果和css选择器相同。内容仍为空,长度为0

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

全部回覆(2)
洪涛

或許你的問題不是出在css選擇器程式碼上,檢查下response內容是否與網頁上看到的內容一致

左手右手慢动作

你試試在命令列裡面使用scrapy shell 加目標url 然後可以得到一個response對象,先看下這個response對像是否是正常的,可以先看下response.body,看下是不是你想要爬取的網頁的源碼
然後用這個response物件去調試你的css選擇器的程式碼

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板