Heim > Backend-Entwicklung > PHP-Tutorial > 爬虫获取AJax数据问题

爬虫获取AJax数据问题

WBOY
Freigeben: 2016-07-06 13:52:21
Original
1760 Leute haben es durchsucht

想写一个爬取花瓣网图片的爬虫。遇到了Ajax获取数据的问题
爬虫获取AJax数据问题
图片中的请求的URL,Response的文本类型是json
可当我单独访问这个url的时候却是html
爬虫获取AJax数据问题

求教,怎么获取json数据

回复内容:

想写一个爬取花瓣网图片的爬虫。遇到了Ajax获取数据的问题
爬虫获取AJax数据问题
图片中的请求的URL,Response的文本类型是json
可当我单独访问这个url的时候却是html
爬虫获取AJax数据问题

求教,怎么获取json数据

这个是用header来控制的
爬虫获取AJax数据问题

你把对应的请求头加上就好了。附上我的代码

<code>#coding=utf-8

import requests as RQ

hburl = "http://huaban.com/boards/28195582/?ipva9fpx&max=759391397&limit=20&wfl=1"
heads = {
'Host':"huaban.com",
'Referer':"{http://huaban.com/boards/28195582/",
'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.84 Safari/537.36",
'X-Request':"JSON",
'X-Requested-With':"XMLHttpRequest"
}


print RQ.get(hburl, headers=heads).content</code>
Nach dem Login kopieren

Rerferer是一个常见的用来防止网页被本站之外获取的Header,做爬虫时一定要确保Referer的设置

Verwandte Etiketten:
Quelle:php.cn
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage