python - 如何爬取百度指数的数据?
怪我咯
怪我咯 2017-04-17 13:48:16
0
7
1330

百度指数的查询地址:http://index.baidu.com
比如说我输入:世界杯。查询到的结果如下:

查询到的结果数字并不是文本的形式,不知道应该如何抓取?

希望各位大神指教!

怪我咯
怪我咯

走同样的路,发现不同的人生

全部回复(7)
迷茫

ajax的吧 看看ajax里的请求返回数据吧

迷茫

F12 ,妥妥的
找 http://index.baidu.com/Interface/Search/getAllIndex/?res=azsWJCcMfgQgYQUpI2wmSz0GawFcHjoMKyIkMG0eYFYDXUspVARdQi03DiU6elRIMR0sRT8IElZhDBgYI11ZBT4xSlxdehQZNkZ1P0skBQcrDERiInxSBhEwGgMIc10aWUdVIwxREhNfZxs4PjE7Ag9eMG0PZDEQczUlA153HSY5CmNDaDRDaXMIeRhIMi5rN1YQVwoyBCVGBUQXZGJxAhdKJBhVH0pwFTRncXYfD0AUWypJLz4nJUczFw8jRXxdHRMwCxdhAHF7Fx8CKQ%3D%3D&res2=iMdY1W1TGQHmpyG9tZta9KatZf2VFnf1sQab3vylcHnlz95IvL491.2RTSXE73&startdate=2014-05-28&enddate=2014-06-26

左手右手慢动作

大致步骤如下:

  1. 首先要前往这个页面登录,获取会话 cookie;
  2. 然后使用获取到的 cookie 访问指数查询的 URL(此处使用“google io”):http://index.baidu.com/?tpl=trend&word=google+io
  3. 根据获取到页面中的 Javascript,拼接相关 AJAX 请求 URL,使用获取到的 cookie 重新请求该 URL,返回的内容即是你要的东西。

可能需要用到的第三方库:

  • BeautifulSoup
  • scrapy
洪涛

百度加密了,很难抓取的。
在淘宝上看到了一家店。。。 http://t.cn/RhC1O6J

黄舟

我们提供百度指数的实时抓取服务,请访问我们的在线demo站点:http://www.datadriver.info/scrapdata/,
我们可以免费分享详细的破解过程和算法描述,但是不提供源代码。 您也可以qq我们,2011193471

大家讲道理

https://item.taobao.com/item.htm?id=42837426371

刘奇

http://www.jianshu.com/p/361c97b4428a 免费

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!