python - 如何爬取百度指数的数据?
怪我咯
怪我咯 2017-04-17 13:48:16
0
7
1331

百度指数的查询地址:http://index.baidu.com
比如说我输入:世界杯。查询到的结果如下:

查询到的结果数字并不是文本的形式,不知道应该如何抓取?

希望各位大神指教!

怪我咯
怪我咯

走同样的路,发现不同的人生

全部回覆(7)
迷茫

ajax的吧 看看ajax裡的請求回傳資料吧

迷茫

F12 ,妥妥的
找 http://index.baidu.com/Interface/Search/getAllIndex/?res=azsWJCcMfgQgYQUpI2wmSz0GawFcHjoMKyIkMG0eYFYDXUspVARdQi03DiU6elRIMR0sRTIkMG0eYFYDXUspVARdQi03DiU6elRIMR0sRT18IElxMRTIsp EwGgMIc10aWUdVIwxREhNfZxs4PjE7Ag9eMG0PZDEQczUlA153HSY5CmNDaDRDaXMIeRhIMi5rN1YQVwoyBCVGQXZGJxAhdKJBhVH0pwJBVHFFyFFyFyFyFyFxFxY4x4x454x4x4500c CKQ%3D%3D&res2=iMdY1W1TGQHmpyG9tZta9KatZf2VFnf1sQab3vylcHnlz95IvL491.2RTSXE73&startdate=2014-05-28&enddate=2014-06-26

左手右手慢动作

大致步驟如下:

  1. 首先要前往這個頁面登錄,取得會話 cookie;
  2. 然後使用取得到的 cookie 存取指數查詢的 URL(此處使用「google io」):http://index.baidu.com/?tpl=trend&word=google+io
  3. 根據取得到頁面中的 Javascript,拼接相關 AJAX 請求 URL,使用取得到的 cookie 重新要求該 URL,傳回的內容就是你要的東西。

可能需要用到的第三方函式庫:

  • BeautifulSoup
  • scrapy
洪涛

百度加密了,很難抓取的。
在淘寶上看到了一家店。 。 。 http://t.cn/RhC1O6J

黄舟

我們提供百度指數的即時抓取服務,請造訪我們的線上demo網站:http://www.datadriver.info/scrapdata/,
我們可以免費分享詳細的破解過程和演算法描述,但不提供原始碼。 您也可以qq我們,2011193471

大家讲道理

https://item.taobao.com/item.htm?id=42837426371

刘奇

http://www.jianshu.com/p/361c97b4428a 免費

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!