python - 請教如何爬取簡書某一時段發文。
黄舟
黄舟 2017-05-18 10:55:49
0
1
685

我想爬取簡書在某一時段的帖子,例如 2013 年 4 月 13 — 2013 年 5 月 13

想嘗試的想法如下:

  • 百度

    • 利用百度的 site 語法

    • #限定日期

    • #觀察大約有 70 個貼文

  • #Google

    • google 的 site 語法

    • #限定日期

    • #觀察大約有 120 個貼文

#實作:用 Python 直接要求搜尋的結果,然後把得到的網址重新導向一下得到真正的簡書網址,然後對真正的網址進行請求

問題

  1. 用這種方法得到的結果是否可靠?請問有更可靠的方法嗎?

  2. 用 Google 還是用百度呢?

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全部回覆(1)
过去多啦不再A梦

為了全面,你可以把主流的搜尋引擎介面都拿來用,不一定要限制在某個搜尋引擎介面上。我們有隊友搜尋某些話題就是這麼幹的,因為有的網站站內沒提供滿足需求的搜尋方式,這個時候也只有借助搜尋引擎了。不過透過搜尋引擎搜尋的方式資訊可能不全面,robots協議規定了不能搜尋的,搜尋引擎不會收錄

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板
關於我們 免責聲明 Sitemap
PHP中文網:公益線上PHP培訓,幫助PHP學習者快速成長!