python - 禁止自己的网站被爬虫爬去?
大家讲道理
大家讲道理 2017-04-17 17:33:35
0
13
1168

禁止自己的网站被爬虫爬去?有什么方法啊

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

全部回覆(13)
黄舟

如果是防禦針對性的爬蟲,可以做一些存取限制,例如存取頻率,加上驗證碼等等。

阿神
  1. 重要內容使用js動態加入

  2. 限制http_referer

  3. 不同的介面可以考慮不同的模板,一套正規不能完美搭配的那種

  4. 在可能會爬的內容裡隨機加上一些版權資訊

  5. .登陸之後才可以進行訪問

  6. 記錄訪問日誌

能想到的就這些,不過如果真的想抓,這些也就只是增加一點抓取的難度而已

小葫芦

禁止搜尋引擎爬取可以修改robots.txt
禁止個人爬取的話難度有點大,只能增加難度,例如增加比較複雜的驗證碼、存取頻率、定時換樣式/資料格式之類的

熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板