python - 禁止自己的网站被爬虫爬去?
大家讲道理
大家讲道理 2017-04-17 17:33:35
0
13
1166

禁止自己的网站被爬虫爬去?有什么方法啊

大家讲道理
大家讲道理

光阴似箭催人老,日月如移越少年。

membalas semua(13)
黄舟

Jika anda mempertahankan diri daripada perangkak yang disasarkan, anda boleh mengenakan beberapa sekatan akses, seperti kekerapan akses, tambah kod pengesahan, dsb.

阿神
  1. Kandungan penting ditambah secara dinamik menggunakan js

  2. Hadkan http_referer

  3. Antara muka yang berbeza boleh mempertimbangkan templat yang berbeza, jenis yang satu set ungkapan biasa tidak dapat dipadankan dengan sempurna

  4. Tambah beberapa maklumat hak cipta secara rawak pada kandungan yang mungkin dirangkak

  5. Anda hanya boleh melawat selepas log masuk

  6. Rakam log akses

Itu sahaja yang saya boleh fikirkan, tetapi jika anda benar-benar mahu menangkapnya, ini akan menyukarkannya sedikit lagi

小葫芦

Untuk melumpuhkan rangkak enjin carian, anda boleh mengubah suai robots.txt
Agak sukar untuk melumpuhkan rangkak peribadi Anda hanya boleh meningkatkan kesukaran, seperti menambah kod pengesahan yang lebih kompleks, kekerapan akses, gaya/data biasa perubahan format, dsb.

Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan