84669 personnes étudient
152542 personnes étudient
20005 personnes étudient
5487 personnes étudient
7821 personnes étudient
359900 personnes étudient
3350 personnes étudient
180660 personnes étudient
48569 personnes étudient
18603 personnes étudient
40936 personnes étudient
1549 personnes étudient
1183 personnes étudient
32909 personnes étudient
PHP Apache 如何实现图片高程度防采集
图片网站,内容页主体内容就只有一张图片。不用考虑搜索引擎优化。
有什么方法能高程度防采集呢?第一次写程序有很多不懂,希望各位前辈指教。
学习是最好的投资!
1、不想让正规的网络蜘蛛爬的话可以写个 robots.txt,可以参考百度 https://www.baidu.com/robots.txt
robots.txt
2、其他就是PHP验证呗
if(author()){ //验证 COOKIE/SESSION (不验证登陆的话,爬虫还是可以记录上一页的 COOKIE) //验证 USERAGENT (可以造假) //验证 REFERER (可以造假,而且些人会关掉 REFERER) //甚至验证 GET 的参数(参数可以与时间有关按一定规则生成的随机数,但是这样缓存就失效了) header("Content-type: image/jpg"); readfile("test.jpg"); }
1、不想让正规的网络蜘蛛爬的话可以写个
robots.txt
,可以参考百度 https://www.baidu.com/robots.txt2、其他就是PHP验证呗