84669 人学习
152542 人学习
20005 人学习
5487 人学习
7821 人学习
359900 人学习
3350 人学习
180660 人学习
48569 人学习
18603 人学习
40936 人学习
1549 人学习
1183 人学习
32909 人学习
PHP Apache 如何实现图片高程度防采集
图片网站,内容页主体内容就只有一张图片。不用考虑搜索引擎优化。
有什么方法能高程度防采集呢?第一次写程序有很多不懂,希望各位前辈指教。
学习是最好的投资!
1、不想让正规的网络蜘蛛爬的话可以写个 robots.txt,可以参考百度 https://www.baidu.com/robots.txt
robots.txt
2、其他就是PHP验证呗
if(author()){ //验证 COOKIE/SESSION (不验证登陆的话,爬虫还是可以记录上一页的 COOKIE) //验证 USERAGENT (可以造假) //验证 REFERER (可以造假,而且些人会关掉 REFERER) //甚至验证 GET 的参数(参数可以与时间有关按一定规则生成的随机数,但是这样缓存就失效了) header("Content-type: image/jpg"); readfile("test.jpg"); }
1、不想让正规的网络蜘蛛爬的话可以写个
robots.txt
,可以参考百度 https://www.baidu.com/robots.txt2、其他就是PHP验证呗