정적 페이지의 스파이더 크롤링 기록에 대해 PHP로 작성된 코드
풀어 주다: 2016-07-25 09:02:54
-
-
$useragent = addslashes(strtolower($_SERVER['HTTP_USER_AGENT'])); - if (strpos($useragent, 'googlebot')!== false){$bot = 'Google';}
- elseif (strpos($useragent,'mediapartners-google') !== false){$bot = 'Google Adsense';}
- elseif (strpos($useragent,'baiduspider') !== false){$bot = 'Baidu';}
- elseif (strpos($useragent,'sogou spider') !== false){$bot = 'Sogou';}
- elseif (strpos($useragent,'sogou web') !== false){$bot = 'Sogou web';}
- elseif (strpos($useragent,'sosospider') !== false){$bot = 'SOSO';}
- elseif (strpos($useragent,'yahoo') !== false){$bot = 'Yahoo';}
- elseif (strpos($useragent,'msn') !== false){$bot = 'MSN';}
- elseif (strpos($useragent,'msnbot') !== false){$bot = 'msnbot';}
- elseif (strpos($useragent,'sohu') !== false){$bot = 'Sohu';}
- elseif (strpos($useragent,'yodaoBot') !== false){$bot = 'Yodao';}
- elseif (strpos($useragent,'twiceler') !== false){$bot = 'Twiceler';}
- elseif (strpos($useragent,'ia_archiver') !== false){$bot = 'Alexa_';}
- elseif (strpos($useragent,'iaarchiver') !== false){$bot = 'Alexa';}
- elseif (strpos($useragent,'slurp') !== false){$bot = '雅虎';}
- elseif (strpos($useragent,'bot') !== false){$bot = '其它蜘蛛';}
- if(isset($bot)){
- $fp = @fopen('bot.txt','a');
- fwrite($fp,date('Y-m-d H:i:s')."t".$_SERVER["REMOTE_ADDR"]."t".$bot."t".'http://'.$_SERVER['SERVER_NAME'].$_SERVER["HTTP_X_REWRITE_URL"]."rn");
- fclose($fp);
- }
- $file=".".$_SERVER[HTTP_X_REWRITE_URL];
- $f_head=substr($file,-5);
- if($f_head==".html")
- {
- if(file_exists($file))
- {
- echo file_get_contents($file);
- }else
- {
-
- header('HTTP/1.1 404 Not Found');
- header("status: 404 Not Found");
echo "该页面无法找到";
- }
- }
- else
- {
- header('HTTP/1.1 404 Not Found');
- header("status: 404 Not Found");
- echo "该页面无法找到";
- }
- ?>
-
复制代码
伪静态文件内容:
-
-
[ISAPI_Rewrite]
# 3600 = 1 hour
- CacheClockRate 3600
-
- RepeatLimit 32
-
- # Protect httpd.ini and httpd.parse.errors files
- # from accessing through HTTP
- RewriteRule /index.html /index.php
- RewriteRule ^/article/(.*) /bot.php [L]
- RewriteRule ^/list/(.*) /bot.php [L]
-
复制代码
|
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
-
2024-10-22 09:46:29
-
2024-10-13 13:53:41
-
2024-10-12 12:15:51
-
2024-10-11 22:47:31
-
2024-10-11 19:36:51
-
2024-10-11 15:50:41
-
2024-10-11 15:07:41
-
2024-10-11 14:21:21
-
2024-10-11 12:59:11
-
2024-10-11 12:17:31