社区

学习

工具库

AI工具

休闲

简体中文

首页 > 后端开发 > php教程 > php 抓取蜘蛛爬虫痕迹的代码分享

php 抓取蜘蛛爬虫痕迹的代码分享

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

发布： 2016-07-25 08:57:30

原创

1173 人浏览过

本文介绍下，php实现抓取蜘蛛爬虫痕迹的一段代码，有需要的朋友参考下。

用php代码分析web日志中蜘蛛爬虫痕迹，代码如下：

<?php
//获取蜘蛛爬虫名或防采集
//by bbs.it-home.org
function isSpider(){
    $bots = array(
                    'Google'    => 'googlebot',
                    'Baidu'        => 'baiduspider',
                    'Yahoo'        => 'yahoo slurp',
                    'Soso'        => 'sosospider',
                    'Msn'        => 'msnbot',
                    'Altavista'    => 'scooter ',
                    'Sogou'        => 'sogou spider',
                    'Yodao'        => 'yodaobot'
            );
    $userAgent = strtolower($_SERVER['HTTP_USER_AGENT']);
    foreach ($bots as $k => $v){
        if (strstr($v,$userAgent)){
            return $k;
            break;
        }
    }
    return false;
} //by bbs.it-home.org

//获取哪种蜘蛛爬虫后保存蜘蛛痕迹。
//根据采集时HTTP_USER_AGENT是否为空来防止采集
//抓蜘蛛爬虫 --by bbs.it-home.org
$spi    = isSpider();
if($spi){
    $tlc_thispage    = addslashes($_SERVER['HTTP_USER_AGENT']);
    $file            = 'robot.txt';
    $time            = date('Y-m-d H:i:s',mktime());
    $handle            = fopen($file,'a+');
    $PR                = $_SERVER['REQUEST_URI'];
    fwrite($handle, "Time:{$time} ROBOT:{$spi} AGENT:{$tlc_thispage} URL:{$PR} \n\r");
    fclose($handle);
}
?>

登录后复制

相关标签：

php 抓取蜘蛛爬虫痕迹的代码分享

上一篇：php获取当前网址与页面内容的代码参考下一篇：php函数ob_start()控制浏览器cache的方法详解

本站声明

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

作者最新文章

什么是 NullPointerException，如何修复它？

2024-10-22 09:46:29
从新手到程序员：您的旅程从 C 基础知识开始

2024-10-13 13:53:41
使用PHP解锁网络开发：初学者指南

2024-10-12 12:15:51
揭秘 C：为新程序员提供一条清晰简单的道路

2024-10-11 22:47:31
释放您的编码潜力：绝对初学者的 C 编程

2024-10-11 19:36:51
释放你内心的程序员：C 绝对初学者

2024-10-11 15:50:41
使用 C 自动化您的生活：适合初学者的脚本和工具

2024-10-11 15:07:41
PHP 变得简单：Web 开发的第一步

2024-10-11 14:21:21
使用 Python 构建任何东西：释放创造力的初学者指南

2024-10-11 12:59:11
编码的关键：为初学者释放 Python 的力量

2024-10-11 12:17:31

最新问题

objective-c - presentViewController后,dismiss回来高度偏差

来自于 1970-01-01 08:00:00

0

0

0

把gitlab中的测试项目，添加到jenkins发生认证错误

来自于 1970-01-01 08:00:00

0

0

0

objective-c - 做post请求时，服务端可以检测到接收到两个非空的字段，但是返回了错误

来自于 1970-01-01 08:00:00

0

0

0

github中如何将本地分支与远程标签合并？

来自于 1970-01-01 08:00:00

0

0

0

objective-c - textfield输入字符串过滤

来自于 1970-01-01 08:00:00

0

0

0

相关专题

更多>

热门推荐

热门教程

更多>

相关教程

热门推荐

最新课程

最新ThinkPHP 5.1全球首发视频教程(60天成就PHP大牛线上培训班课)

1431455
php入门教程之一周学会PHP

4285338
JAVA 初级入门视频教程

2609836
小甲鱼零基础入门学习Python视频教程

513018
PHP 零基础入门教程

871602

最新下载

更多>

网站特效

网站源码

网站素材

前端模板