ThinkPHP6记录蜘蛛爬取日志的方法-ThinkPHP-PHP中文网

ThinkPHP6记录蜘蛛爬取日志的方法

藏色散人

发布： 2021-12-17 11:33:23

转载

2553 人浏览过

下面thinkphp框架教程栏目将给大家介绍ThinkPHP 6是怎么记录百度等蜘蛛爬取日志，希望对需要的朋友有所帮助！

thinkphp6记录百度蜘蛛日志：

在控制器的父类如IndexBase中写入以下代码，所有前端控制器继承这个控制器

  public function initialize()
    {
        parent::initialize(); // TODO: Change the autogenerated stub
        if ($this->Config[&#39;web_status&#39;] == 0) {  // 判断是否关闭网站
            die(&#39;网站已经关闭&#39;);
        }
        $this->baiduLog();
    }
    protected function baiduLog()
    {
        $useragent = strtolower($_SERVER[&#39;HTTP_USER_AGENT&#39;]);
        $url = $this->request->controller() . "/" . $this->request->action();
        $param = input("param.","","htmlspecialchars");
        $url = (string) url($url,$param);
        $ip = get_real_ip();
        $title = "";
        if (strpos($useragent, &#39;googlebot&#39;) !== false){
            $title =  &#39;Google&#39;;
        } elseif (strpos($useragent, &#39;baiduspider&#39;) !== false){
            $title =  &#39;Baidu&#39;;
        } elseif (strpos($useragent, &#39;msnbot&#39;) !== false){
            $title =  &#39;Bing&#39;;
        } elseif (strpos($useragent, &#39;slurp&#39;) !== false){
            $title =  &#39;Yahoo&#39;;
        } elseif (strpos($useragent, &#39;sosospider&#39;) !== false){
            $title =  &#39;Soso&#39;;
        } elseif (strpos($useragent, &#39;sogou spider&#39;) !== false){
            $title =  &#39;Sogou&#39;;
        } elseif (strpos($useragent, &#39;yodaobot&#39;) !== false){
            $title =  &#39;Yodao&#39;;
        } elseif (strpos($useragent, &#39;googlebot&#39;) !== false){
            $title =  &#39;Google&#39;;
        } elseif (strpos($useragent, &#39;baiduspider&#39;) !== false){
            $title =  &#39;Baidu&#39;;
        } else {
//            $title = $useragent; // 不怕数据大的话可以取消注释，记录所有访问日志
        }
        if (!empty($title)) {
            BaiduLog::create(["title"=>$title,"href"=>$url,"ip"=>$ip]);
        }
    }

登录后复制

以上就是thinkphp6记录百度蜘蛛爬行日志的方法，

get_real_ip()

是获取客户真实IP的自定义函数。