이 글에서는 주로 검색 엔진 크롤링 기록을 기록하는 PHP 구현 코드를 소개하고, 각 검색 스파이더의 크롤링 기록을 얻는 PHP 코드를 소개합니다. 도움이 필요한 친구들에게 도움이 되길 바랍니다.
다음은 전체 코드입니다.
//记录搜索引擎爬行记录 $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url = $_SERVER['HTTP_REFERER']; $file = WEB_PATH.'robotslogs.txt'; $date = date('Y-m-d H:i:s'); $data = fopen($file,'a'); fwrite($data,"Time:$date robot:$searchbot URL:$tlc_thispage/r/n"); fclose($data); }
WEB_PATH는 index.PHP 아래 정의의 루트 디렉터리 경로입니다. 이는 robotslogs.txt 파일이 루트 디렉터리에 위치한다는 의미입니다.
get_naps_bot()을 통해 스파이더 크롤링 기록을 가져온 다음 addlash를 통해 처리하고 $tlc_thispage 변수에 데이터를 저장합니다.
fopen은 robotslogs.txt 파일을 열고 fwrite 함수를 통해 데이터를 쓴 다음 fclose 함수를 통해 닫습니다.
필요없다고 생각해서 홈페이지의 코드를 삭제해서 효과예시가 없습니다.
PS: 각 검색 스파이더의 크롤링 기록을 얻기 위한 PHP 코드
다음 검색 엔진을 지원합니다: Baidu, Google, Bing, Yahoo, Soso, Sogou, Yodao 크롤링 웹 사이트 기록!
코드:
<?php /** * 获取搜索引擎爬行记录 * edit by www.jb51.net */ function get_naps_bot() { $useragent = strtolower($_SERVER['HTTP_USER_AGENT']); if (strpos($useragent, 'googlebot') !== false){ return 'Google'; } if (strpos($useragent, 'baiduspider') !== false){ return 'Baidu'; } if (strpos($useragent, 'msnbot') !== false){ return 'Bing'; } if (strpos($useragent, 'slurp') !== false){ return 'Yahoo'; } if (strpos($useragent, 'sosospider') !== false){ return 'Soso'; } if (strpos($useragent, 'sogou spider') !== false){ return 'Sogou'; } if (strpos($useragent, 'yodaobot') !== false){ return 'Yodao'; } return false; } function nowtime(){ $date=date("Y-m-d.G:i:s"); return $date; } $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url=$_SERVER['HTTP_REFERER']; $file="www.jb51.net.txt"; $time=nowtime(); $data=fopen($file,"a"); fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n"); fclose($data); } ?>
관련 권장 사항:
jQuery Jsonp 도메인 간 시뮬레이션 검색 엔진 예시 공유
JavaScript에서 검색 엔진의 탐색 웹 검색창을 전환하는 방법에 대한 예시 코드 공유
위 내용은 PHP는 검색 엔진 크롤링 코드 공유를 구현합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!