這次帶給大家php記錄搜尋索引擎爬行過程方法詳解,php記錄搜尋引擎爬行過程的注意事項有哪些,下面就是實戰案例,一起來看一下。
下面是完整程式碼:
//记录搜索引擎爬行记录 $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url = $_SERVER['HTTP_REFERER']; $file = WEB_PATH.'robotslogs.txt'; $date = date('Y-m-d H:i:s'); $data = fopen($file,'a'); fwrite($data,"Time:$date robot:$searchbot URL:$tlc_thispage/r/n"); fclose($data); }
WEB_PATH為index.PHP下define的根目錄路徑,意思是說robotslogs.txt檔案是放在根目錄下的。
透過get_naps_bot()
取得蜘蛛爬行記錄,然後透過addslashes處理一下,將資料儲存在變數$tlc_thispage中。
fopen開啟robotslogs.txt文件,將資料透過函數fwrite寫入,在透過函數fclose關閉就可以了。
因為我覺得沒必要,所以把自己網站上的程式碼刪除了,所以也沒效果範例了。
PS:php取得各搜尋蜘蛛爬行記錄的程式碼
#支援以下的搜尋引擎:Baidu,Google,Bing,Yahoo,Soso ,Sogou,Yodao爬行網站的記錄!
程式碼:
<?php /** * 获取搜索引擎爬行记录 * edit by www.jb51.net */ function get_naps_bot() { $useragent = strtolower($_SERVER['HTTP_USER_AGENT']); if (strpos($useragent, 'googlebot') !== false){ return 'Google'; } if (strpos($useragent, 'baiduspider') !== false){ return 'Baidu'; } if (strpos($useragent, 'msnbot') !== false){ return 'Bing'; } if (strpos($useragent, 'slurp') !== false){ return 'Yahoo'; } if (strpos($useragent, 'sosospider') !== false){ return 'Soso'; } if (strpos($useragent, 'sogou spider') !== false){ return 'Sogou'; } if (strpos($useragent, 'yodaobot') !== false){ return 'Yodao'; } return false; } function nowtime(){ $date=date("Y-m-d.G:i:s"); return $date; } $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url=$_SERVER['HTTP_REFERER']; $file="www.jb51.net.txt"; $time=nowtime(); $data=fopen($file,"a"); fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n"); fclose($data); } ?>
我相信看了本文案例你已經掌握了方法,更多精彩請關注php中文網其它相關文章!
推薦閱讀:
以上是php記錄搜尋引擎爬行過程方法詳解的詳細內容。更多資訊請關注PHP中文網其他相關文章!