Dieses Mal werde ich Ihnen den Crawling-Prozess der PHP-DatensatzsucheIndex ausführlich erläutern. Welche Vorsichtsmaßnahmen sind für den Crawling-Prozess der PHP-Datensatzsuche zu beachten? Werfen wir einen Blick darauf.
Das Folgende ist der vollständige Code:
//记录搜索引擎爬行记录 $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url = $_SERVER['HTTP_REFERER']; $file = WEB_PATH.'robotslogs.txt'; $date = date('Y-m-d H:i:s'); $data = fopen($file,'a'); fwrite($data,"Time:$date robot:$searchbot URL:$tlc_thispage/r/n"); fclose($data); }
WEB_PATH ist der Stammverzeichnispfad der Definition unter index.PHP, was bedeutet, dass die Datei robotslogs.txt im Stammverzeichnis abgelegt wird.
Rufen Sie den Spider-Crawling-Datensatz über get_naps_bot()
ab, verarbeiten Sie ihn dann über Addslashes und speichern Sie die Daten in der -Variable $tlc_thispage.
fopen öffnet die Datei robotslogs.txt, schreibt die Daten über die Funktion fwrite und schließt sie über die Funktion fclose.
Da ich es für unnötig hielt, habe ich den Code auf meiner Website gelöscht, sodass es keine Beispiele für den Effekt gibt.
PS: PHP-Code zum Abrufen der Crawling-Datensätze jeder Suchspinne
Unterstützt die folgenden Suchmaschinen: Baidu, Google, Bing, Yahoo , Soso, Sogou, Yodao Crawlen von Website-Datensätzen!
Code:
<?php /** * 获取搜索引擎爬行记录 * edit by www.jb51.net */ function get_naps_bot() { $useragent = strtolower($_SERVER['HTTP_USER_AGENT']); if (strpos($useragent, 'googlebot') !== false){ return 'Google'; } if (strpos($useragent, 'baiduspider') !== false){ return 'Baidu'; } if (strpos($useragent, 'msnbot') !== false){ return 'Bing'; } if (strpos($useragent, 'slurp') !== false){ return 'Yahoo'; } if (strpos($useragent, 'sosospider') !== false){ return 'Soso'; } if (strpos($useragent, 'sogou spider') !== false){ return 'Sogou'; } if (strpos($useragent, 'yodaobot') !== false){ return 'Yodao'; } return false; } function nowtime(){ $date=date("Y-m-d.G:i:s"); return $date; } $searchbot = get_naps_bot(); if ($searchbot) { $tlc_thispage = addslashes($_SERVER['HTTP_USER_AGENT']); $url=$_SERVER['HTTP_REFERER']; $file="www.jb51.net.txt"; $time=nowtime(); $data=fopen($file,"a"); fwrite($data,"Time:$time robot:$searchbot URL:$tlc_thispage\n"); fclose($data); } ?>
Ich glaube, dass Sie die Methode beherrschen, nachdem Sie den Fall in diesem Artikel gelesen haben, achten Sie bitte auf andere Verwandte Artikel auf der chinesischen PHP-Website!
Empfohlene Lektüre:
Welche Methoden gibt es für PHP, um lokale JSON-Dateien zu lesen?
Wozu dienen die Methoden? PHP zur Ausgabe von JSON-Objekten? Der Wert von
Das obige ist der detaillierte Inhalt vonDetaillierte Erläuterung der Methode zur Aufzeichnung des Suchmaschinen-Crawling-Prozesses in PHP. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!