PHP は訪問者が検索エンジン クローラーであるかどうかを判断します。

WBOY
リリース: 2016-07-25 08:44:24
オリジナル
1048 人が閲覧しました

HTTP_USER_AGENT を使用して、それがスパイダーであるかどうかを判断できます。検索エンジンのスパイダーには独自の兆候があり、その一部を以下に示します。

    function is_crawler() {
  1. $userAgent = strto lower($_SERVER['HTTP_USER_AGENT']);
  2. $spiders = array(
  3. 'Googlebot', // Google クローラー
  4. 'Baiduspider', // Baidu クローラー
  5. 'Yahoo! Slurp', // Yahoo クローラー
  6. 'YodaoBot', // Youdao クローラー
  7. 'msnbot' // Bing クローラー
  8. // その他のクローラー キーワード
  9. );
  10. foreach ($spiders as $spider) {
  11. $spider = strto lower($spider);
  12. if (strpos($userAgent, $spider) !== false) {
  13. return true;
  14. }
  15. }
  16. return false;
  17. }
コードをコピー
以下の PHP コードにはさらにスパイダーのロゴが含まれています
    function isCrawler() {
  1. echo $agent= strto lower($_SERVER['HTTP_USER_AGENT']);
  2. if (!empty($agent)) {
  3. $ SpiderSite= array(
  4. "TencentTraveler",
  5. "Baiduspider+",
  6. "BaiduGame",
  7. "Googlebot",
  8. "msnbot",
  9. "Sosospider+",
  10. "Sogou Web Spider",
  11. "ia_archiver",
  12. "Yahoo! Slurp" 、
  13. "YoudaoBot"、
  14. "Yahoo Slurp"、
  15. "MSNBot"、
  16. "Java (スパムボットであることが多い)"、
  17. "BaiDuSpider"、
  18. "Voila"、
  19. "Yandex bot"、
  20. "BSpider"、
  21. " twiceler」、
  22. 「Sogou Spider」、
  23. 「Speedy Spider」、
  24. 「Google AdSense」、
  25. 「Heritrix」、
  26. 「Python-urllib」、
  27. 「Alexa (IA Archiver)」、
  28. 「Ask」、
  29. 「Exabot」 "、
  30. "Custo"、
  31. "OutfoxBot/YodaoBot"、
  32. "yacy"、
  33. "SurveyBot"、
  34. "legs"、
  35. "lwp-trivial"、
  36. "Nutch"、
  37. "StackRambler"、
  38. " archive (IA Archiver)",
  39. "Perl ツール",
  40. "MJ12bot",
  41. "Netcraft",
  42. "MSIECrawler",
  43. "WGet tools",
  44. "larbin",
  45. "Fish search",
  46. );
  47. foreach ($spiderSite as $val) {
  48. $str = strto lower($val);
  49. if (strpos($agent, $str) !== false) {
  50. return true;
  51. }
  52. }
  53. } else {
  54. return false ;
  55. }
  56. }
  57. if (isCrawler()){
  58. echo "こんにちは、スパイダー! ";
  59. }
  60. else{
  61. echo "あなたは蜘蛛の精霊ではありません! ";
  62. }
コードをコピー

php

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート