PHP を使用した検索エンジン ボットの検出
Web 開発では、Web サイトへのトラフィックのソースを特定することが必要になる場合があります。一般的なタスクの 1 つは、クローラーまたはスパイダーとも呼ばれる検索エンジン ボットの検出です。
解決策
PHP を使用して検索エンジン ボットを検出するには、HTTP ユーザー エージェントを分析できます。ブラウザから送信される文字列。一般的に使用されるアプローチは次のとおりです。
function _bot_detected() { return (isset($_SERVER['HTTP_USER_AGENT']) && preg_match('/bot|crawl|slurp|spider|mediapartners/i', $_SERVER['HTTP_USER_AGENT'])); }
このコードは、HTTP ユーザー エージェント文字列 (例: "Googlebot") に、検索エンジン ボットに一般的に関連付けられている特定のキーワードが含まれているかどうかを確認します。ボットが検出された場合は true を返し、それ以外の場合は false を返します。
最近の更新
Google ボットのユーザー エージェント文字列が最近変更されたことに注意してください。 2017 年 6 月 16 日の時点では、「メディアパートナー」という用語が含まれています。これは、正確な検出を保証するために、上記のコードで使用されている正規表現に組み込まれています。
以上がPHP を使用して検索エンジン ボットを検出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。