Détection des robots des moteurs de recherche avec PHP
Dans le développement Web, il peut souvent être nécessaire d'identifier la source du trafic vers votre site Web. Une tâche courante consiste à détecter les robots des moteurs de recherche, également appelés robots d'exploration ou araignées.
Solution
Pour détecter les robots des moteurs de recherche à l'aide de PHP, vous pouvez analyser l'agent utilisateur HTTP. chaîne envoyée par le navigateur. Voici une approche couramment utilisée :
function _bot_detected() { return (isset($_SERVER['HTTP_USER_AGENT']) && preg_match('/bot|crawl|slurp|spider|mediapartners/i', $_SERVER['HTTP_USER_AGENT'])); }
Ce code vérifie si la chaîne de l'agent utilisateur HTTP (par exemple, "Googlebot") contient des mots-clés spécifiques couramment associés aux robots des moteurs de recherche. Il renvoie vrai si un bot est détecté, sinon faux.
Mise à jour récente
Notez que la chaîne de l'agent utilisateur pour les robots Google a récemment changé. Depuis le 16 juin 2017, il inclut le terme « partenaires médias ». Ceci a été incorporé à l'expression régulière utilisée dans le code ci-dessus pour garantir une détection précise.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!