使用 PHP 检测搜索引擎机器人
在 Web 开发中,通常可能需要识别网站的流量来源。一项常见任务是检测搜索引擎机器人,也称为爬虫或蜘蛛。
解决方案
要使用 PHP 检测搜索引擎机器人,您可以分析 HTTP 用户代理浏览器发送的字符串。这是一种常用的方法:
function _bot_detected() { return (isset($_SERVER['HTTP_USER_AGENT']) && preg_match('/bot|crawl|slurp|spider|mediapartners/i', $_SERVER['HTTP_USER_AGENT'])); }
此代码检查 HTTP 用户代理字符串(例如“Googlebot”)是否包含通常与搜索引擎机器人关联的特定关键字。如果检测到机器人,则返回 true,否则返回 false。
最近更新
请注意,Google 机器人的用户代理字符串最近已更改。自 2017 年 6 月 16 日起,它包含术语“媒体合作伙伴”。这已合并到上面代码中使用的正则表达式中,以确保准确检测。
以上是如何使用 PHP 检测搜索引擎机器人?的详细内容。更多信息请关注PHP中文网其他相关文章!