使用 PHP 偵測搜尋引擎機器人
在 Web 開發中,通常可能需要辨識網站的流量來源。一項常見任務是檢測搜尋引擎機器人,也稱為爬蟲或蜘蛛。
解決方案
要使用 PHP 偵測搜尋引擎機器人,您可以分析 HTTP 使用者代理瀏覽器傳送的字串。這是一種常用的方法:
function _bot_detected() { return (isset($_SERVER['HTTP_USER_AGENT']) && preg_match('/bot|crawl|slurp|spider|mediapartners/i', $_SERVER['HTTP_USER_AGENT'])); }
此程式碼檢查 HTTP 使用者代理字串(例如「Googlebot」)是否包含通常與搜尋引擎機器人關聯的特定關鍵字。如果偵測到機器人,則傳回 true,否則傳回 false。
最近更新
請注意,Google 機器人的用戶代理字串最近已更改。自 2017 年 6 月 16 日起,它包含術語「媒體合作夥伴」。這已合併到上面程式碼中使用的正規表示式中,以確保準確檢測。
以上是如何使用 PHP 偵測搜尋引擎機器人?的詳細內容。更多資訊請關注PHP中文網其他相關文章!