Mengesan Bot Enjin Carian dengan PHP
Dalam pembangunan web, anda mungkin perlu mengenal pasti sumber trafik ke tapak web anda. Satu tugas biasa ialah mengesan bot enjin carian, juga dikenali sebagai perangkak atau labah-labah.
Penyelesaian
Untuk mengesan bot enjin carian menggunakan PHP, anda boleh menganalisis ejen pengguna HTTP rentetan yang dihantar oleh penyemak imbas. Berikut ialah pendekatan yang biasa digunakan:
function _bot_detected() { return (isset($_SERVER['HTTP_USER_AGENT']) && preg_match('/bot|crawl|slurp|spider|mediapartners/i', $_SERVER['HTTP_USER_AGENT'])); }
Kod ini menyemak sama ada rentetan ejen pengguna HTTP (cth., "Googlebot") mengandungi kata kunci khusus yang biasanya dikaitkan dengan bot enjin carian. Ia kembali benar jika bot dikesan, sebaliknya palsu.
Kemas Kini Terkini
Perhatikan bahawa rentetan ejen pengguna untuk bot Google telah berubah baru-baru ini. Mulai 16 Jun 2017, ia termasuk istilah "rakan kongsi media." Ini telah dimasukkan ke dalam ungkapan biasa yang digunakan dalam kod di atas untuk memastikan pengesanan yang tepat.
Atas ialah kandungan terperinci Bagaimana Saya Boleh Mengesan Bot Enjin Carian Menggunakan PHP?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!