PHP屏蔽蜘蛛访问代码及常用搜索引擎的HTTP_USER_AGENT_php技巧
PHP屏蔽蜘蛛访问代码代码:
常用搜索引擎名与 HTTP_USER_AGENT对应值
百度baiduspider
谷歌googlebot
搜狗sogou
腾讯SOSOsosospider
雅虎slurp
有道youdaobot
Bingbingbot
MSNmsnbot
Alexais_archiver
function is_crawler() { $userAgent = strtolower($_SERVER['HTTP_USER_AGENT']); $spiders = array( 'Googlebot', // Google 爬虫 'Baiduspider', // 百度爬虫 'Yahoo! Slurp', // 雅虎爬虫 'YodaoBot', // 有道爬虫 'msnbot' // Bing爬虫 // 更多爬虫关键字 ); foreach ($spiders as $spider) { $spider = strtolower($spider); if (strpos($userAgent, $spider) !== false) { return true; } } return false; }
下面的php代码附带了更多的蜘蛛标识
function isCrawler() { echo $agent= strtolower($_SERVER['HTTP_USER_AGENT']); if (!empty($agent)) { $spiderSite= array( "TencentTraveler", "Baiduspider+", "BaiduGame", "Googlebot", "msnbot", "Sosospider+", "Sogou web spider", "ia_archiver", "Yahoo! Slurp", "YoudaoBot", "Yahoo Slurp", "MSNBot", "Java (Often spam bot)", "BaiDuSpider", "Voila", "Yandex bot", "BSpider", "twiceler", "Sogou Spider", "Speedy Spider", "Google AdSense", "Heritrix", "Python-urllib", "Alexa (IA Archiver)", "Ask", "Exabot", "Custo", "OutfoxBot/YodaoBot", "yacy", "SurveyBot", "legs", "lwp-trivial", "Nutch", "StackRambler", "The web archive (IA Archiver)", "Perl tool", "MJ12bot", "Netcraft", "MSIECrawler", "WGet tools", "larbin", "Fish search", ); foreach($spiderSite as $val) { $str = strtolower($val); if (strpos($agent, $str) !== false) { return true; } } } else { return false; } } if (isCrawler()){ echo "你好蜘蛛精!"; } else{ echo "你不是蜘蛛精啊!"; }
使用PHP实现蜘蛛访问日志统计
$useragent = addslashes(strtolower($_SERVER['HTTP_USER_AGENT'])); if (strpos($useragent, 'googlebot')!== false){$bot = 'Google';} elseif (strpos($useragent,'mediapartners-google') !== false){$bot = 'Google Adsense';} elseif (strpos($useragent,'baiduspider') !== false){$bot = 'Baidu';} elseif (strpos($useragent,'sogou spider') !== false){$bot = 'Sogou';} elseif (strpos($useragent,'sogou web') !== false){$bot = 'Sogou web';} elseif (strpos($useragent,'sosospider') !== false){$bot = 'SOSO';} elseif (strpos($useragent,'360spider') !== false){$bot = '360Spider';} elseif (strpos($useragent,'yahoo') !== false){$bot = 'Yahoo';} elseif (strpos($useragent,'msn') !== false){$bot = 'MSN';} elseif (strpos($useragent,'msnbot') !== false){$bot = 'msnbot';} elseif (strpos($useragent,'sohu') !== false){$bot = 'Sohu';} elseif (strpos($useragent,'yodaoBot') !== false){$bot = 'Yodao';} elseif (strpos($useragent,'twiceler') !== false){$bot = 'Twiceler';} elseif (strpos($useragent,'ia_archiver') !== false){$bot = 'Alexa_';} elseif (strpos($useragent,'iaarchiver') !== false){$bot = 'Alexa';} elseif (strpos($useragent,'slurp') !== false){$bot = '雅虎';} elseif (strpos($useragent,'bot') !== false){$bot = '其它蜘蛛';} if(isset($bot)){ $fp = @fopen('bot.txt','a'); fwrite($fp,date('Y-m-d H:i:s')."\t".$_SERVER["REMOTE_ADDR"]."\t".$bot."\t".'http://'.$_SERVER['SERVER_NAME'].$_SERVER["REQUEST_URI"]."\r\n"); fclose($fp); }

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Baidu Cloud ialah perisian yang membolehkan pengguna menyimpan banyak fail Jadi apakah pintu masuk ke enjin carian Baidu Cloud Disk? Pengguna boleh memasukkan URL https://pan.baidu.com untuk memasuki Baidu Cloud Disk Perkongsian pintu masuk terbaru ke enjin carian Baidu Cloud Disk ini akan memberi anda pengenalan terperinci. . Pintu masuk enjin carian cakera awan Baidu 1. Laman web carian Qianfan: https://pan.qianfan.app Menyokong cakera rangkaian: carian agregat, Alibaba, Baidu, Quark, Lanzuo, Tianyi, kaedah paparan cakera rangkaian Xunlei: log masuk diperlukan, ikut syarikat Kelebihan mendapatkan kod pengaktifan: Cakera rangkaian adalah komprehensif, terdapat banyak sumber, dan antara muka adalah mudah. 2. Laman web Maolipansou: alipansou.c

Mudah untuk menukar enjin carian dalam Safari, Google Chrome atau penyemak imbas lain pada iPhone atau iPad anda. Tutorial ini akan menunjukkan kepada anda cara melakukannya pada empat pelayar web berbeza yang tersedia pada iPhone dan iPad. Cara Menukar Enjin Carian Safari pada iPhone atau iPad Safari ialah penyemak imbas web lalai pada iOS dan iPadOS, tetapi anda mungkin tidak menyukai enjin carian tersebut. Nasib baik, anda boleh menggunakan langkah ini untuk menukarnya: Pada iPhone atau iPad anda, lancarkan Tetapan daripada skrin Utama. Leret ke bawah dan ketik Safari daripada senarai. Dalam menu seterusnya,

Pembangunan Java: Bagaimana untuk melaksanakan enjin carian dan fungsi mendapatkan semula teks penuh, contoh kod khusus diperlukan Enjin carian dan mendapatkan semula teks penuh adalah fungsi penting dalam era Internet moden. Mereka bukan sahaja membantu pengguna mencari perkara yang mereka inginkan dengan cepat, mereka juga menyediakan pengalaman pengguna yang lebih baik untuk tapak web dan apl. Artikel ini akan memperkenalkan cara menggunakan Java untuk membangunkan enjin carian dan fungsi perolehan teks penuh, dan menyediakan beberapa contoh kod khusus. Carian teks penuh menggunakan perpustakaan Lucene Lucene ialah perpustakaan enjin carian teks penuh sumber terbuka, dibangunkan oleh ApacheSo

Pengoptimuman Prestasi Enjin Carian PHP: Cara Ajaib Algolia Dengan pembangunan Internet dan keperluan pengguna yang semakin meningkat untuk pengalaman carian, pengoptimuman prestasi enjin carian telah menjadi penting. Dalam dunia pembangunan PHP, Algolia ialah perkhidmatan enjin carian yang berkuasa dan mudah disepadukan. Artikel ini akan memperkenalkan kegunaan ajaib Algolia dan cara mengoptimumkan prestasi enjin carian PHP melalui Algolia. Pengenalan Algolia Algolia ialah pembekal perkhidmatan enjin carian berdasarkan model SaaS.

Sejak dilancarkan lewat tahun lepas, ChatGPT telah dilihat sebagai ancaman utama kepada cara tradisional mencari maklumat. Kerana ia adalah pelbagai, anda boleh menjawab soalan orang, menulis esei atau puisi, atau menulis kod program. Keupayaan AI perbualan untuk memberikan jawapan yang koheren dianggap sebagai ancaman kepada enjin carian Google, yang selama beberapa dekad telah menjadi platform penanda aras untuk orang ramai mencari maklumat di Internet. ChatGPT OpenAI boleh menyesuaikan jawapan kepada soalan khusus yang ditanya oleh pengguna, yang boleh menjimatkan masa melayari tapak web. Laporan New York Times yang diterbitkan pada bulan Disember mendedahkan bahawa kejayaan semalaman ChatGPT memaksa Google memanggilnya "Kod Merah" dan mula menangani ancaman yang ditimbulkan oleh chatbot kecerdasan buatan kepada perniagaan enjin cariannya. mengikut

Google Chrome sangat bagus. Terdapat ramai rakan yang menggunakannya. Ramai rakan ingin menggunakan enjin carian Google sendiri, tetapi tidak tahu cara menggunakannya. Cara menggunakan enjin carian Google dalam Google Chrome: 1. Buka Google Chrome dan klik Lagi di penjuru kanan sebelah atas untuk membuka tetapan. 2. Selepas memasukkan tetapan, klik "Enjin Carian" di sebelah kiri. 3. Semak sama ada enjin carian anda ialah "Google". 4. Jika tidak, anda boleh mengklik butang lungsur dan menukarnya kepada "Google".

Bagaimana untuk menukar enjin carian dalam Google Chrome? Google Chrome ialah penyemak imbas yang sangat popular di kalangan pengguna Ia bukan sahaja mempunyai perkhidmatan yang ringkas dan mudah digunakan, alatan praktikal dan fungsi tambahan yang lain, tetapi juga boleh memenuhi keperluan pengguna yang berbeza secara default kepada Google mahu Bagaimana saya perlu menyediakannya untuk menggantikannya? Jom saya kongsikan caranya di bawah. Kaedah penggantian 1. Klik untuk membuka Google Chrome. 2. Klik ikon tiga titik untuk membuka antara muka menu. 3. Klik pilihan Tetapan untuk memasuki antara muka tetapan penyemak imbas. 4. Cari modul enjin carian dalam antara muka tetapan. 5. Klik butang Urus Enjin Carian. 6. Anda boleh melihat butang tambah Klik butang tambah ini untuk menambah enjin carian. ,

Pembangunan PHP dan ManticoreSearch: Membina enjin carian yang cekap Enjin carian memainkan peranan yang sangat penting dalam aplikasi Internet moden. Untuk mencapai fungsi carian yang cekap dan tepat, kita perlu memilih enjin carian yang sesuai dan menggunakan alat pembangunan yang sesuai untuk pembangunan. Artikel ini akan memperkenalkan cara menggunakan PHP dan ManticoreSearch untuk membangunkan enjin carian yang cekap. ManticoreSearch ialah enjin carian sumber terbuka yang berkuasa berdasarkan SphinxS
