PHP屏蔽蜘蛛访问代码及常用搜索引擎的HTTP_USER_AGENT_php技巧
PHP屏蔽蜘蛛访问代码代码:
常用搜索引擎名与 HTTP_USER_AGENT对应值
百度baiduspider
谷歌googlebot
搜狗sogou
腾讯SOSOsosospider
雅虎slurp
有道youdaobot
Bingbingbot
MSNmsnbot
Alexais_archiver
function is_crawler() { $userAgent = strtolower($_SERVER['HTTP_USER_AGENT']); $spiders = array( 'Googlebot', // Google 爬虫 'Baiduspider', // 百度爬虫 'Yahoo! Slurp', // 雅虎爬虫 'YodaoBot', // 有道爬虫 'msnbot' // Bing爬虫 // 更多爬虫关键字 ); foreach ($spiders as $spider) { $spider = strtolower($spider); if (strpos($userAgent, $spider) !== false) { return true; } } return false; }
下面的php代码附带了更多的蜘蛛标识
function isCrawler() { echo $agent= strtolower($_SERVER['HTTP_USER_AGENT']); if (!empty($agent)) { $spiderSite= array( "TencentTraveler", "Baiduspider+", "BaiduGame", "Googlebot", "msnbot", "Sosospider+", "Sogou web spider", "ia_archiver", "Yahoo! Slurp", "YoudaoBot", "Yahoo Slurp", "MSNBot", "Java (Often spam bot)", "BaiDuSpider", "Voila", "Yandex bot", "BSpider", "twiceler", "Sogou Spider", "Speedy Spider", "Google AdSense", "Heritrix", "Python-urllib", "Alexa (IA Archiver)", "Ask", "Exabot", "Custo", "OutfoxBot/YodaoBot", "yacy", "SurveyBot", "legs", "lwp-trivial", "Nutch", "StackRambler", "The web archive (IA Archiver)", "Perl tool", "MJ12bot", "Netcraft", "MSIECrawler", "WGet tools", "larbin", "Fish search", ); foreach($spiderSite as $val) { $str = strtolower($val); if (strpos($agent, $str) !== false) { return true; } } } else { return false; } } if (isCrawler()){ echo "你好蜘蛛精!"; } else{ echo "你不是蜘蛛精啊!"; }
使用PHP实现蜘蛛访问日志统计
$useragent = addslashes(strtolower($_SERVER['HTTP_USER_AGENT'])); if (strpos($useragent, 'googlebot')!== false){$bot = 'Google';} elseif (strpos($useragent,'mediapartners-google') !== false){$bot = 'Google Adsense';} elseif (strpos($useragent,'baiduspider') !== false){$bot = 'Baidu';} elseif (strpos($useragent,'sogou spider') !== false){$bot = 'Sogou';} elseif (strpos($useragent,'sogou web') !== false){$bot = 'Sogou web';} elseif (strpos($useragent,'sosospider') !== false){$bot = 'SOSO';} elseif (strpos($useragent,'360spider') !== false){$bot = '360Spider';} elseif (strpos($useragent,'yahoo') !== false){$bot = 'Yahoo';} elseif (strpos($useragent,'msn') !== false){$bot = 'MSN';} elseif (strpos($useragent,'msnbot') !== false){$bot = 'msnbot';} elseif (strpos($useragent,'sohu') !== false){$bot = 'Sohu';} elseif (strpos($useragent,'yodaoBot') !== false){$bot = 'Yodao';} elseif (strpos($useragent,'twiceler') !== false){$bot = 'Twiceler';} elseif (strpos($useragent,'ia_archiver') !== false){$bot = 'Alexa_';} elseif (strpos($useragent,'iaarchiver') !== false){$bot = 'Alexa';} elseif (strpos($useragent,'slurp') !== false){$bot = '雅虎';} elseif (strpos($useragent,'bot') !== false){$bot = '其它蜘蛛';} if(isset($bot)){ $fp = @fopen('bot.txt','a'); fwrite($fp,date('Y-m-d H:i:s')."\t".$_SERVER["REMOTE_ADDR"]."\t".$bot."\t".'http://'.$_SERVER['SERVER_NAME'].$_SERVER["REQUEST_URI"]."\r\n"); fclose($fp); }

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











Baidu Cloud は多くのファイルを保存できるソフトウェアですが、Baidu Cloud Disk 検索エンジンへの入り口は何でしょうか?ユーザーは URL https://pan.baidu.com を入力して Baidu Cloud Disk にアクセスできます。Baidu Cloud Disk 検索エンジンへの最新の入り口を共有することで、詳細な紹介が得られます。以下は詳細な紹介です。見てください。 。 Baidu クラウド ディスク検索エンジンの入り口 1. Qianfan 検索 Web サイト: https://pan.qianfan.app ネットワーク ディスクをサポート: 集約検索、Alibaba、Baidu、Quark、Lanzuo、Tianyi、Xunlei ネットワーク ディスクの表示方法: ログインが必要、会社に従ってくださいアクティベーション コードを取得する利点: ネットワーク ディスクは包括的で、多くのリソースがあり、インターフェイスがシンプルです。 2. マオリパンソウのウェブサイト: alipansou.c

iPhone や iPad の Safari、Google Chrome、またはその他のブラウザで検索エンジンを変更するのは簡単です。このチュートリアルでは、iPhone および iPad で利用できる 4 つの異なる Web ブラウザーでこれを行う方法を説明します。 iPhone または iPad で Safari 検索エンジンを変更する方法 Safari は iOS および iPadOS のデフォルトの Web ブラウザですが、この検索エンジンが気に入らないかもしれません。幸いなことに、次の手順を使用して変更できます。 iPhone または iPad で、ホーム画面から [設定] を起動します。下にスワイプして、リストから「Safari」をタップします。次のメニューでは、

Java 開発: 検索エンジンと全文検索機能の実装方法、具体的なコード例が必要です 検索エンジンと全文検索は、現代のインターネット時代において重要な機能です。これらは、ユーザーが必要なものをすぐに見つけられるようにするだけでなく、Web サイトやアプリのユーザー エクスペリエンスを向上させます。この記事では、Java を使用して検索エンジンと全文検索機能を開発する方法と、いくつかの具体的なコード例を紹介します。 Lucene ライブラリを使用した全文検索 Lucene は、ApacheSo によって開発されたオープンソースの全文検索エンジン ライブラリです。

PHP 検索エンジンのパフォーマンスの最適化: アルゴリアの魔法の方法 インターネットの発展と検索エクスペリエンスに対するユーザーの要件の増大に伴い、検索エンジンのパフォーマンスの最適化が重要になってきています。 PHP 開発の世界では、Algolia は強力で統合が簡単な検索エンジン サービスです。この記事では、Algolia の魔法のような使い方と、Algolia を通じて PHP 検索エンジンのパフォーマンスを最適化する方法を紹介します。 Algolia の紹介 Algolia は、SaaS モデルに基づく検索エンジン サービス プロバイダーです。

昨年末の発表以来、ChatGPT は従来の情報検索方法に対する大きな脅威とみなされてきました。多様性があるため、人々の質問に答えたり、エッセイや詩を書いたり、プログラム コードを書いたりすることもできます。一貫した回答を提供する会話型 AI の能力は、人々がインターネット上で情報を検索するためのベンチマーク プラットフォームとして数十年にわたり使用されてきた Google の検索エンジンに対する脅威と考えられています。 OpenAI の ChatGPT は、ユーザーからの特定の質問に対する回答を調整できるため、Web サイトの閲覧時間を節約できます。 12月にニューヨーク・タイムズが発行した報告書では、ChatGPTが一夜にして成功を収めたため、Googleはそれを「コードレッド」と呼び、人工知能チャットボットが同社の検索エンジン事業にもたらす脅威に対処し始めたことが明らかになった。によると

Google Chrome は非常に優れています。多くの友人がそれを使用しています。多くの友人が Google 独自の検索エンジンを使いたいと思っていますが、使い方がわかりません。ここでは、Google Chrome の Google 検索エンジンの使い方を簡単に説明します。バー。 Google Chrome で Google 検索エンジンを使用する方法: 1. Google Chrome を開き、右上隅にある [詳細] をクリックして設定を開きます。 2. 設定を入力したら、左側の「検索エンジン」をクリックします。 3. 検索エンジンが「Google」かどうかを確認します。 4. そうでない場合は、ドロップダウン ボタンをクリックして「Google」に変更します。

Google Chrome で検索エンジンを変更するにはどうすればよいですか? Google Chrome はユーザーの間で非常に人気のあるブラウザです。シンプルで使いやすいサービス、実用的なツール、その他の補助機能を備えているだけでなく、さまざまなユーザーのさまざまなニーズを満たすことができます。一般に、検索エンジンのデフォルトは Google です。交換するにはどのように設定すればよいですか?以下にその方法をシェアさせていただきます。交換方法 1. クリックして Google Chrome を開きます。 2. 三点アイコンをクリックしてメニュー インターフェイスを開きます。 3. [設定] オプションをクリックして、ブラウザの設定インターフェイスに入ります。 4. 設定インターフェースで検索エンジンモジュールを見つけます。 5. 「検索エンジンの管理」ボタンをクリックします。 6. 追加ボタンが表示されるので、この追加ボタンをクリックして検索エンジンを追加します。

情報化時代の継続的な発展に伴い、人々は情報を入手するためにますますインターネットに依存するようになりました。情報共有プラットフォームの 1 つとして、Web 検索エンジンも常に進化し、改善されています。この記事では、PHP 7.0 で全文検索エンジンを実装する方法を紹介し、読者が PHP テクノロジを有効に活用して効率的な検索エンジンを迅速に構築できるようにします。 1. 全文検索エンジンの概要 全文検索では、キーワードまたは語句を使用してドキュメント全体を検索し、最も一致する結果を見つけます。全文検索エンジンは、アルゴリズムを使用してドキュメントにインデックスを付け、検索を高速化します。存在する
