ホームページ > バックエンド開発 > PHPチュートリアル > PHP コードにより検索エンジンのスパイダー ソリューションが禁止される

PHP コードにより検索エンジンのスパイダー ソリューションが禁止される

WBOY
リリース: 2016-06-13 13:53:12
オリジナル
2435 人が閲覧しました

PHP コードは検索エンジンのスパイダーを禁止します
実際、robots.txt はウェブサイトのスパイダーのクロールを 100% 防ぐことはできません。いくつかの情報に基づいて、この問題を完全に解決できると思われる小さなコードを書きました。間違っていたら教えてください:

PHP コード
<!--

Code highlighting produced by Actipro CodeHighlighter (freeware)
http://www.CodeHighlighter.com/

-->
if(preg_match("/(Googlebot|Msnbot|YodaoBot|Sosospider|baiduspider|google|baidu|yahoo|sogou|bing|coodir|soso|youdao|zhongsou|slurp|ia_archiver|scooter|spider|webcrawler|OutfoxBot)/i", $_SERVER['HTTP_USER_AGENT']))
{

    header('HTTP/1.1 403 Forbidden');
    exit;
}

ログイン後にコピー


-----解決策-------- -------- ---
LZ の考えは理解できますが、このテキストはすべてのファイルに含めるべきですか、それともホームページに含めるべきですか?
------解決策---------
これはトリックです
------解決策----------------------
分かりました、マスター・ミエジエ
------解決策-----
いいですね!!!
でもなぜ?それを防ぐには、より多くのスパイダーがサイトをクロールした方が、検索エンジンがあなたのサイトを含めて宣伝しやすくなると思いませんか?
------解決策---------
話し合う

悪くない!!!
でも、なぜそれを止めたいのですか?クモがもっと這い回れば、検索エンジンがあなたのサイトを含めて宣伝しやすくなると思いませんか?

------解決策---------
話し合う


電子メール アドレス、電話番号、名前、その他の情報など、検索エンジンに含められたくないものもあります

------解決策------------------
この方法で防げるのは「友好的な」クモです。もちろん、これらの「フレンドリーなスパイダー」は robots.txt の指示を完全に尊重していない可能性がありますが、少なくとも「私は XX スパイダーです」ということは伝えられます。

非友好的なクモの場合、この判定は無効となります。
関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート