Comment refuser aux moteurs de recherche d'inclure un site Web-SEO-php.cn

Comment refuser aux moteurs de recherche d'inclure un site Web

青灯夜游

Libérer： 2020-09-17 15:11:34

original

7910 Les gens l'ont consulté

Comment refuser aux moteurs de recherche d'inclure un site Web : vous pouvez ajouter du contenu [<meta name="robots" content="noarchive">] dans la balise head pour empêcher les moteurs de recherche d'explorer le site Web et afficher des instantanés de pages Web.

Comment refuser aux moteurs de recherche d'inclure un site Web

Après la création d'un nouveau site Web, tant que le contenu du site Web exploré par les robots des moteurs de recherche n'est pas très mauvais, alors le moteur de recherche est très probable pour inclure notre site Web, si vous ne souhaitez pas que les moteurs de recherche incluent votre site Web pour une raison quelconque, que devez-vous faire ? L’article suivant vous l’expliquera.

Méthode 1 : Définir la méthode robots.txt

Vous pouvez utiliser pour configurer robots.txt pour bloquer les robots des moteurs de recherche, alors qu'est-ce que robots.txt ?

Les moteurs de recherche utilisent des programmes araignées pour accéder automatiquement aux pages Web sur Internet et obtenir des informations sur les pages Web. Lorsqu'une araignée visite un site Web, elle vérifie d'abord s'il existe un fichier texte brut appelé robots.txt sous le domaine racine du site Web. Ce fichier est utilisé pour spécifier la portée d'exploration de l'araignée sur votre site Web. Vous pouvez créer un fichier robots.txt sur votre site Web et déclarer dans le fichier les parties du site Web que vous ne souhaitez pas que les moteurs de recherche incluent ou spécifier que les moteurs de recherche n'incluent que des parties spécifiques.

Veuillez noter que vous ne devez utiliser un fichier robots.txt que si votre site contient du contenu que vous ne souhaitez pas que les moteurs de recherche indexent. Si vous souhaitez que les moteurs de recherche incluent tout le contenu de votre site, ne créez pas de fichier robots.txt.

Comment utiliser robots.txt pour bloquer les robots des moteurs de recherche ?

Les moteurs de recherche respectent le protocole robots.txt par défaut. Créez un fichier texte robots.txt et placez-le dans le répertoire racine du site Web :

User-agent: *
Disallow: /

Copier après la connexion

<. 🎜>Grâce au code ci-dessus, vous pouvez indiquer aux moteurs de recherche de ne pas explorer ou inclure ce site, et soyez prudent lorsque vous utilisez le code ci-dessus : cela empêchera tous les moteurs de recherche d'accéder à n'importe quelle partie du site.

Si vous souhaitez uniquement interdire à Baidu d'inclure l'intégralité du site, vous pouvez modifier le code suivant :

User-agent: Baiduspider
Disallow: /

Copier après la connexion

Si vous souhaitez uniquement interdire à Google d'inclure l'intégralité du site, vous pouvez modifier le code suivant :

User-agent: Googlebot
Disallow: /

Copier après la connexion

Méthode 2 : Définir la méthode de code de la page Web

Ajoutez le code suivant entre le code ;/head> sur la page d'accueil du site Web pour empêcher les moteurs de recherche d'explorer. Prenez le site Web et affichez un instantané de la page Web.

<meta name="robots" content="noarchive">

Copier après la connexion

Ajoutez le code suivant entre les codes et sur la page d'accueil du site Web pour empêcher le moteur de recherche Baidu d'explorer le site Web et d'afficher des instantanés de la page Web.

<meta name="Baiduspider" content="noarchive">

Copier après la connexion

Ajoutez le code suivant entre les codes et sur la page d'accueil du site Web pour empêcher les moteurs de recherche Google d'explorer le site Web et d'afficher des instantanés de page Web.

<meta name="googlebot" content="noarchive">

Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!