Comment refuser aux moteurs de recherche d'inclure un site Web : vous pouvez ajouter du contenu [<meta name="robots" content="noarchive">] dans la balise head pour empêcher les moteurs de recherche d'explorer le site Web et afficher des instantanés de pages Web.
Après la création d'un nouveau site Web, tant que le contenu du site Web exploré par les robots des moteurs de recherche n'est pas très mauvais, alors le moteur de recherche est très probable pour inclure notre site Web, si vous ne souhaitez pas que les moteurs de recherche incluent votre site Web pour une raison quelconque, que devez-vous faire ? L’article suivant vous l’expliquera.
Méthode 1 : Définir la méthode robots.txt
Vous pouvez utiliser pour configurer robots.txt pour bloquer les robots des moteurs de recherche, alors qu'est-ce que robots.txt ?
Les moteurs de recherche utilisent des programmes araignées pour accéder automatiquement aux pages Web sur Internet et obtenir des informations sur les pages Web. Lorsqu'une araignée visite un site Web, elle vérifie d'abord s'il existe un fichier texte brut appelé robots.txt sous le domaine racine du site Web. Ce fichier est utilisé pour spécifier la portée d'exploration de l'araignée sur votre site Web. Vous pouvez créer un fichier robots.txt sur votre site Web et déclarer dans le fichier les parties du site Web que vous ne souhaitez pas que les moteurs de recherche incluent ou spécifier que les moteurs de recherche n'incluent que des parties spécifiques.
Veuillez noter que vous ne devez utiliser un fichier robots.txt que si votre site contient du contenu que vous ne souhaitez pas que les moteurs de recherche indexent. Si vous souhaitez que les moteurs de recherche incluent tout le contenu de votre site, ne créez pas de fichier robots.txt.
Comment utiliser robots.txt pour bloquer les robots des moteurs de recherche ?
Les moteurs de recherche respectent le protocole robots.txt par défaut. Créez un fichier texte robots.txt et placez-le dans le répertoire racine du site Web :
User-agent: * Disallow: /
User-agent: Baiduspider Disallow: /
User-agent: Googlebot Disallow: /
Méthode 2 : Définir la méthode de code de la page Web
Ajoutez le code suivant entre le code ;/head> sur la page d'accueil du site Web pour empêcher les moteurs de recherche d'explorer. Prenez le site Web et affichez un instantané de la page Web.<meta name="robots" content="noarchive">
<meta name="Baiduspider" content="noarchive">
<meta name="googlebot" content="noarchive">
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!