Les pièges à araignées font référence aux obstacles qui empêchent les programmes d'araignées d'explorer les sites Web, tels que les recherches sur site, les produits de commerce électronique, les sites Web Flash, le contenu restreint, etc. La plus grande caractéristique des pièges à araignées est que lorsqu’une araignée explore une URL spécifique, elle entre dans une boucle infinie avec seulement une entrée et aucune sortie.
Dans le travail de référencement, le personnel SEO s'occupe quotidiennement du contenu et des liens. Du point de vue actuel, ils savent que le contenu original indépendant est très important pour l'avenir. sites. L'importance du développement à long terme, mais le début de tout cela a une condition préalable, qui est d'éviter le « piège à araignées ». Alors, qu’est-ce qu’un piège à araignées ?
Qu'est-ce qu'un « piège à araignées » ?
Les « pièges à araignées » sont des obstacles qui empêchent les programmes d'araignées d'explorer le site Web. Certaines techniques de conception de sites Web sont très hostiles aux moteurs de recherche et ne sont pas propices à l'exploration et à l'exploration des araignées. . La plus grande fonctionnalité est que lorsque l'araignée explore une URL spécifique, elle entre dans une boucle infinie, avec seulement une entrée et aucune sortie.
Quels sont les "pièges à araignées" courants :
1. Recherchez sur le site
Il s'agit d'un endroit commun et facile pour créer un " piège à araignée", lorsque vous essayez de rechercher certains mots-clés sur le site, si une adresse URL telle que search.php?q= est explorée et incluse par le moteur de recherche, un grand nombre de pages de résultats de recherche dénuées de sens sont susceptibles d'être générées.
Solution : Vous pouvez bloquer les paramètres dynamiques via le fichier Robots.txt.
2. Produits de commerce électronique
Si vous avez de l'expérience dans l'exploitation d'un site Web de commerce électronique, vous rencontrerez le problème de la diversité des SKU de produits. Le même contenu thématique. être affiché en fonction du SKU. Différentes URL sont générées, ce qui entraîne un grand nombre de pages de contenu en double, ce qui entraîne également un sérieux gaspillage de fréquence d'exploration des araignées.
Bien sûr, il existe un « piège à araignées » spécial similaire aux pages de produits de commerce électronique, à savoir l'insertion de contenu dynamique, qui fait souvent tomber les araignées dans de légers pièges.
Solution : assurez-vous que l'URL est canonique. Vous pouvez essayer d'utiliser la balise rel=canonical pour résoudre des problèmes similaires.
3. Site Web Flash
Afin de satisfaire l'expérience visuelle de l'utilisateur, les sociétés de création de sites Web utilisent généralement des sites Web Flash pour créer des sites Web officiels d'entreprise pour les utilisateurs. Cela a l'air très beau, mais à cause des moteurs de recherche actuels. Une bonne exploration et identification du contenu Flash rend souvent difficile l'amélioration du classement du site.
Solution : Ne faites pas de flash pour l'ensemble du site, essayez d'intégrer le flash dans une partie du contenu de la page Web.
4. Contenu restreint
Pour certains sites, afin d'attirer les fans, de nombreux contenus ne peuvent être consultés qu'en se connectant, notamment certaines opérations qui forcent les cookies, ce qui induit et trompe les robots. . Il est difficile d'identifier le contenu et il continue d'essayer d'explorer l'URL.
Solution : Pour la construction de sites Web, essayez d'éviter d'utiliser cette stratégie pour attirer les utilisateurs.
Comment identifier les "pièges à araignées"
Il est particulièrement simple d'identifier les pièges à araignées, il suffit de passer par les étapes suivantes :
① Journal du site Web : utilisez l'outil pour lire le contenu de l'URL explorée par l'araignée ce jour-là. Si une adresse URL spéciale est trouvée, elle mérite une attention particulière.
② Fréquence d'exploration : vérifiez la fréquence d'exploration sur la plate-forme de ressources de recherche Baidu. Si la valeur est particulièrement élevée un certain jour, vous risquez de tomber dans un piège à araignées.
Résumé : Les pièges à araignées couramment évoqués incluent les cadres de sites Web, les identifiants de session et divers sauts. Cet article ne décrit que brièvement les pièges à araignées couramment rencontrés dans les applications pratiques, à titre de référence uniquement.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!