Table des matières
Qu'est-ce que Google Fetch ?
Comment fonctionne le robot d'exploration Google ?
Rendu JavaScript et HTML
Quand utiliser JavaScript pour le scraping ?
Conclusion
Maison interface Web js tutoriel Google explorera-t-il le JavaScript contenant du contenu corporel ?

Google explorera-t-il le JavaScript contenant du contenu corporel ?

Aug 25, 2023 pm 02:33 PM

Google 是否会抓取包含正文内容的 JavaScript

Historiquement, les robots des moteurs de recherche comme Googlebot ne pouvaient lire que le code source HTML statique et étaient incapables d'analyser et d'indexer le matériel écrit dynamiquement à l'aide de JavaScript. Cependant, cela a changé avec l'essor des sites Web et des frameworks riches en JavaScript tels que Angular, React et Vue.JS, ainsi que des applications monopage (SPA) et des applications Web progressives (PWA). Afin d'afficher correctement les pages Web avant de les indexer, Google a modifié et abandonné sa précédente technologie d'exploration AJAX. Bien que Google puisse généralement explorer et indexer la plupart des informations JavaScript, ils déconseillent d'utiliser des solutions côté client car JavaScript "est difficile à traiter et tous les robots des moteurs de recherche ne peuvent pas le traiter correctement ou rapidement"

.

Qu'est-ce que Google Fetch ?

Google et d'autres moteurs de recherche utilisent des logiciels appelés robots d'exploration de Google (également appelés robots de recherche ou araignées) pour analyser le Web. En d’autres termes, il « explore » Internet de page en site Web, à la recherche de contenu nouveau ou mis à jour qui ne figure pas déjà dans la base de données de Google.

Chaque moteur de recherche possède une collection unique de robots d'exploration. Pour Google, il existe plus de 15 types différents de robots d’exploration, Googlebot étant le principal. Étant donné que Googlebot effectue l'exploration et l'indexation, nous examinerons son fonctionnement plus en détail.

Comment fonctionne le robot d'exploration Google ?

Aucun moteur de recherche (y compris Google) ne tient un registre central d'URL et ne met à jour l'URL à chaque fois qu'une nouvelle page est créée. Cela signifie que Google doit rechercher de nouvelles pages sur Internet, plutôt que de les « alerter » automatiquement. Googlebot parcourt constamment Internet à la recherche de nouvelles pages Web à ajouter à l'inventaire de pages Web existantes de Google.

Une fois qu'un nouveau site Web est trouvé, Googlebot affiche (ou « visualise ») le site dans le navigateur en chargeant tout le HTML, le code tiers, JavaScript et CSS. Les moteurs de recherche utilisent ces données enregistrées dans des bases de données pour indexer et classer les pages. La page sera ajoutée à l'index Google, qui est une base de données Google supplémentaire et très volumineuse si elle est indexée.

Rendu JavaScript et HTML

Un code long peut être difficile à traiter et à afficher pour Googlebot. Si le code n'est pas propre, le robot d'exploration risque de ne pas être en mesure de restituer votre site correctement, auquel cas il sera traité comme vide.

Concernant le rendu JavaScript, gardez à l'esprit que le langage évolue rapidement et que Googlebot peut parfois cesser de prendre en charge la dernière version. Assurez-vous que votre JavaScript est compatible avec Googlebot pour éviter d'afficher votre site À tort. Assurez-vous que JavaScript se charge rapidement. Googlebot ne restituera ni n'indexera le matériel généré par le script si le chargement prend plus de cinq secondes.

Quand utiliser JavaScript pour le scraping ?

Nous recommandons toujours d'utiliser de manière sélective l'exploration JavaScript lors de la première analyse d'un site pour JavaScript, bien que Google affiche généralement chaque page. JavaScript est utilisé pour exploiter les dépendances connues côté client à des fins d'audit et lors du déploiement sur de grands sites.

Toutes les ressources (y compris JavaScript, CSS et images) doivent être explorées de manière sélective pour afficher chaque page Web et créer le DOM dans un navigateur sans tête en arrière-plan. L'exploration JavaScript est plus lente et demande plus de travail.

Bien que cela ne pose pas de problème pour les petits sites, cela peut avoir un impact significatif sur les sites plus grands comportant des centaines, voire des millions de pages. Si votre site Web ne s'appuie pas beaucoup sur JavaScript pour modifier dynamiquement les pages Web, vous n'avez pas besoin d'y consacrer du temps ni des ressources.

Lorsqu'il s'agit de JavaScript et de pages Web à contenu dynamique (DOM), le robot d'exploration doit lire et évaluer le modèle d'objet de document. Une fois tout le code chargé et traité, une version entièrement affichée d’un tel site Web doit également être générée. Les navigateurs sont l’outil le plus simple pour afficher les pages Web affichées. Pour cette raison, l'exploration de JavaScript est parfois décrite comme l'utilisation d'un « navigateur sans tête ».

Conclusion

Il y aura davantage de JavaScript dans les prochaines années car il est là pour rester. JavaScript peut coexister pacifiquement avec les référenceurs et les robots d'exploration à condition que vous en discutiez avec le référencement dès le début lors de la création de l'architecture de votre site Web. Les robots d’exploration ne sont encore que des répliques du comportement des véritables robots des moteurs de recherche. En plus des robots d'exploration JavaScript, nous vous recommandons fortement d'utiliser l'analyse des fichiers journaux, l'outil d'inspection d'URL de Google ou des outils de test adaptés aux mobiles pour comprendre ce que Google peut explorer, restituer et indexer.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Outils chauds

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Que dois-je faire si je rencontre l'impression de code brouillé pour les reçus en papier thermique frontal? Que dois-je faire si je rencontre l'impression de code brouillé pour les reçus en papier thermique frontal? Apr 04, 2025 pm 02:42 PM

Des questions et des solutions fréquemment posées pour l'impression de billets thermiques frontaux pour le développement frontal, l'impression de billets est une exigence commune. Cependant, de nombreux développeurs mettent en œuvre ...

Qui est payé plus de python ou de javascript? Qui est payé plus de python ou de javascript? Apr 04, 2025 am 12:09 AM

Il n'y a pas de salaire absolu pour les développeurs Python et JavaScript, selon les compétences et les besoins de l'industrie. 1. Python peut être davantage payé en science des données et en apprentissage automatique. 2. JavaScript a une grande demande dans le développement frontal et complet, et son salaire est également considérable. 3. Les facteurs d'influence comprennent l'expérience, la localisation géographique, la taille de l'entreprise et les compétences spécifiques.

Comment fusionner les éléments du tableau avec le même ID dans un seul objet en utilisant JavaScript? Comment fusionner les éléments du tableau avec le même ID dans un seul objet en utilisant JavaScript? Apr 04, 2025 pm 05:09 PM

Comment fusionner les éléments du tableau avec le même ID dans un seul objet en JavaScript? Lors du traitement des données, nous rencontrons souvent la nécessité d'avoir le même ID ...

Démystifier javascript: ce qu'il fait et pourquoi c'est important Démystifier javascript: ce qu'il fait et pourquoi c'est important Apr 09, 2025 am 12:07 AM

JavaScript est la pierre angulaire du développement Web moderne, et ses principales fonctions incluent la programmation axée sur les événements, la génération de contenu dynamique et la programmation asynchrone. 1) La programmation axée sur les événements permet aux pages Web de changer dynamiquement en fonction des opérations utilisateur. 2) La génération de contenu dynamique permet d'ajuster le contenu de la page en fonction des conditions. 3) La programmation asynchrone garantit que l'interface utilisateur n'est pas bloquée. JavaScript est largement utilisé dans l'interaction Web, les applications à une page et le développement côté serveur, améliorant considérablement la flexibilité de l'expérience utilisateur et du développement multiplateforme.

La différence dans Console.Log de sortie Résultat: Pourquoi les deux appels sont-ils différents? La différence dans Console.Log de sortie Résultat: Pourquoi les deux appels sont-ils différents? Apr 04, 2025 pm 05:12 PM

Discussion approfondie des causes profondes de la différence de sortie Console.log. Cet article analysera les différences dans les résultats de sortie de la fonction Console.log dans un morceau de code et expliquera les raisons derrière. � ...

TypeScript pour les débutants, partie 2: Types de données de base TypeScript pour les débutants, partie 2: Types de données de base Mar 19, 2025 am 09:10 AM

Une fois que vous avez maîtrisé le didacticiel TypeScript de niveau d'entrée, vous devriez être en mesure d'écrire votre propre code dans un IDE qui prend en charge TypeScript et de le compiler en JavaScript. Ce tutoriel plongera dans divers types de données dans TypeScript. JavaScript a sept types de données: null, non défini, booléen, numéro, chaîne, symbole (introduit par ES6) et objet. TypeScript définit plus de types sur cette base, et ce tutoriel les couvrira tous en détail. Type de données nuls Comme javascript, null en typeScript

Comment réaliser des effets de défilement de parallaxe et d'animation des éléments, comme le site officiel de Shiseido?
ou:
Comment pouvons-nous réaliser l'effet d'animation accompagné d'un défilement de page comme le site officiel de Shiseido? Comment réaliser des effets de défilement de parallaxe et d'animation des éléments, comme le site officiel de Shiseido? ou: Comment pouvons-nous réaliser l'effet d'animation accompagné d'un défilement de page comme le site officiel de Shiseido? Apr 04, 2025 pm 05:36 PM

La discussion sur la réalisation des effets de défilement de parallaxe et d'animation des éléments dans cet article explorera comment réaliser le site officiel de Shiseido (https://www.shiseido.co.jp/sb/wonderland/) ...

PowerPoint peut-il exécuter JavaScript? PowerPoint peut-il exécuter JavaScript? Apr 01, 2025 pm 05:17 PM

JavaScript peut être exécuté dans PowerPoint et peut être implémenté en appelant des fichiers JavaScript externes ou en intégrant des fichiers HTML via VBA. 1. Pour utiliser VBA pour appeler les fichiers JavaScript, vous devez activer les macros et avoir des connaissances en programmation VBA. 2. ENCHED des fichiers HTML contenant JavaScript, qui sont simples et faciles à utiliser mais sont soumis à des restrictions de sécurité. Les avantages incluent les fonctions étendues et la flexibilité, tandis que les inconvénients impliquent la sécurité, la compatibilité et la complexité. En pratique, l'attention doit être accordée à la sécurité, à la compatibilité, aux performances et à l'expérience utilisateur.

See all articles