


Dans le framework GO Crawler Colly, comment le réglage du nombre de threads de la file d'attente et du retard de demande affecte-t-il le traitement simultané des demandes?
Le nombre de threads de file d'attente et de demande de retard du framework de robot en langue GO colly
Le traitement efficace de la demande simultanée est crucial lors de l'utilisation du framework GO Crawler Colly. Cet article approchera de la façon dont les paramètres comptent les paramètres et demandent les retards dans queue
dans Colly affectent le traitement simultané et répondent à une question commune.
Problème: interaction entre le nombre de threads et le retard de demande
Supposons que nous définissions queue
sur 2:
Q, _: = queue.new (2, stockage)
Et ajouté 3 demandes. Pendant ce temps, colly.Limit()
est utilisé pour définir le retard de chaque demande à 5 secondes. On s'attend à ce que deux demandes soient émises presque simultanément et répondent après 5 secondes, et la troisième demande est retardée de 5 secondes supplémentaires. Cependant, le résultat réel est:
- Deux demandes sont créées.
- Après 5 secondes, la première demande répond et une troisième demande est créée.
- Après 5 secondes, la deuxième demande répond.
- Après 5 secondes, la troisième demande répond.
Ceci n'est pas traité en parallèle. Pourquoi le nombre de threads de queue
semble-t-il échouer? colly.Limit()
affecte-t-il la concurrence de la queue
? onrequest
est-elle simplement en train de créer une demande, ne fait pas réellement de demande?
Analyse: Indépendance entre le nombre de threads et le retard de demande
queue
de Colly gère le nombre de demandes simultanées, tandis que colly.Limit()
définit le retard pour chaque demande. Les deux sont des mécanismes indépendants.
Le nombre de threads d' queue
limite le nombre de demandes traitées simultanément. colly.Limit()
applique un retard avant que chaque demande ne soit émise.
Dans le cas ci-dessus:
-
queue
crée deux demandes, maiscolly.Limit()
les fait attendre 5 secondes. - La première demande est émise une fois le retard terminé. Après la réponse,
queue
libère un thread et crée une troisième demande. - La deuxième demande est également envoyée et répondu après avoir attendu 5 secondes.
- La troisième demande est également envoyée et répondu après avoir attendu 5 secondes.
Par conséquent, le retard de demande masque la concurrence de queue
.
onrequest
RAPPEL ET DEMANDE
onrequest
est licenciée lorsque la demande est ajoutée à queue
, et non lorsque la demande est réellement émise. Il est utilisé pour effectuer des opérations de prétraitement avant la demande de la demande.
Conclusion: coordonner le nombre de threads et les retards de demande
Le retard de colly.Limit()
affectera l'effet de concurrence du nombre de threads queue
. Pour atteindre une véritable concurrence, une coordination minutieuse du nombre de threads et des paramètres de retard de demande est requise. Si une concurrence élevée est nécessaire, le retard fixé par colly.Limit()
doit être minimisé ou supprimé, ou un mécanisme de contrôle de concurrence plus fin doit être pris en compte. Si vous avez besoin de contrôler la vitesse d'exploration, il est recommandé d'utiliser une méthode de contrôle granulaire plus fine au lieu de compter sur colly.Limit()
.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Voulez-vous savoir comment afficher les catégories d'enfants sur la page des archives de la catégorie parent? Lorsque vous personnalisez une page d'archive de classification, vous devrez peut-être le faire pour le rendre plus utile à vos visiteurs. Dans cet article, nous vous montrerons comment afficher facilement les catégories d'enfants sur la page des archives de la catégorie parent. Pourquoi les sous-catégories apparaissent-elles sur la page des archives de la catégorie des parents? En affichant toutes les catégories d'enfants sur la page des archives de la catégorie parent, vous pouvez les rendre moins génériques et plus utiles aux visiteurs. Par exemple, si vous exécutez un blog WordPress sur les livres et que vous avez une taxonomie appelée "thème", vous pouvez ajouter une sous-taxonomie telle que "roman", "non-fiction" afin que vos lecteurs puissent

Dans Intellij ...

Les facteurs de la hausse des prix des devises virtuels comprennent: 1. Une augmentation de la demande du marché, 2. Daisser l'offre, 3. Stimulé de nouvelles positives, 4. Sentiment du marché optimiste, 5. Environnement macroéconomique; Les facteurs de déclin comprennent: 1. Daissement de la demande du marché, 2. AUGMENT DE L'OFFICATION, 3. Strike of Negative News, 4. Pespimiste Market Sentiment, 5. Environnement macroéconomique.

Comprendre le caractère aléatoire des dépendances circulaires dans le démarrage du projet Spring. Lors du développement du projet Spring, vous pouvez rencontrer le caractère aléatoire causé par des dépendances circulaires au démarrage du projet ...

JDBC ...

Pourquoi la valeur de retour est-elle vide lors de l'utilisation de Redemplate pour la requête par lots? Lorsque vous utilisez Redemplate pour les opérations de requête par lots, vous pouvez rencontrer les résultats renvoyés ...

Discussion sur les raisons pour lesquelles JavaScript ne peut pas obtenir d'informations sur le matériel informatique de l'utilisateur dans la programmation quotidienne, de nombreux développeurs seront curieux de savoir pourquoi JavaScript ne peut pas être directement obtenu ...

Analyse de la raison pour laquelle le script Python ne peut être trouvé lors de la soumission d'un travail de pyflink sur le fil lorsque vous essayez de soumettre un travail de pyflink via le fil, vous pouvez rencontrer ...
