


Comment puis-je optimiser l'envoi des requêtes HTTP pour 100 000 URL dans Python 2.6 ?
Optimisation de la répartition des requêtes HTTP en Python
La gestion des requêtes HTTP à grande échelle peut poser un défi en Python, en particulier pour les tâches impliquant des milliers d'URL . Cet article explore une solution très efficace pour distribuer 100 000 requêtes HTTP dans Python 2.6, en tirant parti de la concurrence et du threading pour maximiser les performances.
Solution Twistedless :
L'extrait de code suivant fournit une méthode rapide et efficace pour envoyer des requêtes HTTP simultanément :
from urlparse import urlparse from threading import Thread import httplib, sys from Queue import Queue concurrent = 200 def doWork(): while True: url = q.get() status, url = getStatus(url) doSomethingWithResult(status, url) q.task_done() def getStatus(ourl): try: url = urlparse(ourl) conn = httplib.HTTPConnection(url.netloc) conn.request("HEAD", url.path) res = conn.getresponse() return res.status, ourl except: return "error", ourl def doSomethingWithResult(status, url): print status, url q = Queue(concurrent * 2) for i in range(concurrent): t = Thread(target=doWork) t.daemon = True t.start() try: for url in open('urllist.txt'): q.put(url.strip()) q.join() except KeyboardInterrupt: sys.exit(1)
Explication :
- Un pool de threads est créé avec un niveau de concurrence configurable (en dans ce cas, 200).
- Chaque thread du pool exécute la fonction doWork, qui récupère les URL d'une file d'attente et envoie des requêtes HTTP HEAD pour obtenir des codes d'état.
- Les résultats sont traités dans le Fonction doSomethingWithResult, qui peut être personnalisée pour enregistrer ou effectuer d'autres opérations en fonction de la réponse.
- La file d'attente garantit que les tâches sont réparties uniformément entre les threads, minimisant les conflits et augmentant le débit.
Cette approche s'est avérée plus rapide que la solution basée sur Twisted tout en réduisant également l'utilisation du processeur. Il fournit un moyen très efficace et fiable de gérer les requêtes HTTP à grande échelle dans Python 2.6.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

Dreamweaver CS6
Outils de développement Web visuel

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Sujets chauds

Comment utiliser Python pour trouver la distribution ZIPF d'un fichier texte

Comment télécharger des fichiers dans Python

Comment utiliser la belle soupe pour analyser HTML?

Comment travailler avec des documents PDF à l'aide de Python

Comment se cacher en utilisant Redis dans les applications Django

Présentation de la boîte à outils en langage naturel (NLTK)

Comment effectuer l'apprentissage en profondeur avec TensorFlow ou Pytorch?
