Web crawler - comment coopérer avec les requêtes dans le multi-processus de Python

Question

Il s'agit du code pour l'exécution séquentielle d'un seul processus : {code...} Il s'agit du code pour plusieurs processus : {code...} Cependant, il n'y a presque aucune différence dans le temps passé par un seul processus et par plusieurs processus. . Le problème est probablement que les requêtes bloquent les E/S. Veuillez comprendre. Est-ce correct ? Comment dois-je modifier le code pour atteindre l'objectif du multi-processus ? Merci!

phpcn_u1582 · Answer

Le goulot d'étranglement de l'écriture de fichiers est l'E/S du disque, pas le CPU. Le parallélisme n'a pas beaucoup d'effet. Vous pouvez essayer de ne pas écrire de fichiers et comparer les temps.

怪我咯 · Answer

Le pool sans paramètres utilise
os.cpu_count() ou 1
S'il s'agit d'un processeur monocœur ou si le numéro ne peut pas être collecté, il n'y a qu'un seul processus.

Cela devrait être la raison.