L'utilisation d'un navigateur ou d'un navigateur de type navigateur pour analyser une page est beaucoup moins rapide qu'une analyse régulière. Si vous souhaitez utiliser un sélecteur, vous devez créer quelque chose.
Cependant, le plus gros problème avec l'analyse syntaxique régulière est que dès que quelqu'un d'autre modifie la version, vous pouvez simplement la modifier à un rythme joyeux
La langue n'est pas un problème. L'activité spécifique dépend du module. Vous devez disposer d'une bibliothèque http utile, d'une bibliothèque de concurrence utile, d'une bibliothèque de planification de tâches utile et d'une bibliothèque d'analyse de langage de balisage utile. Parlons du langage. Il a de meilleures performances et une syntaxe plus belle. Enfin, cela dépend si la plupart des gens dans l'entreprise peuvent accepter ce langage. D'un point de vue général, python, java, ruby, nodejs, c# remplissent tous ces conditions. Quant à savoir comment choisir ? Cela dépend des conditions suivantes
grattant 1
Il est très pratique à utiliser, a beaucoup de fonctions, et la documentation est très claire :
Site officiel de Scrapy
Le questionneur a déjà ajouté lui-même la balise python, pourquoi pose-t-il encore des questions sur la langue...
L'entreprise pour laquelle je travaille utilise Java.
L'utilisation d'un navigateur ou d'un navigateur de type navigateur pour analyser une page est beaucoup moins rapide qu'une analyse régulière. Si vous souhaitez utiliser un sélecteur, vous devez créer quelque chose.
Cependant, le plus gros problème avec l'analyse syntaxique régulière est que dès que quelqu'un d'autre modifie la version, vous pouvez simplement la modifier à un rythme joyeux
nodey 1
Je pense que j'utilise principalement Python, mais de temps en temps j'utilise Java
J'ai utilisé Nokogiri pour écrire Ruby, mais pour une efficacité élevée, Python est plus pratique
nœud 1
La langue n'est pas un problème. L'activité spécifique dépend du module. Vous devez disposer d'une bibliothèque http utile, d'une bibliothèque de concurrence utile, d'une bibliothèque de planification de tâches utile et d'une bibliothèque d'analyse de langage de balisage utile. Parlons du langage. Il a de meilleures performances et une syntaxe plus belle. Enfin, cela dépend si la plupart des gens dans l'entreprise peuvent accepter ce langage. D'un point de vue général, python, java, ruby, nodejs, c# remplissent tous ces conditions. Quant à savoir comment choisir ? Cela dépend des conditions suivantes
Nous l'avons écrit en rubis