Comment extraire les données du site Web suivant pour trouver des détails de cas spécifiques ?
Voici les étapes manuelles pour trouver les détails du cas :
- Accédez à https://www.claytoncountyga.gov/government/courts/court-case-inquiry/
- Il semble qu'il puisse y avoir un formulaire de chargement JavaScript avec un bouton/une entrée qui vous permet d'accéder à des détails plus approfondis sur le cas - "Recherche par nom" doit être sélectionné pour rechercher des cas par nom de famille - cliquez dessus
- Un nouvel écran apparaît alors dans le même élément de (2), permettant à l'utilisateur de sélectionner dans un tribunal déroulant (par exemple Magistrates Court) et de saisir un prénom et un nom (Smith John) via la saisie de texte libre.
- Cliquez sur "Soumettre" pour voir tous les cas
- Affichez les détails du cas en cliquant sur le numéro du cas sur l'une des lignes du tableau renseignée dans le même élément que lors de toutes les étapes précédentes - je souhaite extraire les données de cette page.
Étant donné que le formulaire interne semble être encapsulé (je suppose qu'il est implémenté en Javascript), je ne peux pas voir les éléments HTML qui sont rendus après la fourniture de chaque entrée. Comment automatiser avec Python ?
Le formulaire est contenu dans la méthode
iframe
内。为了使 selenium 能够与其中的元素交互,我们首先必须使用EC.frame_to_be_available_and_switch_to_it
avec l'ID "Clayton County" pour y accéder.Ensuite, en utilisant
Select()
, nous pouvons sélectionner une option dans le menu déroulant.Dans la dernière page, nous obtenons toutes les URL des numéros de cas et les enregistrons dans
case_numbers_urls
afin que nous puissions les parcourir, charger chaque cas, obtenir les informations et les transmettre au cas suivant.