Wie kann ich Daten von der folgenden Website extrahieren, um spezifische Falldetails zu finden?
Hier sind die manuellen Schritte, um Falldetails zu finden:
- Navigieren Sie zu https://www.claytoncountyga.gov/ Government/courts/court-case-inquiry/
- Offenbar gibt es ein JavaScript-Ladeformular mit einer Schaltfläche/Eingabe, mit der Sie einen Drilldown zu weiteren Falldetails durchführen können – „Namensuche“ muss ausgewählt werden, um Fälle nach Nachnamen zu durchsuchen – klicken Sie darauf
- Ein neuer Bildschirm erscheint dann innerhalb desselben Elements von (2), sodass der Benutzer aus einem Dropdown-Menü (z. B. Amtsgericht) auswählen und über eine Freitexteingabe einen Vor- und Nachnamen (Smith John) eingeben kann.
- Klicken Sie auf „Senden“, um alle Fälle anzuzeigen
- Sehen Sie sich die Falldetails an, indem Sie auf die Fallnummer in einer der Zeilen in der Tabelle klicken, die im selben Element wie in allen vorherigen Schritten ausgefüllt ist – ich möchte die Daten von dieser Seite entfernen.
Da das innere Formular gekapselt zu sein scheint (ich vermute, dass es in Javascript implementiert ist), kann ich die HTML-Elemente, die nach jeder Eingabe gerendert werden, nicht sehen. Wie automatisiere ich mit Python?
该表单包含在 ID 为“Clayton County”的
iframe
内。为了使 selenium 能够与其中的元素交互,我们首先必须使用EC.frame_to_be_available_and_switch_to_it
方法切换到它。然后使用
Select()
我们可以从下拉菜单中选择一个选项。在最后一页中,我们获取所有案例编号 url 并将它们保存在
case_numbers_urls
中,以便我们可以循环它们,加载每个案例,获取信息并传递到下一个案例。