次の Web サイトからデータを収集して、特定のケースの詳細を見つけるにはどうすればよいですか?
ケースの詳細を手動で検索する手順は次のとおりです:
- https://www.claytoncountyga.gov/government/courts/court-case-inquiry/
に移動します。
- ケースの詳細をさらにドリルダウンできるボタン/入力を備えた JavaScript 読み込みフォームがあるようです - ケースを姓で検索するには「名前検索」を選択する必要があります - それをクリックしてください
- 次に、(2) と同じ要素に新しい画面が表示され、ユーザーがドロップダウン裁判所 (例: 治安判事裁判所) から選択し、自由形式のテキスト入力で姓名 (Smith John) を入力できるようになります。 。
- 「送信」をクリックしてすべてのケースを表示します
- ケースの詳細は、これまでのすべての手順と同様に、テーブル内の同じ要素に入力されている行の 1 つでケース番号をクリックすると表示できます。このページからデータを取得したいと考えています。
内部フォームはカプセル化されているように見えるため (おそらく JavaScript で実装されていると思います)、各入力が提供された後にレンダリングされる HTML 要素は表示されません。 Python を使用して自動化するにはどうすればよいですか?
フォームは、ID「Clayton County」の
iframe
内に含まれています。 Selenium がその中の要素と対話できるようにするには、まずEC.frame_to_be_available_and_switch_to_it
メソッドを使用して Selenium に切り替える必要があります。次に、
Select()
を使用して、ドロップダウン メニューからオプションを選択できます。最後のページでは、すべてのケース番号の URL を取得して
case_numbers_urls
に保存します。これにより、それらをループして各ケースをロードし、情報を取得して次のケースに渡すことができます。