如何從以下網站抓取資料以查找特定案例詳細資訊?
以下是查找案例詳細資訊的手動步驟:
- 導覽至 https://www.claytoncountyga.gov/government/courts/court-case-inquiry/
- 似乎可能有一個帶有按鈕/輸入的 JavaScript 載入表單,可讓您進一步了解案例詳細資訊 - 需要選擇「姓名搜尋」以按姓氏搜尋案例 - 點擊它
- 然後,在 (2) 的同一元素中會出現一個新螢幕,允許使用者從下拉法院(例如治安法院)中進行選擇,並透過自由格式文字輸入來輸入姓氏和名字(Smith John)。
- 點擊「提交」即可查看所有案例
- 點擊表中與所有先前步驟相同的元素中填充的行之一上的案例編號,即可查看案例詳細資訊 - 我想從此頁面抓取資料。
因為內部表單似乎是封裝的(我猜是用 Javascript 實現的),所以我看不到提供每個輸入後呈現的 HTML 元素。我如何使用 Python 實現自動化?
該表單包含在 ID 為「Clayton County」的
iframe
內。為了使 selenium 能夠與其中的元素交互,我們首先必須使用EC.frame_to_be_available_and_switch_to_it
方法切換到它。然後使用
Select()
我們可以從下拉式選單中選擇一個選項。在最後一頁中,我們取得所有案例編號 url 並將它們保存在
case_numbers_urls
中,以便我們可以循環它們,載入每個案例,獲取資訊並傳遞到下一個案例。