Python을 사용하여 웹을 스크랩하지만 정적(?) URL로 무엇을 해야 할지 잘 모르겠습니다.
P粉293341969
P粉293341969 2024-02-17 17:14:50
0
1
347

이 URL에서 데이터를 추출하는 방법을 배우려고 합니다. https://denver.coloradotaxsale.com/index.cfm?folder=auctionResults&mode=preview

그런데 문제는 페이지를 전환하려고 해도 URL이 바뀌지 않아서 어떻게 열거하거나 반복해야 할지 잘 모르겠습니다. 웹페이지에는 3000개의 판매 데이터 포인트가 있으므로 더 나은 방법을 찾으려는 노력이 이루어지고 있습니다.

이것은 나의 시작 코드입니다. 매우 간단하지만 제가 제공할 수 있는 도움이나 팁에 감사드립니다. 다른 가방으로 바꿔야 할 것 같은데 어떤 가방이 아름다운지 모르겠어요수프?

导入请求
url =“https://denver.coloradotaxsale.com/index.cfm?folder=auctionResults&mode=preview”

html = requests.get(url).content
df_list = pd.read_html(html,标题 = 1)[0]
df_list = df_list.drop([0,1,2]) #删除不需要的行

P粉293341969
P粉293341969

모든 응답(1)
P粉600845163

더 많은 페이지에서 데이터를 얻으려면 다음 예를 사용할 수 있습니다.

으아악

인쇄:

서열번호 과세 연도 알림 플롯 ID 얼굴 수 낙찰 판매 대상 标题> 96 000094 2020 00031-18-001-000 $905.98 $81.00 00005517 97 000095 2020 00031-18-002-000 $750.13 $75.00 00005517 98 000096 2020 00031-18-003-000 $750.13 $75.00 00005517 99 000097 2020 00031-18-004-000 $750.13 $75.00 00005517 100 000098 2020 00031-18-007-000 $750.13 $76.00 00005517 101 000099 2020 00031-18-008-000 $905.98 $84.00 00005517 102 000100 2020 00031-19-001-000 $1,999.83 $171.00 00005517 103 000101 2020 00031-19-004-000 $1,486.49 $131.00 00005517 104 000102 2020 00031-19-006-000 $1,063.44 $96.00 00005517 105 000103 2020 00031-20-001-000 $1,468.47 $126.00 00005517 表>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿