我正在尝试学习如何从此网址提取数据: https://denver.coloradotaxsale.com/index.cfm?folder=auctionResults&mode=preview
但是,问题是当我尝试切换页面时,URL 不会改变,因此我不确定如何枚举或循环它。由于网页有 3000 个销售数据点,正在尝试寻找更好的方法。
这是我的起始代码,它非常简单,但我将不胜感激任何可以提供的帮助或任何提示。我想我可能需要换成另一个包,但我不确定哪个可能是 beautifulsoup?
导入请求 url =“https://denver.coloradotaxsale.com/index.cfm?folder=auctionResults&mode=preview” html = requests.get(url).content df_list = pd.read_html(html,标题 = 1)[0] df_list = df_list.drop([0,1,2]) #删除不需要的行
要从更多页面获取数据,您可以使用以下示例: