如何使用 BeautifulSoup 从 Python 中的 HTML 表中提取数据?

Patricia Arquette
发布: 2024-10-28 10:00:29
原创
970 人浏览过

How can BeautifulSoup be used to extract data from a HTML table in Python?

BeautifulSoup解析表

在Python中,BeautifulSoup提供了强大的解析HTML文档的方法。当遇到这样的场景,您需要从表中检索特定数据时,BeautifulSoup 会派上用场。

要提取目标行项目表,请使用 soup.find(),在括号。在这种情况下,您需要:

<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>
登录后复制

接下来,您可以使用 table.findAll("tr") 迭代表中的每一行。在每一行中,您可以使用 row.findAll("td") 访问表格单元格 (td)。

这是一个增强的代码片段:

<code class="python">data = []
table_body = table.find('tbody')

rows = table_body.find_all('tr')
for row in rows:
    cols = row.find_all('td')
    cols = [ele.text.strip() for ele in cols]
    data.append([ele for ele in cols if ele])  # Remove empty values</code>
登录后复制

此代码将生成一个列表列表,每个子列表代表表中的一行。它将有效地从网站捕获必要的数据。

以上是如何使用 BeautifulSoup 从 Python 中的 HTML 表中提取数据?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!