Python では、BeautifulSoup は HTML ドキュメントを解析するための強力なメソッドを提供します。テーブルから特定のデータを取得する必要があるこのようなシナリオに直面した場合、BeautifulSoup が役に立ちます。
ターゲットの広告申込情報テーブルを抽出するには、soup.find() を利用し、テーブル内で適切な属性を指定します。括弧。この場合、次のものが必要になります。
<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>
次に、table.findAll("tr") を使用してテーブル内の各行を反復できます。各行内では、row.findAll("td") を使用してテーブルのセル (td) にアクセスできます。
拡張コード スニペットは次のとおりです:
<code class="python">data = [] table_body = table.find('tbody') rows = table_body.find_all('tr') for row in rows: cols = row.find_all('td') cols = [ele.text.strip() for ele in cols] data.append([ele for ele in cols if ele]) # Remove empty values</code>
このコードはリストを生成します。リストの各サブリストがテーブル内の行を表します。 Web サイトから必要なデータを効率的に取得します。
以上がBeautifulSoup を使用して Python の HTML テーブルからデータを抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。