In Python bietet BeautifulSoup leistungsstarke Methoden zum Parsen von HTML-Dokumenten. Wenn Sie mit einem Szenario wie diesem konfrontiert werden, in dem Sie bestimmte Daten aus einer Tabelle abrufen müssen, ist BeautifulSoup praktisch.
Um die gezielte Einzelpostentabelle zu extrahieren, verwenden Sie „soup.find()“ und geben Sie die entsprechenden Attribute innerhalb der Tabelle an Klammern. In diesem Fall benötigen Sie:
<code class="python">table = soup.find("table", {"class": "lineItemsTable"})</code>
Als nächstes können Sie mit table.findAll("tr") über jede Zeile in der Tabelle iterieren. Innerhalb jeder Zeile können Sie mit row.findAll("td") auf die Tabellenzellen (td) zugreifen.
Hier ist ein erweiterter Codeausschnitt:
<code class="python">data = [] table_body = table.find('tbody') rows = table_body.find_all('tr') for row in rows: cols = row.find_all('td') cols = [ele.text.strip() for ele in cols] data.append([ele for ele in cols if ele]) # Remove empty values</code>
Dieser Code erstellt eine Liste von Listen, wobei jede Unterliste eine Zeile in der Tabelle darstellt. Es erfasst effizient die erforderlichen Daten von der Website.
Das obige ist der detaillierte Inhalt vonWie kann BeautifulSoup verwendet werden, um Daten aus einer HTML-Tabelle in Python zu extrahieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!