Analyse de tableaux HTML avec BeautifulSoup de Python
Lorsque vous travaillez avec des projets de web scraping, il est essentiel de savoir comment analyser efficacement les tableaux HTML. BeautifulSoup, une bibliothèque Python populaire, offre un moyen puissant d'extraire des données de documents HTML. Dans cet article, nous explorerons un scénario spécifique : analyser une table de ticket de parking à New York à l'aide de BeautifulSoup.
Problème :
Pour apprendre les requêtes de Python et les bibliothèques BeautifulSoup, vous sommes chargés d'écrire un simple analyseur de tickets de parking à New York. Après avoir accédé à l'URL désignée et obtenu une réponse HTML, vous avez besoin d'aide pour extraire tous les tickets de stationnement répertoriés dans le tableau HTML « lineItemsTable ».
Comment analyser le tableau :
La clé pour analyser la table réside dans l'utilisation des capacités d'analyse de table de BeautifulSoup. Voici un extrait de code Python révisé qui accomplit cela :
<code class="python">import requests from bs4 import BeautifulSoup plate = "T630134C" plateRequest = requests.get(f"https://paydirect.link2gov.com/NYCParking-Plate/ItemSearch?PlateNumber={plate}") soup = BeautifulSoup(plateRequest.text, "html.parser") table = soup.find("table", {"class": "lineItemsTable"}) table_body = table.find("tbody") rows = table_body.find_all("tr") data = [] for row in rows: cols = row.find_all("td") cols = [col.text.strip() for col in cols] data.append([col for col in cols if col])</code>
Remarques supplémentaires :
En suivant ces instructions étapes, vous pouvez analyser efficacement le tableau des tickets de parking de New York à l'aide de BeautifulSoup et extraire toutes les informations nécessaires à votre projet.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!