Comment extraire les données des tickets de stationnement d'un site Web de New York avec BeautifulSoup ?

Patricia Arquette
Libérer: 2024-10-27 00:57:30
original
563 Les gens l'ont consulté

How to Extract Parking Ticket Data from a NYC Website with BeautifulSoup?

Analyse de tableaux HTML avec BeautifulSoup de Python

Lorsque vous travaillez avec des projets de web scraping, il est essentiel de savoir comment analyser efficacement les tableaux HTML. BeautifulSoup, une bibliothèque Python populaire, offre un moyen puissant d'extraire des données de documents HTML. Dans cet article, nous explorerons un scénario spécifique : analyser une table de ticket de parking à New York à l'aide de BeautifulSoup.

Problème :

Pour apprendre les requêtes de Python et les bibliothèques BeautifulSoup, vous sommes chargés d'écrire un simple analyseur de tickets de parking à New York. Après avoir accédé à l'URL désignée et obtenu une réponse HTML, vous avez besoin d'aide pour extraire tous les tickets de stationnement répertoriés dans le tableau HTML « lineItemsTable ».

Comment analyser le tableau :

La clé pour analyser la table réside dans l'utilisation des capacités d'analyse de table de BeautifulSoup. Voici un extrait de code Python révisé qui accomplit cela :

<code class="python">import requests
from bs4 import BeautifulSoup

plate = "T630134C"
plateRequest = requests.get(f"https://paydirect.link2gov.com/NYCParking-Plate/ItemSearch?PlateNumber={plate}")
soup = BeautifulSoup(plateRequest.text, "html.parser")

table = soup.find("table", {"class": "lineItemsTable"})
table_body = table.find("tbody")

rows = table_body.find_all("tr")
data = []
for row in rows:
    cols = row.find_all("td")
    cols = [col.text.strip() for col in cols]
    data.append([col for col in cols if col])</code>
Copier après la connexion

Remarques supplémentaires :

  • La dernière ligne des données extraites comprend un « Montant du paiement » étiquette, qui ne fait pas partie du tableau. Vous pouvez filtrer cela en vérifiant si la longueur de la ligne est inférieure à 7.
  • La dernière colonne de chaque ligne est une zone de texte de saisie qui nécessite un traitement spécial.

En suivant ces instructions étapes, vous pouvez analyser efficacement le tableau des tickets de parking de New York à l'aide de BeautifulSoup et extraire toutes les informations nécessaires à votre projet.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal