Bagaimana untuk Mengekstrak Data Tiket Tempat Letak Kereta dari Laman Web NYC dengan BeautifulSoup?

Patricia Arquette
Lepaskan: 2024-10-27 00:57:30
asal
516 orang telah melayarinya

How to Extract Parking Ticket Data from a NYC Website with BeautifulSoup?

Menghuraikan Jadual HTML dengan Python's BeautifulSoup

Apabila bekerja dengan projek mengikis web, adalah penting untuk mengetahui cara menghuraikan jadual HTML dengan cekap. BeautifulSoup, perpustakaan Python yang popular, menawarkan cara yang berkesan untuk mengekstrak data daripada dokumen HTML. Dalam artikel ini, kami akan meneroka senario tertentu: menghuraikan jadual tiket letak kereta NYC menggunakan BeautifulSoup.

Masalah:

Untuk mempelajari permintaan Python dan perpustakaan BeautifulSoup, anda ditugaskan untuk menulis penghurai tiket letak kereta NYC yang mudah. Selepas menavigasi ke URL yang ditetapkan dan mendapatkan respons HTML, anda memerlukan bantuan mengekstrak semua tiket letak kereta yang disenaraikan dalam jadual HTML "lineItemsTable".

Cara Menghuraikan Jadual:

Kunci untuk menghurai jadual terletak pada penggunaan keupayaan menghurai jadual BeautifulSoup. Berikut ialah coretan kod Python yang disemak semula yang mencapai ini:

<code class="python">import requests
from bs4 import BeautifulSoup

plate = "T630134C"
plateRequest = requests.get(f"https://paydirect.link2gov.com/NYCParking-Plate/ItemSearch?PlateNumber={plate}")
soup = BeautifulSoup(plateRequest.text, "html.parser")

table = soup.find("table", {"class": "lineItemsTable"})
table_body = table.find("tbody")

rows = table_body.find_all("tr")
data = []
for row in rows:
    cols = row.find_all("td")
    cols = [col.text.strip() for col in cols]
    data.append([col for col in cols if col])</code>
Salin selepas log masuk

Nota Tambahan:

  • Baris terakhir dalam data yang diekstrak termasuk "Amaun Pembayaran" label, yang bukan sebahagian daripada jadual. Anda boleh menapis ini keluar dengan menyemak sama ada panjang baris kurang daripada 7.
  • Lajur terakhir dalam setiap baris ialah kotak teks input yang memerlukan pengendalian khas.

Dengan mengikuti ini langkah, anda boleh menghuraikan jadual tiket letak kereta NYC dengan berkesan menggunakan BeautifulSoup dan mengekstrak semua maklumat yang diperlukan untuk projek anda.

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Data Tiket Tempat Letak Kereta dari Laman Web NYC dengan BeautifulSoup?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!