Menghuraikan Jadual HTML dengan Python's BeautifulSoup
Apabila bekerja dengan projek mengikis web, adalah penting untuk mengetahui cara menghuraikan jadual HTML dengan cekap. BeautifulSoup, perpustakaan Python yang popular, menawarkan cara yang berkesan untuk mengekstrak data daripada dokumen HTML. Dalam artikel ini, kami akan meneroka senario tertentu: menghuraikan jadual tiket letak kereta NYC menggunakan BeautifulSoup.
Masalah:
Untuk mempelajari permintaan Python dan perpustakaan BeautifulSoup, anda ditugaskan untuk menulis penghurai tiket letak kereta NYC yang mudah. Selepas menavigasi ke URL yang ditetapkan dan mendapatkan respons HTML, anda memerlukan bantuan mengekstrak semua tiket letak kereta yang disenaraikan dalam jadual HTML "lineItemsTable".
Cara Menghuraikan Jadual:
Kunci untuk menghurai jadual terletak pada penggunaan keupayaan menghurai jadual BeautifulSoup. Berikut ialah coretan kod Python yang disemak semula yang mencapai ini:
<code class="python">import requests from bs4 import BeautifulSoup plate = "T630134C" plateRequest = requests.get(f"https://paydirect.link2gov.com/NYCParking-Plate/ItemSearch?PlateNumber={plate}") soup = BeautifulSoup(plateRequest.text, "html.parser") table = soup.find("table", {"class": "lineItemsTable"}) table_body = table.find("tbody") rows = table_body.find_all("tr") data = [] for row in rows: cols = row.find_all("td") cols = [col.text.strip() for col in cols] data.append([col for col in cols if col])</code>
Nota Tambahan:
Dengan mengikuti ini langkah, anda boleh menghuraikan jadual tiket letak kereta NYC dengan berkesan menggunakan BeautifulSoup dan mengekstrak semua maklumat yang diperlukan untuk projek anda.
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Data Tiket Tempat Letak Kereta dari Laman Web NYC dengan BeautifulSoup?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!