Jadual Parsing Python BeautifulSoup: Panduan Komprehensif
Apabila mengekstrak data daripada jadual HTML menggunakan BeautifulSoup Python, memahami cara menghuraikan susun atur jadual tertentu ialah penting. Dalam senario ini, cabarannya terletak pada menghuraikan "lineItemsTable" daripada tapak web tiket letak kereta.
Untuk mengekstrak tiket, ikut langkah berikut:
<code class="python"># Retrieve the table element table = soup.find("table", {"class": "lineItemsTable"}) # Initialize an empty list to store the tickets data = [] # Iterate over each row in the table for row in table.findAll("tr"): # Extract each cell in the row cells = row.findAll("td") # Clean the cell data and store it in a list cells = [cell.text.strip() for cell in cells] # If the row contains valid data, append it to the list if cells: data.append([cell for cell in cells if cell])</code>
Pendekatan ini menghasilkan senarai senarai, di mana setiap senarai dalaman mewakili data daripada satu baris tiket, tidak termasuk nilai kosong. Berikut ialah contoh output:
[[u'1359711259', u'SRF', u'08/05/2013', u'5310 4 AVE', u'K', u'19', u'125.00', u'$'], [u'7086775850', u'PAS', u'12/14/2013', u'3908 6th Ave', u'K', u'40', u'125.00', u'$'], [u'7355010165', u'OMT', u'12/14/2013', u'3908 6th Ave', u'K', u'40', u'145.00', u'$'], [...]]
Nota Tambahan:
Atas ialah kandungan terperinci Cara Mengekstrak Data daripada Jadual HTML menggunakan Python BeautifulSoup: Panduan Komprehensif untuk Menghuraikan Tiket Tempat Letak Kereta?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!