Menggunakan XPath dengan BeautifulSoup: A Tale of Two Libraries
Pustaka BeautifulSoup yang popular menyediakan kaedah yang mudah untuk menghuraikan HTML dan mengikis data. Walau bagaimanapun, ia secara asalnya tidak mempunyai keupayaan XPath, walaupun digunakan secara meluas dalam mengikis web.
Untuk menggunakan ungkapan XPath, pertimbangkan untuk menggunakan lxml, perpustakaan alternatif yang menawarkan keserasian BeautifulSoup dan sokongan penuh XPath 1.0. Begini cara menggunakan XPath dengan lxml:
from lxml import etree # Parse HTML tree = etree.parse(response, etree.HTMLParser()) # Search using XPath results = tree.xpath(xpathselector)
Jika anda memilih untuk mengelakkan kebergantungan luaran, BeautifulSoup menawarkan sokongan pemilih CSS. Ini membolehkan carian yang lebih ringkas dengan menterjemahkan pernyataan CSS ke dalam ungkapan XPath:
for cell in soup.select('table#foobar td.empformbody'): # Perform desired operations on table cells
Atas ialah kandungan terperinci Bolehkah saya Menggunakan XPath dengan BeautifulSoup?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!