Penggunaan ungkapan XPath dalam Python
XPath ialah bahasa yang digunakan untuk navigasi dan carian dalam dokumen XML dan HTML Ia digunakan secara meluas dalam pengikisan data, ujian automasi web, pengekstrakan teks dan medan lain. Dalam Python, kita boleh menggunakan perpustakaan lxml untuk menghuraikan dokumen XML dan HTML dan menggunakan ungkapan XPath untuk mencari dan mengekstrak data yang diperlukan.
pip install lxml
from lxml import etree
parser = etree.HTMLParser()
tree = etree.parse('example.html', parser)
xpath_expr = '//a'
nodes = tree.xpath(xpath_expr)
texts = [node.text for node in nodes] print(texts)
Berikut ialah contoh kod lengkap yang menunjukkan cara mengekstrak semua pautan daripada dokumen HTML:
from lxml import etree parser = etree.HTMLParser() tree = etree.parse('example.html', parser) xpath_expr = '//a' nodes = tree.xpath(xpath_expr) links = [node.get('href') for node in nodes] print(links)
Di atas digunakan dalam Python Penggunaan asas ekspresi XPath. Dengan menguasai sintaks XPath dan menggunakan perpustakaan lxml, kami boleh menghuraikan dan mengekstrak data dengan mudah daripada dokumen XML dan HTML, menyediakan alat yang berkuasa untuk tugas seperti analisis data dan rangkak web.
Saya harap artikel ini dapat membantu anda memahami dan menggunakan ungkapan XPath dalam Python. Saya doakan anda berjaya dalam pemprosesan data dan pembangunan web!
Atas ialah kandungan terperinci Penggunaan ungkapan XPath dalam Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!