from lxml import etree html = ''' <html> <body> <p>Hello, World!</p> <div> <p>lxml tutorial</p> <a href="https://www.example.com">example.com</a> </div> </body> </html> ''' tree = etree.HTML(html) elements = tree.cssselect('p')
elements
將包含所有<p>
標籤的元素。 elements = tree.cssselect('.example')
.example
將選擇所有類名為example
的元素。 element = tree.cssselect('#main') ```` 在上面的示例中,`#main`将选择ID为`main`的元素。 XPath选择器 lxml库还支持XPath选择器,它是一种使用路径表达式语法来选择元素的方法。以下是一些常用的XPath选择器示例:
elements = tree.xpath('//p')
elements
將包含所有<p>
標籤的元素。 elements = tree.xpath('//a[@href="https://www.example.com"]')
elements
將選擇所有具有href
屬性值為https://www.example.com
的<a>
標籤的元素。 element = tree.xpath('//p[contains(text(), "lxml tutorial")]')
element
將選擇包含文字內容為"lxml tutorial "
的<p>
標籤的元素。 在上面的示例中,`elements`将选择所有在`<div>`元素下的子孙`<p>`元素。 总结
以上是不要錯過的指南:了解lxml選擇器支援的功能的詳細內容。更多資訊請關注PHP中文網其他相關文章!