from lxml import etree html = ''' <html> <body> <p>Hello, World!</p> <div> <p>lxml tutorial</p> <a href="https://www.example.com">example.com</a> </div> </body> </html> ''' tree = etree.HTML(html) elements = tree.cssselect('p')
éléments
contiendront tous les <p>< /code > élément de balise. <code>elements
将包含所有<p>
标签的元素。elements = tree.cssselect('.example')
.example
将选择所有类名为example
的元素。element = tree.cssselect('#main') ```` 在上面的示例中,`#main`将选择ID为`main`的元素。 XPath选择器 lxml库还支持XPath选择器,它是一种使用路径表达式语法来选择元素的方法。以下是一些常用的XPath选择器示例:
elements = tree.xpath('//p')
elements
将包含所有<p>
标签的元素。elements = tree.xpath('//a[@href="https://www.example.com"]')
elements
将选择所有具有href
属性值为https://www.example.com
的<a>
标签的元素。element = tree.xpath('//p[contains(text(), "lxml tutorial")]')
element
将选择包含文本内容为"lxml tutorial"
的<p>
在上面的示例中,`elements`将选择所有在`<div>`元素下的子孙`<p>`元素。 总结
.example
sélectionnera toutes les classes nommées élément example code> .
elements
contiendront tous <p>. 🎜🎜🎜🎜Sélectionner les éléments via le sélecteur d'attribut : 🎜rrreee🎜 Dans l'exemple ci-dessus, elements
sélectionnera tous les éléments qui ont la valeur d'attribut href
comme https:/ / Élément de la balise <a>
de www.example.com
. 🎜🎜🎜🎜Sélectionnez l'élément par le contenu du texte : 🎜rrreee🎜 Dans l'exemple ci-dessus, element
sélectionnera "tutoriel lxml"
. élément de la balise p>. 🎜🎜🎜🎜Sélectionnez les éléments par hiérarchie : 🎜🎜🎜rrreee
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!