from lxml import etree html = ''' <html> <body> <p>Hello, World!</p> <div> <p>lxml tutorial</p> <a href="https://www.example.com">example.com</a> </div> </body> </html> ''' tree = etree.HTML(html) elements = tree.cssselect('p')
要素
には、<p>
タグを持つすべての要素が含まれます。 elements = tree.cssselect('.example')
.example
によってすべてのクラスが選択されます。 example
という名前。 element = tree.cssselect('#main') ```` 在上面的示例中,`#main`将选择ID为`main`的元素。 XPath选择器 lxml库还支持XPath选择器,它是一种使用路径表达式语法来选择元素的方法。以下是一些常用的XPath选择器示例:
elements = tree.xpath('//p')
elements
には、すべての <p>
要素が含まれます。 elements = tree.xpath('//a[@href="https://www.example.com"]')
elements
は href
を持つすべての要素を選択します。属性値が https://www.example.com
である <a>
タグを持つ要素。 element = tree.xpath('//p[contains(text(), "lxml tutorial")]')
element
はテキスト コンテンツを含む要素を "lxml チュートリアルとして選択します。
<p> タグの「
」要素。 在上面的示例中,`elements`将选择所有在`<div>`元素下的子孙`<p>`元素。 总结
以上がお見逃しなく: lxml セレクターでサポートされる機能を理解するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。