お見逃しなく: lxml セレクターでサポートされる機能を理解する-htmlチュートリアル-php.cn

お見逃しなく: lxml セレクターでサポートされる機能を理解する

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

リリース： 2024-01-13 11:40:19

オリジナル

1022 人が閲覧しました

lxml がサポートするセレクターを知りたいですか?見逃せないガイドです！

概要
セレクターは、Python の HTML または XML 解析に lxml を使用する場合に非常に重要な機能の 1 つです。セレクターを使用すると、開発者は CSS セレクターまたは XPath 式を通じて HTML または XML ドキュメントから特定の要素を選択できます。 lxml ライブラリは強力な解析機能を提供するだけでなく、さまざまなセレクターもサポートしているため、開発者はニーズに応じて適切なメソッドを柔軟に選択できます。

CSS セレクター
まず、lxml ライブラリでサポートされている CSS セレクターを見てみましょう。 CSS セレクターは、CSS スタイルに似た構文を使用して要素を選択する方法です。一般的に使用される CSS セレクターの例をいくつか示します。

タグ名で要素を選択します。

from lxml import etree

html = '''
<html>
  <body>
 <p>Hello, World!</p>
 <div>
   <p>lxml tutorial</p>
   <a href="https://www.example.com">example.com</a>
 </div>
  </body>
</html>
'''

tree = etree.HTML(html)
elements = tree.cssselect('p')

ログイン後にコピー

上記の例では、 要素 には、 タグを持つすべての要素が含まれます。

クラスセレクターによる要素の選択:
```
elements = tree.cssselect('.example')
```
ログイン後にコピー

上記の例では、.example によってすべてのクラスが選択されます。 exampleという名前。

ID セレクターで要素を選択:

element = tree.cssselect('#main')
````

在上面的示例中，`#main`将选择ID为`main`的元素。

XPath选择器
lxml库还支持XPath选择器，它是一种使用路径表达式语法来选择元素的方法。以下是一些常用的XPath选择器示例：

ログイン後にコピー

タグ名で要素を選択:
```
elements = tree.xpath('//p')
```
ログイン後にコピー
 上記の例では、 elements には、すべての  要素が含まれます。
属性セレクターによる要素の選択:
```
elements = tree.xpath('//a[@href="https://www.example.com"]')
```
ログイン後にコピー
 上記の例では、elements は href を持つすべての要素を選択します。属性値が https://www.example.com である <a> タグを持つ要素。
テキストコンテンツによる要素の選択:
```
element = tree.xpath('//p[contains(text(), "lxml tutorial")]')
```
ログイン後にコピー
 上記の例では、element はテキストコンテンツを含む要素を "lxml チュートリアルとして選択します。 タグの「」要素。
階層による要素の選択:

在上面的示例中，`elements`将选择所有在`<div>`元素下的子孙`<p>`元素。

总结

ログイン後にコピー

以上がお見逃しなく: lxml セレクターでサポートされる機能を理解するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。