lxml の XPath 機能は BeautifulSoup と統合できますか?-Python チュートリアル-php.cn

lxml の XPath 機能は BeautifulSoup と統合できますか?

Susan Sarandon

リリース： 2024-11-08 17:21:02

オリジナル

1103 人が閲覧しました

Can lxml's XPath Capabilities Integrate with BeautifulSoup?

XPath は BeautifulSoup と統合できますか?

HTML 解析ライブラリである BeautifulSoup を使用すると、ユーザーは findAll などのメソッドを使用して特定のタグを取得できます。ただし、XPath 式はサポートされていません。

lxml を入力してください

lxml は代替ライブラリであり、XPath サポートを提供し、BeautifulSoup 互換モードを備えています。 lxml の標準 HTML パーサーは、壊れた HTML の処理において BeautifulSoup と同等のパフォーマンスを発揮し、より高速な処理を提供する可能性があります。

lxml の XPath 機能を使用するには:

etree を使用して HTML ドキュメントを lxml ツリーに解析します。 .parse() メソッド。
Tree.xpath() メソッドを使用して、指定した XPath 式に一致する要素を取得します。

lxml とリクエストライブラリを使用した例

import lxml.html
import requests

url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html"
response = requests.get(url, stream=True)
response.raw.decode_content = True
tree = lxml.html.parse(response.raw)
tree.xpath(xpathselector)

ログイン後にコピー

CSS セレクターlxml によるサポート

CSSSelector クラスは CSS を変換します構文を XPath 式に組み込み、特定の要素の検索を簡素化します。

from lxml.cssselect import CSSSelector

td_empformbody = CSSSelector('td.empformbody')
for elem in td_empformbody(tree):
    # Process found elements.

ログイン後にコピー

BeautifulSoup による CSS セレクターサポート

BeautifulSoup は、包括的な CSS セレクターサポートをネイティブに提供し、同じ機能を可能にします。 lxml の CSSSelector クラスとして:

for cell in soup.select('table#foobar td.empformbody'):
    # Process found elements.

ログイン後にコピー

以上がlxml の XPath 機能は BeautifulSoup と統合できますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。