XPath は BeautifulSoup と統合できますか?
HTML 解析ライブラリである BeautifulSoup を使用すると、ユーザーは findAll などのメソッドを使用して特定のタグを取得できます。ただし、XPath 式はサポートされていません。
lxml を入力してください
lxml は代替ライブラリであり、XPath サポートを提供し、BeautifulSoup 互換モードを備えています。 lxml の標準 HTML パーサーは、壊れた HTML の処理において BeautifulSoup と同等のパフォーマンスを発揮し、より高速な処理を提供する可能性があります。
lxml の XPath 機能を使用するには:
lxml とリクエスト ライブラリを使用した例
import lxml.html import requests url = "http://www.example.com/servlet/av/ResultTemplate=AVResult.html" response = requests.get(url, stream=True) response.raw.decode_content = True tree = lxml.html.parse(response.raw) tree.xpath(xpathselector)
CSS セレクターlxml によるサポート
CSSSelector クラスは CSS を変換します構文を XPath 式に組み込み、特定の要素の検索を簡素化します。
from lxml.cssselect import CSSSelector td_empformbody = CSSSelector('td.empformbody') for elem in td_empformbody(tree): # Process found elements.
BeautifulSoup による CSS セレクター サポート
BeautifulSoup は、包括的な CSS セレクター サポートをネイティブに提供し、同じ機能を可能にします。 lxml の CSSSelector クラスとして:
for cell in soup.select('table#foobar td.empformbody'): # Process found elements.
以上がlxml の XPath 機能は BeautifulSoup と統合できますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。