ホームページ > バックエンド開発 > Python チュートリアル > Python を使用して HTML を解析し、要素にアクセスするにはどうすればよいですか?

Python を使用して HTML を解析し、要素にアクセスするにはどうすればよいですか?

Linda Hamilton
リリース: 2024-12-13 22:27:15
オリジナル
847 人が閲覧しました

How Can I Parse HTML and Access Elements Using Python?

Python による HTML の解析

質問:

HTML 要素にアクセスして操作するにはどうすればよいですかPython パーサーを使用していますか? Firefox の「要素の検査」機能で表示されるネストされた構造に似た、構造化された形式でタグとそのコンテンツを取得できるモジュールが必要です。

答え:

BeautifulSoup

BeautifulSoup モジュールは、人気のある強力な Python ライブラリですHTML を解析するため。 HTML をネストされたデータ構造に変換して、HTML 要素に簡単にアクセスして移動できるようにします。

例:

指定した HTML ドキュメントを解析するには:

from bs4 import BeautifulSoup

html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>
ログイン後にコピー

「body」内の「container」div の内容を取得するにはtag:

print(parsed_html.body.find('div', attrs={'class':'container'}).text)
ログイン後にコピー

その他のオプション:

  • lxml: などの高度な機能をサポートする、高速で効率的な XML および HTML パーサーXPath として。
  • HTMLParser:基本的な HTML パーサーを提供する組み込み Python モジュール。

以上がPython を使用して HTML を解析し、要素にアクセスするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート