如何使用 Python 解析 HTML 並存取元素？-Python教學-PHP中文網

如何使用 Python 解析 HTML 並存取元素？

Linda Hamilton

發布： 2024-12-13 22:27:15

原創

882 人瀏覽過

How Can I Parse HTML and Access Elements Using Python?

使用Python 解析HTML

問題：

問題：

如何存取🎜>問題：

如何存取元素和操作元素解析器？我需要一個模組，允許我以結構化格式取得標籤及其內容，類似於 Firefox 的「檢查元素」功能中顯示的嵌套結構。

答案：

BeautifulSoup

BeautifulSoup 模組是一個流行且功能強大的模組用於解析。它可以將 HTML 轉換為嵌套資料結構，使您可以輕鬆存取和導航 HTML 元素。

from bs4 import BeautifulSoup

html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>

登入後複製

範例：

print(parsed_html.body.find('div', attrs={'class':'container'}).text)

登入後複製

解析您提供的 HTML 文件：

lxml: 快速且有效率的XML 和HTML 解析器，支援進階功能，例如作為XPath。 HTMLParser: A內建 Python 模組，提供基本的 HTML 解析器。

以上是如何使用 Python 解析 HTML 並存取元素？的詳細內容。更多資訊請關注PHP中文網其他相關文章！