HTML mit Python analysieren
Frage:
Wie kann ich auf HTML-Elemente zugreifen und diese bearbeiten? mit einem Python-Parser? Ich benötige ein Modul, das es mir ermöglicht, Tags und ihren Inhalt in einem strukturierten Format abzurufen, ähnlich der verschachtelten Struktur, die in der Firefox-Funktion „Element prüfen“ angezeigt wird.
Antwort:
BeautifulSoup
Das BeautifulSoup-Modul ist eine beliebte und leistungsstarke Python-Bibliothek zum Parsen von HTML. Es kann HTML in eine verschachtelte Datenstruktur umwandeln, sodass Sie problemlos auf HTML-Elemente zugreifen und darin navigieren können.
Beispiel:
So analysieren Sie das von Ihnen bereitgestellte HTML-Dokument:
from bs4 import BeautifulSoup html = "<html><head>Heading</head><body attr1='val1'><div class='container'><div>
Um den Inhalt des „Container“-Div innerhalb des „Body“ abzurufen tag:
print(parsed_html.body.find('div', attrs={'class':'container'}).text)
Andere Optionen:
Das obige ist der detaillierte Inhalt vonWie kann ich mit Python HTML analysieren und auf Elemente zugreifen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!