So extrahieren Sie Werte aus dynamischen HTML-Inhalten mit Python
Beim Abrufen von Daten von Websites stößt man häufig auf dynamische Inhalte. Durch die Verwendung der Standardbibliotheken von Python, wie z. B. Anfragen, können Sie möglicherweise nicht auf diese Werte zugreifen, da sie zur Laufzeit geladen werden.
Lösungen für den Umgang mit dynamischen Inhalten
Zu Um diese Herausforderung zu meistern, ziehen Sie die folgenden Lösungen in Betracht:
Selenium zur Wertextraktion
Selenium bietet einen umfassenden Ansatz für die Handhabung dynamischer Inhalt. So verwenden Sie es:
Beispiel mit einer von „Lenkers“ gesteuerten Website
Stellen Sie sich eine Website vor, die „Lenkers“-Vorlagen verwendet. So extrahieren Sie den „Median“-Wert:
<code class="python">from bs4 import BeautifulSoup from selenium import webdriver driver = webdriver.Firefox() driver.get('http://eve-central.com/home/quicklook.html?typeid=34') html = driver.page_source soup = BeautifulSoup(html) for tag in soup.find_all("div", class_="priceContainer"): print tag.text</code>
Dieses Beispiel zeigt, wie Sie mit Selenium auf den gerenderten HTML-Code zugreifen und ihn mit BeautifulSoup analysieren.
Das obige ist der detaillierte Inhalt vonWie extrahiere ich dynamische HTML-Inhaltswerte mit Python?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!