Comment récupérer les valeurs d'un contenu HTML dynamique à l'aide de Python : un guide complet
Lorsque vous essayez de récupérer des données à partir de sites Web avec du contenu chargé dynamiquement à l'aide Python, vous pouvez rencontrer des difficultés lorsque le texte du modèle d'espace réservé récupéré remplace les valeurs réelles. Ce problème provient de l'incapacité des méthodes conventionnelles comme BeautifulSoup ou des requêtes à exécuter le rendu JavaScript qui crée les éléments dynamiques.
Pour résoudre ce problème, envisagez les solutions suivantes :
Application de Selenium et BeautifulSoup
Pour récupérer la « médiane " valeur du site Web fourni à l'aide de Selenium et BeautifulSoup, suivez ces étapes :
<code class="python">from bs4 import BeautifulSoup from selenium import webdriver driver = webdriver.Firefox() driver.get('URL_OF_PAGE') html = driver.page_source soup = BeautifulSoup(html) for tag in soup.find_all("class", "formatPrice median"): print(tag.text)</code>
Cette approche simulera une visite du navigateur sur le site Web, capturera le code HTML rendu et utilisera BeautifulSoup pour localiser et extraire la "médiane "valeur.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!