StaleElementException dans les itérations de Selenium
Lorsqu'ils tentent de parcourir les résultats de recherche sur Amazon à l'aide de Selenium, les utilisateurs peuvent rencontrer une StaleElementException lorsqu'ils font défiler à plusieurs reprises jusqu'à charger de nouvelles pages. Cette erreur se produit car l'élément utilisé pour le défilement, bottom_bar, devient invalide après le rechargement de la page.
Pour résoudre ce problème et permettre une pagination plus fiable, il est recommandé d'adopter une approche plus simple qui élimine le défilement explicite des pages. Au lieu de cela, Selenium peut cliquer en continu sur le bouton « Suivant » jusqu'à ce qu'il soit désactivé. Cela simplifie le code et garantit que le pilote peut naviguer de manière cohérente dans les résultats.
Le code mis à jour ci-dessous implémente cette approche :
from selenium.webdriver.common.by import By from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.support.ui import WebDriverWait as wait from selenium.common.exceptions import TimeoutException driver = webdriver.Chrome() driver.get('https://www.amazon.com/s/ref=nb_sb_noss_1?url=search-alias%3Daps&field-keywords=sonicare+toothbrush') while True: try: wait(driver, 10).until(EC.element_to_be_clickable((By.CSS_SELECTOR, 'a > span#pagnNextString'))).click() except TimeoutException: break
Notez qu'implicitly_wait(10) n'attend pas un 10 secondes complètes mais plutôt "attend jusqu'à 10 secondes pour qu'un élément apparaisse dans le DOM HTML". Par conséquent, si l'élément est trouvé dans un délai plus court (par exemple 1 ou 2 secondes), le processus d'attente est terminé.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!