Pour lire des éléments de page Web à l'aide de Python, suivez ces étapes : Importez le pilote Web depuis la bibliothèque Selenium. Lancez un navigateur tel que Chrome Driver. Utilisez les méthodes find_element_by_* pour rechercher des éléments de page Web. Utilisez element.text pour lire le texte de l'élément. Utilisez element.get_attribute() pour lire les attributs des éléments. Utilisez element.location et element.size pour lire la position et la taille de l'élément.
Guide de lecture des éléments Web
La lecture des éléments de page Web est une tâche critique pour l'automatisation de sites Web et l'extraction de données. Cet article vous expliquera comment lire le texte, les attributs et la position des éléments de page Web à l'aide de Python et Selenium.
Importez les bibliothèques nécessaires
from selenium import webdriver
Lancez le navigateur
driver = webdriver.Chrome() # 或其他浏览器驱动程序
Trouver des éléments de page Web
Utilisez la méthode find_element_by_*
de Selenium pour rechercher des éléments : find_element_by_*
方法查找元素:
find_element_by_id("my_id")
find_element_by_name("my_name")
find_element_by_class_name("my_class")
find_element_by_xpath("//element/path")
find_element_by_name("my_name")
find_element_by_class_name("my_class")
find_element_by_xpath("//element/path")
Lire le texte de l'élément
text = element.text
Lire les attributs de l'élément
value = element.get_attribute("attribute_name")
Lire la position de l'élément
location = element.location # 返回 {x, y} 坐标 size = element.size # 返回 {width, height}
Cas pratique
Extraire les titres et classements des films du site IMDb : 🎜
# 打开 IMDb 网站 driver.get("https://www.imdb.com/") # 获取前 10 部电影的标题和评分 titles = [] ratings = [] for i in range(1, 11): # 查找标题元素 title_element = driver.find_element_by_xpath(f"(//h3)[{i}]/a") # 读标题 title = title_element.text # 查找评分元素 rating_element = driver.find_element_by_xpath(f"(//strong)[{i}]") # 读评分 rating = rating_element.text titles.append(title) ratings.append(rating) # 打印结果 for title, rating in zip(titles, ratings): print(f"{title}: {rating}")
The Shawshank Redemption: 9.3 The Godfather: 9.2 The Dark Knight: 9.0 Schindler's List: 9.0 12 Angry Men: 9.0 ...
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!