Maison > interface Web > js tutoriel > Guide de lecture des éléments d'une page Web

Guide de lecture des éléments d'une page Web

WBOY
Libérer: 2024-04-09 12:39:02
original
1230 Les gens l'ont consulté

Pour lire des éléments de page Web à l'aide de Python, suivez ces étapes : Importez le pilote Web depuis la bibliothèque Selenium. Lancez un navigateur tel que Chrome Driver. Utilisez les méthodes find_element_by_* pour rechercher des éléments de page Web. Utilisez element.text pour lire le texte de l'élément. Utilisez element.get_attribute() pour lire les attributs des éléments. Utilisez element.location et element.size pour lire la position et la taille de l'élément.

Guide de lecture des éléments dune page Web

Guide de lecture des éléments Web

La lecture des éléments de page Web est une tâche critique pour l'automatisation de sites Web et l'extraction de données. Cet article vous expliquera comment lire le texte, les attributs et la position des éléments de page Web à l'aide de Python et Selenium.

Importez les bibliothèques nécessaires

from selenium import webdriver
Copier après la connexion

Lancez le navigateur

driver = webdriver.Chrome()  # 或其他浏览器驱动程序
Copier après la connexion

Trouver des éléments de page Web

Utilisez la méthode find_element_by_* de Selenium pour rechercher des éléments : find_element_by_* 方法查找元素:

  • find_element_by_id("my_id")
  • find_element_by_name("my_name")
  • find_element_by_class_name("my_class")
  • find_element_by_xpath("//element/path")
    • < code>find_element_by_id("my_id")
    • find_element_by_name("my_name")
  • find_element_by_class_name("my_class")

  • find_element_by_xpath("//element/path")

    Lire le texte de l'élément

    text = element.text
    Copier après la connexion

    Lire les attributs de l'élément

    value = element.get_attribute("attribute_name")
    Copier après la connexion

    Lire la position de l'élément

    location = element.location  # 返回 {x, y} 坐标
    size = element.size  # 返回 {width, height}
    Copier après la connexion

    Cas pratique

    Extraire les titres et classements des films du site IMDb : 🎜
    # 打开 IMDb 网站
    driver.get("https://www.imdb.com/")
    
    # 获取前 10 部电影的标题和评分
    titles = []
    ratings = []
    for i in range(1, 11):
        # 查找标题元素
        title_element = driver.find_element_by_xpath(f"(//h3)[{i}]/a")
        # 读标题
        title = title_element.text
    
        # 查找评分元素
        rating_element = driver.find_element_by_xpath(f"(//strong)[{i}]")
        # 读评分
        rating = rating_element.text
    
        titles.append(title)
        ratings.append(rating)
    
    # 打印结果
    for title, rating in zip(titles, ratings):
        print(f"{title}: {rating}")
    Copier après la connexion
    🎜Cela affichera des résultats similaires à : 🎜
    The Shawshank Redemption: 9.3
    The Godfather: 9.2
    The Dark Knight: 9.0
    Schindler's List: 9.0
    12 Angry Men: 9.0
    ...
    Copier après la connexion

    Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Étiquettes associées:
source:php.cn
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal