Requests for Javascript-Enabled Pages
Requests est une puissante bibliothèque HTTP pour Python, mais elle a du mal à extraire le contenu de sites Web qui dépendent fortement sur JavaScript. En effet, JavaScript s'exécute généralement côté client, générant dynamiquement du contenu après le chargement initial de la page.
Solution : Requests-HTML
Heureusement, la communauté Requests a développé une solution : requêtes-html. Ce module ajoute des capacités de rendu JavaScript aux requêtes, vous permettant d'interagir avec des pages qui utilisent JavaScript.
Utilisation :
Pour utiliser Requests-HTML :
Rendu JavaScript :
Accès au contenu :
Après avoir rendu le JavaScript, vous pouvez accéder au contenu comme vous le feriez avec HTML normal. Par exemple :
<code class="python">r.html.find('#myElementID').text</code>
Cela renverra le contenu de l'élément HTML avec l'ID "myElementID".
Fonctionnalités supplémentaires :
Demandes -HTML enveloppe BeautifulSoup, vous permettant d'effectuer des actions supplémentaires telles que :
En utilisant Requests-HTML, vous pouvez facilement récupérer des données à partir de sites Web compatibles JavaScript sans sacrifier la simplicité et la puissance des Requests.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!