python - Problème avec BeautifulSoup pour obtenir le contenu d'une page Web

Question

{code...} Code PYTHON : {code...} Mais le résultat renvoyé est vide. Ce sélecteur est-il mal écrit ?

某草草 · Answer

neirong=soup.find_all('p',class_='talk-article__body talk-transcript__body')

https://www.crummy.com/softwa...

阿神 · Answer

Référez-vous aux instructions données dans : https://www.crummy.com/softwa..., la bonne façon de l'utiliser est :
neirong=soup.find('p',class_='talk- article__body talk -transcript__body')neirong=soup.find('p',class_='talk-article__body talk-transcript__body')

为了获取p包含的内容，进一步调用neirong.contents

Afin d'obtenir le contenu contenu dans p, appelez ensuite neirong.contents🎜

怪我咯 · Answer

neirong = soup.select('.talk-article__body.talk-transcript__body')

怪我咯 · Answer

Le contenu que vous voyez depuis le navigateur est généré dynamiquement par js, et il ne peut pas être mis en correspondance avec bs. J'ai trouvé que les noms de classes étranges que j'ai vus étaient essentiellement générés par js

.

给我你的怀抱 · Answer

Utilisez find_all, find ne peut pas être utilisé pour la classe

曾经蜡笔没有小新 · Answer

Personnellement, je pense que lors de l'utilisation de BeautifulSoup pour analyser une page Web, si l'auteur envisage d'utiliser les fonctionnalités CSS pour positionner les éléments, il est préférable d'utiliser soup.select(). la classe comme paramètre. Vous pouvez également utiliser l'attribut de la balise comme paramètre, ce qui est très pratique. Il est préférable de l'utiliser pour rechercher une seule balise. En même temps, le paramètre prend en charge les chaînes de sélection CSS, telles que : soupe.select("#id > .class a.title")
soup.find() ne semble pas être beaucoup utilisée à l'heure actuelle. Je me demande si BeautifulSoup4 l'a dépréciée. Désormais, généralement, tant que find apparaît, il s'agit de find_all() et d'autres méthodes.
Pour plus de détails, veuillez vous référer au document chinois de "Super Soup" : http://beautifulsoup.readthed...