Référez-vous aux instructions données dans : https://www.crummy.com/softwa..., la bonne façon de l'utiliser est : neirong=soup.find('p',class_='talk- article__body talk -transcript__body')neirong=soup.find('p',class_='talk-article__body talk-transcript__body')
为了获取p包含的内容,进一步调用neirong.contents
Afin d'obtenir le contenu contenu dans p, appelez ensuite neirong.contents🎜
Le contenu que vous voyez depuis le navigateur est généré dynamiquement par js, et il ne peut pas être mis en correspondance avec bs. J'ai trouvé que les noms de classes étranges que j'ai vus étaient essentiellement générés par js
Personnellement, je pense que lors de l'utilisation de BeautifulSoup pour analyser une page Web, si l'auteur envisage d'utiliser les fonctionnalités CSS pour positionner les éléments, il est préférable d'utiliser soup.select(). la classe comme paramètre. Vous pouvez également utiliser l'attribut de la balise comme paramètre, ce qui est très pratique. Il est préférable de l'utiliser pour rechercher une seule balise. En même temps, le paramètre prend en charge les chaînes de sélection CSS, telles que : soupe.select("#id > .class a.title")
.
La méthode
soup.find() ne semble pas être beaucoup utilisée à l'heure actuelle. Je me demande si BeautifulSoup4 l'a dépréciée. Désormais, généralement, tant que find apparaît, il s'agit de find_all() et d'autres méthodes. Pour plus de détails, veuillez vous référer au document chinois de "Super Soup" : http://beautifulsoup.readthed...
https://www.crummy.com/softwa...
Référez-vous aux instructions données dans : https://www.crummy.com/softwa..., la bonne façon de l'utiliser est :
neirong=soup.find('p',class_='talk- article__body talk -transcript__body')
neirong=soup.find('p',class_='talk-article__body talk-transcript__body')
为了获取
Afin d'obtenir le contenu contenu dansp
包含的内容,进一步调用neirong.contents
p
, appelez ensuiteneirong.contents
🎜Le contenu que vous voyez depuis le navigateur est généré dynamiquement par js, et il ne peut pas être mis en correspondance avec bs. J'ai trouvé que les noms de classes étranges que j'ai vus étaient essentiellement générés par js
.Utilisez find_all, find ne peut pas être utilisé pour la classe
Personnellement, je pense que lors de l'utilisation de BeautifulSoup pour analyser une page Web, si l'auteur envisage d'utiliser les fonctionnalités CSS pour positionner les éléments, il est préférable d'utiliser soup.select(). la classe comme paramètre. Vous pouvez également utiliser l'attribut de la balise comme paramètre, ce qui est très pratique. Il est préférable de l'utiliser pour rechercher une seule balise. En même temps, le paramètre prend en charge les chaînes de sélection CSS, telles que : soupe.select("#id > .class a.title")
soup.find() ne semble pas être beaucoup utilisée à l'heure actuelle. Je me demande si BeautifulSoup4 l'a dépréciée. Désormais, généralement, tant que find apparaît, il s'agit de find_all() et d'autres méthodes.
Pour plus de détails, veuillez vous référer au document chinois de "Super Soup" : http://beautifulsoup.readthed...