Extraire le texte de plusieurs éléments span sans classes - en utilisant BeautifulSoup

Question

Voici à quoi ressemble le code HTML : detail11detail2detail3< /p>

P粉041856955 · Answer

Dans votre cas, sélectionnez un élément plus spécifique, c'est-à-dire sélectionnez tous les éléments frères d'un élément avec un numéro de classe :

soup.select('span.number ~ span')

Exemple

from bs4 import BeautifulSoup
html='''
detail1
1
detail2
detail3
'''
soup = BeautifulSoup(html)

[t.text for t in soup.select('span.number ~ span')]

Sortie

['detail2', 'detail3']

P粉099145710 · Answer

Vous pouvez tout trouver et faire une indexation normale :

from bs4 import BeautifulSoup

html_doc = """\

detail1
1
detail2
detail3
"""

soup = BeautifulSoup(html_doc, "html.parser")

spans = soup.find("p", class_="details").find_all("span")

for s in spans[-2:]:
    print(s.text)

Résultat de sortie :

detail2
detail3

Ou utilisez les sélecteurs CSS :

spans = soup.select(".details span:nth-last-of-type(-n+2)")

for s in spans:
    print(s.text)

Résultat de sortie :

detail2
detail3