BeautifulSoup: Gabungkan teks peringkat atas dengan fungsi carian teg klasik?

Question

Saya cuba menggunakan BeautifulSoup untuk mengekstrak maklumat daripada blok html berstruktur tidak seragam. Saya sedang mencari cara untuk menggabungkan blok teks antara tag dalam output carian/penapis. Contohnya, daripada html: PeneranganBahagian1

baris1
baris2

P粉905144514 · Answer

Untuk mendapatkan output, anda boleh pilih ，然后选择它的next_sibling dahulu.

Contoh

from bs4 import BeautifulSoup
html = '''

    Description
    Section1
    
        line1
        line2
        line3
    
    Section2
    Content2    

'''
soup = BeautifulSoup(html)

data = []

for e in soup.select('strong'):
    data.extend([e,e.next_sibling.strip()])

data

Output

[Description,
 'Section1',
 Section2,
 'Content2']