BeautifulSoup：将顶级文本与经典标签查找功能相结合？

Question

我正在尝试使用BeautifulSoup从非统一结构的html块中提取信息。我正在寻找一种方法来组合搜索/过滤器输出中标签之间的文本块。例如，来自html：DescriptionSection1

line1
line2

P粉905144514 · Answer

要获得输出，您可以先选择，然后选择它的next_sibling。

示例

from bs4 import BeautifulSoup
html = '''

    Description
    Section1
    
        line1
        line2
        line3
    
    Section2
    Content2    

'''
soup = BeautifulSoup(html)

data = []

for e in soup.select('strong'):
    data.extend([e,e.next_sibling.strip()])

data

输出

[Description,
 'Section1',
 Section2,
 'Content2']