BeautifulSoup：將頂級文字與經典標籤查找功能結合？

Question

我正在嘗試使用BeautifulSoup從非統一結構的html區塊中提取資訊。我正在尋找一種方法來組合搜尋/過濾器輸出中標籤之間的文字區塊。例如，來自html：DescriptionSection1

line1
line2

P粉905144514 · Answer

要獲得輸出，您可以先選擇，然後選擇它的next_sibling。

範例

from bs4 import BeautifulSoup
html = '''

    Description
    Section1
    
        line1
        line2
        line3
    
    Section2
    Content2    

'''
soup = BeautifulSoup(html)

data = []

for e in soup.select('strong'):
    data.extend([e,e.next_sibling.strip()])

data

輸出

[Description,
 'Section1',
 Section2,
 'Content2']