python - 正则表达式匹配html的问题。

Question

{代码...}

黄舟 · Answer

Puisque vous avez utilisé bs4 pour l'analyser, pourquoi ne pas l'utiliser pour l'extraire ?
Il existe une fonction stripped_string dans bs4 qui répond simplement à vos besoins.

大家讲道理 · Answer

import re
pattern = re.compile(r'.*?(.*?)', re.S)
str = '''
  
    中文
    
    中文
  
  中文内容  #需要抓取的内容
'''
print(pattern.search(str).group(1))


===> 中文内容  #需要抓取的内容

PHP中文网 · Answer

const re = /^\<\/span\>(.*)\<\/dd\>$/

Est-ce que ça va ?