84669 orang belajar
152542 orang belajar
20005 orang belajar
5487 orang belajar
7821 orang belajar
359900 orang belajar
3350 orang belajar
180660 orang belajar
48569 orang belajar
18603 orang belajar
40936 orang belajar
1549 orang belajar
1183 orang belajar
32909 orang belajar
<dd class="gray6"> <span class="gray6"> 中文 <span class="padl27"></span> 中文 </span> 中文内容 #需要抓取的内容 </dd> 用BeautifulSoup html.parser解析的网页,现在用re模块想抓取**第7行**的中文内容,放在一个组里面(.*?)。正则老是匹配不上,用换行符也匹配不上,不知道怎么写了。。。
拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...
Memandangkan anda telah menggunakan bs4 untuk menganalisisnya, mengapa tidak menggunakannya untuk mengekstraknya? Terdapat fungsi stripped_string dalam bs4 yang hanya memenuhi keperluan anda.
import re pattern = re.compile(r'</span>.*?</span>(.*?)</dd>', re.S) str = '''<dd class="gray6"> <span class="gray6"> 中文 <span class="padl27"></span> 中文 </span> 中文内容 #需要抓取的内容 </dd>''' print(pattern.search(str).group(1)) ===> 中文内容 #需要抓取的内容
const re = /^\<\/span\>(.*)\<\/dd\>$/
Adakah ini okay?
Memandangkan anda telah menggunakan bs4 untuk menganalisisnya, mengapa tidak menggunakannya untuk mengekstraknya?
Terdapat fungsi stripped_string dalam bs4 yang hanya memenuhi keperluan anda.
Adakah ini okay?