python - BeautifulSoup的findall 可以传一个lambda函数 过滤出需要的链接吗?
PHP中文网
PHP中文网 2017-04-17 17:56:42
0
1
293
from bs4 import BeautifulSoup

 

html='''

<a class="vip_class fl font14" href="/site/baidu" target="_blank">baidu</a>
<a href="/site/google/
" target="_blank">google</a>
<a href="/mobile/list/?" target="_blank">android</a>
<a href="/mobile/list/?" target="_blank">ios</a>
'''


soup = BeautifulSoup(html,'lxml')

links=soup.findAll("a")
print(links)

比如只想找到 href对链接中有mobile关键字的 链接, 有没有办法在findAll中就取出来?

PHP中文网
PHP中文网

认证0级讲师

Antworte allen(1)
小葫芦

可以用2种方法:

alls = soup.findAll("a", href=re.compile("mobile"))#支持正则
# alls = soup.select("a[href*=\"mobile\"]")#第二种用css selector虽然不符合题主意思,但是一起说了

update:
成功截图:

Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage