84669 orang belajar
152542 orang belajar
20005 orang belajar
5487 orang belajar
7821 orang belajar
359900 orang belajar
3350 orang belajar
180660 orang belajar
48569 orang belajar
18603 orang belajar
40936 orang belajar
1549 orang belajar
1183 orang belajar
32909 orang belajar
我想爬取每个电影的制片国家地区,但是它上面并不在一个标签里面应该怎么办我用的是request和BeautifulSoup
res2=requests.get(h2) res2.encoding='utf-8' soup2=BeautifulSoup(res2.text)
这部分是已经获取该网页
认证0级讲师
Rujuk kod berikut:
#!/usr/bin/env python # -*- coding:utf-8 -*- import re import requests from bs4 import BeautifulSoup result = requests.get('https://movie.douban.com/subject/3541415/') result.encoding = 'utf-8' soup = BeautifulSoup(result.text, 'html.parser') try: info = soup.select('#info')[0] print re.findall(ur'(?<=制片国家/地区: ).+?(?=\n)', info.text)[0] except Exception, e: print e
biasa padan dengan kandungan antara </span> dan <br>.
</span>
<br>
1. Anda boleh menggunakan ungkapan biasa
2. Adalah disyorkan untuk menggunakan sup.find_all untuk membaca dokumen
https://www.crummy.com/softwa...
soup.find_all("title") # [<title>The Dormouse's story</title>] soup.find_all("p", "title") # [<p class="title"><b>The Dormouse's story</b></p>] soup.find_all("a") # [<a class="sister" href="http://example.com/elsie" id="link1">Elsie</a>, # <a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>, # <a class="sister" href="http://example.com/tillie" id="link3">Tillie</a>] soup.find_all(id="link2") # [<a class="sister" href="http://example.com/lacie" id="link2">Lacie</a>]
Jawapan Huang Ge Python
Rujuk kod berikut:
biasa padan dengan kandungan antara
</span>
dan<br>
.1. Anda boleh menggunakan ungkapan biasa
2. Adalah disyorkan untuk menggunakan sup.find_all
untuk membaca dokumen
https://www.crummy.com/softwa...
Jawapan Huang Ge Python