from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests
def run():
soup = requests.get('http://zy.upln.cn/gongshi2014/index.html').text
soup = BeautifulSoup(soup,'html.parser')
soup = soup.find('tbody')
for x in soup.find_all('tr'):
for y in x.find_all('td'):
s = y.a.text
print(s)
if __name__=="__main__":
run()
读取之后的内容不知道是不是gbk被当成UTF-8来处理了
求教
Cadangan peribadi saya ialah apabila mendapatkan respons, huraikan rentetan mengikut format pengekodan yang dinyatakan dalam respons
Output
Hello! Saya juga pernah mengalami masalah yang sama.
Penyelesaiannya ialah menukar cetakan kepada mencetak(s.encode('latin1').decode('utf-8'))
Ini ialah hasil larian:
Semoga Berjaya!