from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests
def run():
soup = requests.get('http://zy.upln.cn/gongshi2014/index.html').text
soup = BeautifulSoup(soup,'html.parser')
soup = soup.find('tbody')
for x in soup.find_all('tr'):
for y in x.find_all('td'):
s = y.a.text
print(s)
if __name__=="__main__":
run()
读取之后的内容不知道是不是gbk被当成UTF-8来处理了
求教
个人建议获取response时,按照response里指定的编码格式把字符串解析了
输出
你好!我也遇到过类似问题。
解决办法 print(s) 改为 print(s.encode('latin1').decode('utf-8'))即可
这是运行结果:
Good Luck!