from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests
def run():
soup = requests.get('http://zy.upln.cn/gongshi2014/index.html').text
soup = BeautifulSoup(soup,'html.parser')
soup = soup.find('tbody')
for x in soup.find_all('tr'):
for y in x.find_all('td'):
s = y.a.text
print(s)
if __name__=="__main__":
run()
读取之后的内容不知道是不是gbk被当成UTF-8来处理了
求教
個人建議取得response時,依照response裡指定的編碼格式把字串解析了
輸出
你好!我也遇到類似問題。
這是運行結果:解決方法print(s) 改為print(s.encode('latin1').decode('utf-8'))即可
這是運行結果:這是運行結果:
#🎜🎜 #
#🎜🎜# #🎜🎜#Good Luck!#🎜🎜#