from bs4 import BeautifulSoup
from bs4 import UnicodeDammit
import requests
def run():
soup = requests.get('http://zy.upln.cn/gongshi2014/index.html').text
soup = BeautifulSoup(soup,'html.parser')
soup = soup.find('tbody')
for x in soup.find_all('tr'):
for y in x.find_all('td'):
s = y.a.text
print(s)
if __name__=="__main__":
run()
读取之后的内容不知道是不是gbk被当成UTF-8来处理了
求教
Ma suggestion personnelle est que lors de l'obtention de la réponse, analysez la chaîne selon le format d'encodage spécifié dans la réponse
Sortie
Bonjour ! J'ai également rencontré des problèmes similaires.
La solution est de changer print(s) en print(s.encode('latin1').decode('utf-8'))
Voici le résultat en cours :
Bonne chance !