Le même code ne peut pas passer dans l'environnement Notepad (testé avec Notepad), mais peut passer dans Pycharm (Python3.5)
Code :
import urllib
import urllib.request
url = "http://www.baidu.com"
data = urllib.request.urlopen(url).read()
data = data.decode('UTF-8')
Cette déclaration peut être transmise dans les deux environnements
data.decode('gbk', 'ignore').encode('UTF-8')
print(data)
Affichez la page Web explorée dans Pycharm et affichez-la dans la fenêtre cmd
UnicodeEncodeError : le codec 'gbk' ne peut pas encoder le caractère 'xbb' en position 26830 :
séquence multi-octets illégale
Les caractères invalides doivent être supprimés.
import urllib
import urllib.request
url = "http://www.baidu.com"
data = urllib.request.urlopen(url).read()
data.decode('gbk', 'ignore').encode('UTF-8')
print(data)
Je peux vivre de cette façon, s'il te plaît explique-moi
Vous pouvez rencontrer le même problème d'encodage python que moi, ou le problème de support d'encodage du terminal que vous utilisez. Jetez un œil aux questions ci-dessous.
【Problème de codage Python ? 】Partagé depuis @SegmentFault, portail : /q/10...