Kod yang sama tidak boleh lulus dalam persekitaran Notepad (diuji dengan Notepad), tetapi boleh lulus dalam Pycharm (Python3.5)
Kod:
import urllib
import urllib.request
url = "http://www.baidu.com"
data = urllib.request.urlopen(url).read()
data = data.decode('UTF-8')
Pernyataan ini boleh diluluskan dalam kedua-dua persekitaran
data.decode('gbk', 'ignore').encode('UTF-8')
print(data)
Paparkan halaman web yang dirangkak dalam Pycharm dan paparkannya dalam tetingkap cmd
UnicodeEncodeError: codec 'gbk' tidak boleh mengekod aksara 'xbb' dalam kedudukan 26830:
jujukan multibait haram
Aksara tidak sah mesti dialih keluar.
import urllib
import urllib.request
url = "http://www.baidu.com"
data = urllib.request.urlopen(url).read()
data.decode('gbk', 'ignore').encode('UTF-8')
print(data)
Saya boleh hidup begini, tolong jelaskan
Anda mungkin menghadapi masalah pengekodan python yang sama seperti saya, atau masalah sokongan pengekodan terminal yang anda gunakan. Lihat soalan di bawah.
【Masalah pengekodan python? 】Dikongsi daripada @SegmentFault, portal: /q/10...