Python爬虫的乱码问题？

Question

使用python实现模拟登陆并爬取返回页面的时候出现了乱码，目标网页的编码使用utf-8 相关代码： {代码...} 控制台输出信息： 第一次遇见这种乱码比较懵逼

PHPz · Answer

urllib2 tidak mengendalikan isu mampatan, anda perlu menggunakan gzip untuk nyahmampat, seperti ini

from StringIO import StringIO
import gzip

if response.info().get('Content-Encoding') == 'gzip':
    buf = StringIO(text)
    f = gzip.GzipFile(fileobj=buf)
    data = f.read()

Ringkasnya, urllib2 adalah tahap yang agak rendah, dan disyorkan untuk menggunakan permintaan