网页爬虫 - python中使用lxml解析中文网页出现编码问题，如何解决？

Question

问题 爬取IT之家网页http://it.ithome.com/category...在使用requests.get得到网页后用lxml解析，但是打印出来后中文无法正常显示，而打印requests.get得到的内容却可以正常显示。求原因及解决方法（BeautifulSou...

PHPz · Answer

Tambahkan parameter pengekodan pada ayat ini

result = etree.tostring(html, encoding="gb2312", pretty_print=True, method="html")

Saya menggunakan Windows, jadi saya menggunakan gb2312, dan ujian boleh dipaparkan seperti biasa Jika anda menggunakan Linux, tukarkannya kepada utf-8

问题

代码

输出结果