python lxml解析gbk
高洛峰
高洛峰 2016-11-21 10:19:22
0
2
1329

单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教

高洛峰
高洛峰

拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...

reply all(2)
学霸

如果你用的是beautifulsoup,lxml做解析器, 可以设置beautilfulsoup

soup = BeautifulSoup(html, from_encoding="gbk")

部分的文档

https://www.crummy.com/software/BeautifulSoup/bs4/doc/#encoding

解析网页的话, bs4很好用的orz

三叔

把你的文本 .decode(encoding="gbk")输出试试

Latest Downloads
More>
Web Effects
Website Source Code
Website Materials
Front End Template