84669 person learning
152542 person learning
20005 person learning
5487 person learning
7821 person learning
359900 person learning
3350 person learning
180660 person learning
48569 person learning
18603 person learning
40936 person learning
1549 person learning
1183 person learning
32909 person learning
单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教
拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...
如果你用的是beautifulsoup,lxml做解析器, 可以设置beautilfulsoup
soup = BeautifulSoup(html, from_encoding="gbk")
部分的文档
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#encoding
解析网页的话, bs4很好用的orz
把你的文本 .decode(encoding="gbk")输出试试
如果你用的是beautifulsoup,lxml做解析器, 可以设置beautilfulsoup
soup = BeautifulSoup(html, from_encoding="gbk")
部分的文档
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#encoding
解析网页的话, bs4很好用的orz
把你的文本 .decode(encoding="gbk")输出试试