84669 personnes étudient
152542 personnes étudient
20005 personnes étudient
5487 personnes étudient
7821 personnes étudient
359900 personnes étudient
3350 personnes étudient
180660 personnes étudient
48569 personnes étudient
18603 personnes étudient
40936 personnes étudient
1549 personnes étudient
1183 personnes étudient
32909 personnes étudient
单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教
拥有18年软件开发和IT教学经验。曾任多家上市公司技术总监、架构师、项目经理、高级软件工程师等职务。 网络人气名人讲师,...
如果你用的是beautifulsoup,lxml做解析器, 可以设置beautilfulsoup
soup = BeautifulSoup(html, from_encoding="gbk")
部分的文档
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#encoding
解析网页的话, bs4很好用的orz
把你的文本 .decode(encoding="gbk")输出试试
如果你用的是beautifulsoup,lxml做解析器, 可以设置beautilfulsoup
soup = BeautifulSoup(html, from_encoding="gbk")
部分的文档
https://www.crummy.com/software/BeautifulSoup/bs4/doc/#encoding
解析网页的话, bs4很好用的orz
把你的文本 .decode(encoding="gbk")输出试试