python3.x - python lxml解析gbk
PHP中文网
PHP中文网 2017-04-18 09:57:26
0
2
463

单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教

自用自答,不好好看官网文档真害人,文档中的解决方法贴一下:

parser = etree.XMLParser(encoding='gbk') #这里还可以传入很多参数来定制你的parser
tree = etree.parser(file, parser=parser)

可以解决读gbk的问题,lxml功能确实很强大,建议大家使用前先大致看看文档吧,能省很多时间的,谢谢大家的作答!希望上面的代码可以帮到大家

PHP中文网
PHP中文网

认证高级PHP讲师

répondre à tous(2)
阿神

Essayez d'afficher votre texte .decode(encoding="gbk")

迷茫

Si vous utilisez beautifulsoup et lxml comme analyseur, vous pouvez définir beautifulsoup

soup = BeautifulSoup(html, from_encoding="gbk")

Documentation de la partie encodage de beautifulsoup

Pour analyser des pages Web, bs4 est très utile orz

Utilisez bs pour analyser XML : http://www.cnblogs.com/liulix...

J'ai trouvé ceci : https://segmentfault.com/a/11...
Vous pouvez l'essayer

Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!