python3.x - python lxml解析gbk-PHP中文網路問答

社群學習工具庫休閒

繁体中文

python3.x - python lxml解析gbk

PHP中文网 2017-04-18 09:57:26

0

2

489

单刀直入，请问怎么用lxml解析gbk文件，可以直接传入gbk编码的xml不会报错，可是解析出来的文本也全是乱码没有用啊，求教

自用自答，不好好看官网文档真害人，文档中的解决方法贴一下：

parser = etree.XMLParser(encoding='gbk') #这里还可以传入很多参数来定制你的parser
tree = etree.parser(file, parser=parser)

可以解决读gbk的问题，lxml功能确实很强大，建议大家使用前先大致看看文档吧，能省很多时间的，谢谢大家的作答！希望上面的代码可以帮到大家

PHP中文网

认证高级PHP讲师

全部回覆(2)

阿神2017-04-18 09:59:26 2樓

把你的文字 .decode(encoding="gbk")輸出試試看

點贊 +0

新增回覆

迷茫2017-04-18 09:59:26 1樓

如果你用的是beautifulsoup，lxml做解析器, 可以設定beautilfulsoup

soup = BeautifulSoup(html, from_encoding="gbk")

beautifulsoup encoding部分的文件

解析網頁的話, bs4很好用的orz

使用bs解析xml: http://www.cnblogs.com/liulix...

發現了這個: https://segmentfault.com/a/11...
你可以試試看

點贊 +0

新增回覆

熱門專題

更多>

熱門文章

熱門教學

更多>

相關教學

熱門推薦

最新課程

最新ThinkPHP 5.1全球首發影片教學(60天成就PHP大牛線上訓練課程)

1424540
php入門教程之一週學會PHP

4271003
JAVA 初級入門影片教學

2550509

最新下載

更多>

網站特效

網站源碼

網站素材

前端模板