python3.x - python lxml解析gbk
PHP中文网
PHP中文网 2017-04-18 09:57:26
0
2
461

单刀直入,请问怎么用lxml解析gbk文件,可以直接传入gbk编码的xml不会报错,可是解析出来的文本也全是乱码没有用啊,求教

自用自答,不好好看官网文档真害人,文档中的解决方法贴一下:

parser = etree.XMLParser(encoding='gbk') #这里还可以传入很多参数来定制你的parser
tree = etree.parser(file, parser=parser)

可以解决读gbk的问题,lxml功能确实很强大,建议大家使用前先大致看看文档吧,能省很多时间的,谢谢大家的作答!希望上面的代码可以帮到大家

PHP中文网
PHP中文网

认证高级PHP讲师

모든 응답(2)
阿神

텍스트 .decode(encoding="gbk")를 출력해 보세요

迷茫

Beautifulsoup과 lxml을 파서로 사용하는 경우 beautifulsoup를 설정할 수 있습니다

soup = BeautifulSoup(html, from_encoding="gbk")

Beautifulsoup 인코딩 부분 문서

웹페이지를 구문 분석할 때 bs4가 매우 유용합니다. orz

bs를 사용하여 xml 구문 분석: http://www.cnblogs.com/liulix...

찾은 내용: https://segmentfault.com/a/11...
시도해볼 수 있습니다

최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!