网页爬虫 - Python:爬虫的中文编码问题?
ringa_lee
ringa_lee 2017-04-18 10:26:54
0
4
528

爬取中文网页后正则匹配出中文,得打UTF-8的编码字符

将其输出为.csv文件

在.CSV中显示为乱码

用记事本打开.csv又可以正常显示为中文

有没有大神指点是怎么一回事?怎样才能在Excel里直接看到中文?

ringa_lee
ringa_lee

ringa_lee

모든 응답(4)
Ty80

간단한 방법은 pandasto_excel 메서드를 사용하여 .xlsx 파일로 변환하는 것입니다. .xlsx의 기본 인코딩은 기본적으로 Excel을 지원하기 때문입니다. 물론 차이점은 그럴 수 없다는 것입니다. 메모장으로 열었습니다.

으아악

여기에는 테스트할 창이 없습니다. gb2312 또는 gbk으로 인코딩을 작성해 보세요.

테이블 파일 I/O의 경우 실제로 pandas가 더 편리합니다.

伊谢尔伦

abs1=abs1.decode().encode('gbk')

小葫芦

Excel은 기본적으로 GBK 인코딩을 사용합니다.

洪涛

새 Excel 파일을 만든 다음 텍스트에서 데이터를 클릭하여 csv 파일을 가져옵니다

최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿
회사 소개 부인 성명 Sitemap
PHP 중국어 웹사이트:공공복지 온라인 PHP 교육,PHP 학습자의 빠른 성장을 도와주세요!