atom中python使用pandas.read_table()打开文本中文乱码
黄舟
黄舟 2017-04-18 09:03:05
0
3
637

atom中使用python的pandas.read_table()打开编码为utf-8无bom格式的文档,然后使用atom的运行程序的包script运行以下代码:

# coding=utf-8
import pandas as pd
path = u'C:\\Users\\xilig\\Desktop\\北京-jd\\化妆师.txt'
print pd.read_csv(path, sep='|', header=None)

程序运行没有报错,但是结果是这样的:


而同样的程序在pycharm中运行却可以正常显示中文,这是为什么

黄舟
黄舟

人生最曼妙的风景,竟是内心的淡定与从容!

全部回复(3)
Ty80

同样的程序在pycharm中运行却可以正常显示中文
编码为utf-8无bom格式的文档

估计是cmd 编码的问题

Pycharm 进行了编码的处理应该, atom可能直接用了中文系统的cmd.

大家讲道理

我猜想你的txt文件是gbk的编码
两种办法:

一是修改你txt文本的编码为utf-8,不用改代码
二是指定编码方式
print pd.read_csv(path, sep='|', header=None, encoding='gbk')
大家讲道理

先转码吧,建议你先去了解一下文件编码相关的知识,这样才能有恃无恐
windows下用notepad++比较方便
Ubuntu iconv -f GBK -t UTF-8 sourceFile.txt -o outputFile.txt

http://manpages.ubuntu.com/manpages/precise/man1/iconv.1.html

热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责声明 Sitemap
PHP中文网:公益在线PHP培训,帮助PHP学习者快速成长!