使用 Pandas 读取 CSV 文件时遇到解码错误
将 CSV 文件读取到 Pandas 时会出现此问题,导致以下错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
根本原因往往是由于编码不一致CSV 文件。
解决方案
为了解决此错误,read_csv 函数提供了一个编码参数。通过指定适当的编码,您可以指示 Pandas 正确解释文件。常用的编码包括:
例如,如果 CSV 文件采用 ISO-8859-1 编码,则可以使用以下代码:
data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
确定正确的编码
如果您不确定正确的编码,您可以使用类似的工具enca 或 file 来分析文件:
其他资源
以上是如何修复 Pandas 读取 CSV 文件时出现的 UnicodeDecodeError 错误?的详细内容。更多信息请关注PHP中文网其他相关文章!