首页 > 后端开发 > Python教程 > 如何修复 Pandas 读取 CSV 文件时出现的 UnicodeDecodeError 错误?

如何修复 Pandas 读取 CSV 文件时出现的 UnicodeDecodeError 错误?

Patricia Arquette
发布: 2025-01-03 21:45:40
原创
553 人浏览过

How Can I Fix Pandas' UnicodeDecodeError When Reading CSV Files?

使用 Pandas 读取 CSV 文件时遇到解码错误

将 CSV 文件读取到 Pandas 时会出现此问题,导致以下错误:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
登录后复制

根本原因往往是由于编码不一致CSV 文件。

解决方案

为了解决此错误,read_csv 函数提供了一个编码参数。通过指定适当的编码,您可以指示 Pandas 正确解释文件。常用的编码包括:

  • UTF-8:encoding = "utf-8"
  • ISO-8859-1:encoding = "ISO-8859-1"
  • Latin-1:编码=“拉丁”
  • Windows-1252:编码= "cp1252"

例如,如果 CSV 文件采用 ISO-8859-1 编码,则可以使用以下代码:

data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
登录后复制

确定正确的编码

如果您不确定正确的编码,您可以使用类似的工具enca 或 file 来分析文件:

  • enca:提供有关文件编码的详细报告。
  • 文件:显示文件的简要说明,包括其内容编码。

其他资源

  • [Pandas CSV 文档](https://pandas.pydata.org/docs/reference/api/ pandas.read_csv.html)
  • [Python CSV 文件示例](https://www.pythonprogramming.net/parse-csv-python-file/)
  • [Unicode 字符和编码](https://realpython.com/python-encodings-guide/)

以上是如何修复 Pandas 读取 CSV 文件时出现的 UnicodeDecodeError 错误?的详细内容。更多信息请关注PHP中文网其他相关文章!

来源:php.cn
本站声明
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
作者最新文章
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板