ホームページ > バックエンド開発 > Python チュートリアル > CSV ファイルを読み取るときに発生する Pandas の UnicodeDecodeError を修正するにはどうすればよいですか?

CSV ファイルを読み取るときに発生する Pandas の UnicodeDecodeError を修正するにはどうすればよいですか?

Patricia Arquette
リリース: 2025-01-03 21:45:40
オリジナル
612 人が閲覧しました

How Can I Fix Pandas' UnicodeDecodeError When Reading CSV Files?

Pandas で CSV ファイルを読み取るときにデコード エラーが発生しました

この問題は、CSV ファイルを Pandas に読み取るときに発生し、次のエラーが発生します。

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
ログイン後にコピー

根本的な原因は、多くの場合、 CSV ファイルのエンコーディング。

解決策

このエラーを解決するために、read_csv 関数はエンコーディング パラメーターを提供します。適切なエンコーディングを指定することで、ファイルを正しく解釈するように Pandas に指示できます。一般的に使用されるエンコーディングは次のとおりです。

  • UTF-8: エンコーディング = "utf-8"
  • ISO-8859-1: エンコーディング = "ISO-8859-1"
  • Latin-1: エンコーディング = "latin"
  • Windows-1252: エンコーディング = "cp1252"

たとえば、CSV ファイルが ISO-8859-1 でエンコードされている場合は、次のコードを使用できます。

data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
ログイン後にコピー

正しいコードの決定エンコーディング

正しいエンコーディングがわからない場合は、次を使用できます。ファイルを分析するための enca や file などのツール:

  • enca: ファイルのエンコーディングに関する詳細なレポートを提供します。
  • file: ファイルの簡単な説明を表示します。エンコーディング。

追加リソース

  • [Pandas CSV ドキュメント](https://pandas.pydata.org/docs/reference/api/) pandas.read_csv.html)
  • [Python CSV ファイル例](https://www.pythonprogramming.net/parse-csv-python-file/)
  • [Unicode 文字とエンコーディング](https://realpython.com/python-encodings-guide/)

以上がCSV ファイルを読み取るときに発生する Pandas の UnicodeDecodeError を修正するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
著者別の最新記事
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート