多数の同様のファイルを処理するときに、UnicodeDecodeError が発生するとイライラすることがあります。この特定のエラーは、Pandas の read_csv メソッドに由来し、UTF-8 エンコーディングを使用してファイル内のバイトをデコードできないことを示しています。
この問題を解決するために、Pandas はエンコーディングを指定できるエンコーディング オプションを提供しています。ファイルの形式。一般的に使用されるエンコーディングは次のとおりです。
大部分のファイルでは UTF-8 エンコーディングを使用
コード例:
import pandas as pd filepath = 'filepath.csv' data = pd.read_csv(filepath, encoding="utf-8")
ファイルのエンコーディングの検出が必要な場合は、enca、file -i (Linux)、または file などのツールの使用を検討してください。 -私(macOS)。その後、それに応じてエンコードを指定できます。
エンコード オプションを利用すると、CSV ファイルを適切にデコードできるようになり、予期しないエラーによるデータ インポート プロセスの中断を防ぐことができます。
以上がPandas で CSV ファイルを読み取るときに発生する UnicodeDecodeError を修正するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。