Pandas で CSV ファイルを読み取るときにデコード エラーが発生しました
この問題は、CSV ファイルを Pandas に読み取るときに発生し、次のエラーが発生します。
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
根本的な原因は、多くの場合、 CSV ファイルのエンコーディング。
解決策
このエラーを解決するために、read_csv 関数はエンコーディング パラメーターを提供します。適切なエンコーディングを指定することで、ファイルを正しく解釈するように Pandas に指示できます。一般的に使用されるエンコーディングは次のとおりです。
たとえば、CSV ファイルが ISO-8859-1 でエンコードされている場合は、次のコードを使用できます。
data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
正しいコードの決定エンコーディング
正しいエンコーディングがわからない場合は、次を使用できます。ファイルを分析するための enca や file などのツール:
追加リソース
以上がCSV ファイルを読み取るときに発生する Pandas の UnicodeDecodeError を修正するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。