Python のデコード エラー: バイト変換時の UnicodeDecodeError
文字列を操作するときに Python で発生する一般的なエラーは、デコードしようとしたときの UnicodeDecodeError です。 UTF-8 コーデックを使用したバイト。このエラーは、Python がバイト配列を UTF-8 でエンコードされた文字列として解釈しようとして、UTF-8 ルールに準拠しないバイトのシーケンスに遭遇した場合に発生します。
提供されたコードで参照されている特定のケースでは、 URL。pix2pix-tensorflow GitHub リポジトリから「process.py」スクリプトをコンパイルするときにエラーが発生しました。スクリプトは、open() を使用してファイル (特に画像) を読み取り、ロードしようとしました。 Python がファイルの内容を UTF-8 文字列としてデコードしようとしたとき、ファイルの先頭のバイト シーケンスが UTF-8 エンコードで許可されていなかったため、失敗しました。
このエラーの根本原因これは、ファイルの内容の実際の性質と、ファイルが UTF-8 でエンコードされているという Python の想定との間の不一致です。元のファイルは画像や圧縮データなどのバイナリ ファイルである可能性があり、UTF-8 として確実にデコードすることができません。
この問題を解決するには、' を使用してファイルをバイナリ データとして明示的に読み取る必要があります。 open() 関数の rb' モード:
<code class="python">with open(path, 'rb') as f: contents = f.read()</code>
「rb」モードを使用すると、Python はファイルをバイナリとして扱い、デコードしようとしません。これにより、UnicodeDecodeError の発生が防止されます。
以上がファイルの読み取り時に Python コードが UnicodeDecodeError をスローするのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。