為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組？-Python教學-PHP中文網

為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組？

Patricia Arquette

發布： 2024-11-04 13:35:01

原創

1137 人瀏覽過

Why am I getting a UnicodeDecodeError: 'utf-8' codec can't decode byte when iterating through a text file?

「for line in...」導致UnicodeDecodeError: 'utf-8' 編解碼器無法解碼位元組

嘗試時使用「for line in open('filename')」語法迭代文字檔案的行時，程式設計師可能會遇到UnicodeDecodeError，指示「utf-8」編解碼器無法解碼特定位元組。當文字檔案的編碼與「utf-8」編解碼器假定的編碼不符時，通常會發生此錯誤。

解決問題

解決此問題錯誤，開啟文字檔案時需要指定正確的編碼。這可以透過在 open() 函數中加入「encoding=」參數來實現，如下所示：

<code class="python">for line in open('filename', encoding='utf-8'):
    # Read each line</code>

登入後複製

在某些情況下，指定的編碼可能不正確，導致相同的錯誤。為了確定適當的編碼，程式設計師可以檢查文字檔案並識別所使用的字元集。

例如，提問者提供的程式碼片段：

<code class="python">for line in open('u.item'):
    # Read each line</code>

登入後複製

無法解碼文字文件，因為編碼被錯誤地假定為「utf-8」。透過檢查文字文件，發現正確的編碼是「ISO-8859-1」。修改程式碼如下解決了問題：

<code class="python">for line in open('u.item', encoding='ISO-8859-1'):
    # Read each line</code>

登入後複製

以上是為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組？的詳細內容。更多資訊請關注PHP中文網其他相關文章！