首頁 > 後端開發 > Python教學 > 為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組?

為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組?

Patricia Arquette
發布: 2024-11-04 13:35:01
原創
1046 人瀏覽過

Why am I getting a UnicodeDecodeError: 'utf-8' codec can't decode byte when iterating through a text file?

「for line in...」導致UnicodeDecodeError: 'utf-8' 編解碼器無法解碼位元組

嘗試時使用「for line in open('filename')」語法迭代文字檔案的行時,程式設計師可能會遇到UnicodeDecodeError,指示「utf-8」編解碼器無法解碼特定位元組。當文字檔案的編碼與「utf-8」編解碼器假定的編碼不符時,通常會發生此錯誤。

解決問題

解決此問題錯誤,開啟文字檔案時需要指定正確的編碼。這可以透過在 open() 函數中加入「encoding=」參數來實現,如下所示:

<code class="python">for line in open('filename', encoding='utf-8'):
    # Read each line</code>
登入後複製

在某些情況下,指定的編碼可能不正確,導致相同的錯誤。為了確定適當的編碼,程式設計師可以檢查文字檔案並識別所使用的字元集。

例如,提問者提供的程式碼片段:

<code class="python">for line in open('u.item'):
    # Read each line</code>
登入後複製

無法解碼文字文件,因為編碼被錯誤地假定為「utf-8」。透過檢查文字文件,發現正確的編碼是「ISO-8859-1」。修改程式碼如下解決了問題:

<code class="python">for line in open('u.item', encoding='ISO-8859-1'):
    # Read each line</code>
登入後複製

以上是為什麼我在迭代文字檔案時收到 UnicodeDecodeError: \'utf-8\' 編解碼器無法解碼位元組?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

來源:php.cn
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板