首頁 > 後端開發 > Python教學 > 如何修復 Pandas 讀取 CSV 檔案時出現的 UnicodeDecodeError 錯誤?

如何修復 Pandas 讀取 CSV 檔案時出現的 UnicodeDecodeError 錯誤?

Patricia Arquette
發布: 2025-01-03 21:45:40
原創
607 人瀏覽過

How Can I Fix Pandas' UnicodeDecodeError When Reading CSV Files?

使用Pandas 讀取CSV 檔案時遇到解碼錯誤

將CSV 檔案讀取到Pandas 時會出現此問題,導致以下錯誤:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
登入後複製

根本原因往往是因為編碼不一致CSV 檔案。

為了解決這個錯誤,read_csv 函數提供了一個編碼參數。透過指定適當的編碼,您可以指示 Pandas 正確解釋文件。常用的編碼包括:

  • UTF-8:encoding = "utf-8"
  • ISO-8859-1:encoding = "ISO-8859-1"
  • Latin-1:編碼=「拉丁文」
  • Windows-1252:編碼= "cp1252"

例如,如果 CSV 檔案採用 ISO-8859-1編碼,則可以使用以下程式碼:

data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
登入後複製

確定正確的編碼

如果您不確定正確的編碼,您可以使用類似的工具enca 或 file來分析文件:

  • enca:提供有關文件編碼的詳細報告。
  • 文件:顯示文件的簡要說明,包括其內容編碼。

其他資源

  • [Pandas CSV 文件](https://pandas.pydata.org/docs/reference/api/ pandas. read_csv.html)
  • [Python CSV檔案範例](https://www.pythonprogramming.net/parse-csv-python-file/)
  • [Unicode 字元與編碼](https://realpython.com/python-encodings-guide/ )

以上是如何修復 Pandas 讀取 CSV 檔案時出現的 UnicodeDecodeError 錯誤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
作者最新文章
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板