使用Pandas 讀取CSV 檔案時遇到解碼錯誤
將CSV 檔案讀取到Pandas 時會出現此問題,導致以下錯誤:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
根本原因往往是因為編碼不一致CSV 檔案。
解
為了解決這個錯誤,read_csv 函數提供了一個編碼參數。透過指定適當的編碼,您可以指示 Pandas 正確解釋文件。常用的編碼包括:
例如,如果 CSV 檔案採用 ISO-8859-1編碼,則可以使用以下程式碼:
data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
確定正確的編碼
如果您不確定正確的編碼,您可以使用類似的工具enca 或 file來分析文件:
其他資源
以上是如何修復 Pandas 讀取 CSV 檔案時出現的 UnicodeDecodeError 錯誤?的詳細內容。更多資訊請關注PHP中文網其他相關文章!