Ralat Penyahkodan Ditemui Semasa Membaca Fail CSV dengan Panda
Isu ini timbul apabila membaca fail CSV ke dalam Panda, mengakibatkan ralat berikut:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xda in position 6: invalid continuation byte
Punca asas selalunya disebabkan oleh ketidakkonsistenan dalam pengekodan Fail CSV.
Penyelesaian
Untuk menyelesaikan ralat ini, fungsi read_csv menyediakan parameter pengekodan. Dengan menentukan pengekodan yang sesuai, anda boleh mengarahkan Pandas untuk mentafsir fail dengan betul. Pengekodan yang biasa digunakan termasuk:
Sebagai contoh, jika fail CSV dikodkan dalam ISO-8859-1, anda boleh menggunakan kod berikut:
data = pd.read_csv(filepath, names=fields, encoding="ISO-8859-1")
Menentukan Pengekodan Betul
Jika anda tidak pasti pengekodan yang betul, anda boleh menggunakan alatan seperti enca atau fail untuk menganalisis fail:
Tambahan Sumber
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Membetulkan UnicodeDecodeError Pandas Apabila Membaca Fail CSV?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!