Mengendalikan "pandas.parser.CParserError: Ralat token data" Semasa Membaca Fail CSV
"pandas.parser.CParserError: Ralat tokenizing data" ralat berlaku apabila panda menghadapi ketidakkonsistenan dalam bilangan medan dalam a talian CSV. Untuk menyelesaikan ralat ini dan memastikan manipulasi data lancar, pertimbangkan perkara berikut:
1. Semak Ralat Pengekodan
Semak fail CSV anda untuk sebarang ralat pengekodan, seperti pembatas medan yang tiada atau nilai yang tidak diformatkan dengan betul. Selain itu, semak sama ada fail mempunyai sambungan fail yang betul (cth., .csv).
2. Laraskan Pembatas CSV
Secara lalai, panda menggunakan koma sebagai pembatas untuk fail CSV. Walau bagaimanapun, jika fail CSV anda menggunakan pembatas yang berbeza (seperti koma bernoktah), tentukannya menggunakan parameter pembatas dalam read_csv().
3. Abaikan Garis Buruk
Jika anda menghadapi sebilangan kecil baris bermasalah, anda boleh mengarahkan panda untuk melangkaunya semasa membaca fail CSV. Anda boleh melakukan ini menggunakan parameter on_bad_lines='skip' dalam read_csv().
4. Gunakan Modul CSV
Sebagai alternatif kepada panda, anda boleh menggunakan modul csv Python untuk membaca dan menghuraikan fail CSV. Modul ini menyediakan lebih kawalan ke atas proses penghuraian, membolehkan anda mengendalikan ralat atau ketidakkonsistenan dengan lebih fleksibel.
Contoh:
Untuk menggunakan modul csv, anda boleh mencuba kod berikut:
with open(path, 'r') as csv_file: csv_reader = csv.reader(csv_file, delimiter=',') data = list(csv_reader)
Tambahan Petua:
Atas ialah kandungan terperinci Bagaimana untuk Menyelesaikan 'pandas.parser.CParserError: Ralat token data' Semasa Membaca Fail CSV?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!