Menghuraikan Fail .CSV Dipisahkan Semi Colon Menggunakan Panda
Apabila berurusan dengan fail nilai dipisahkan koma (CSV), adalah penting untuk mengendalikan dengan betul pemisah untuk memastikan penghuraian data yang tepat. Pandas menyediakan penyelesaian mudah untuk membaca fail CSV dengan pemisah bukan standard, seperti semi titik bertindih.
Pertimbangkan senario ini: anda mempunyai fail .csv dengan format yang serupa dengan yang berikut:
a1;b1;c1;d1;e1;... a2;b2;c2;d2;e2;...
Untuk mengimport fail ini ke dalam DataFrame panda, anda boleh menggunakan fungsi read_csv(). Walau bagaimanapun, secara lalai, panda menganggap bahawa pemisah ialah koma. Untuk menentukan pemisah separuh bertindih, gunakan parameter sep seperti berikut:
<code class="python">import pandas as pd csv_path = "C:...." data = pd.read_csv(csv_path, sep=';')</code>
Jika anda terlupa untuk menentukan parameter sep, tingkah laku lalai panda adalah untuk menganggap semua data sebagai satu lajur, mengakibatkan kesilapan terhasil apabila mencetak DataFrame.
Sebab bagi tingkah laku lalai ini ialah panda menganggap bahawa koma ialah pemisah yang paling biasa. Dengan menyediakan parameter sep, anda secara eksplisit mengarahkan panda untuk menggunakan koma bertindih sebagai pemisah, memastikan penghuraian data anda yang betul.
Ringkasnya, apabila berurusan dengan fail CSV yang dipisahkan separa bertindih dalam panda, sentiasa ingat untuk menyatakan sep=';' dalam fungsi read_csv() untuk mendapatkan penghuraian data yang tepat.
Atas ialah kandungan terperinci Bagaimanakah Saya Menghuraikan Fail CSV Dipisahkan Semi-Titik Menggunakan Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!