Memperluaskan Fail CSV dengan Panda
Apabila bekerja dengan set data yang besar, anda mungkin perlu menambahkan data pada fail CSV sedia ada. Pandas, perpustakaan manipulasi data yang berkuasa dalam Python, menyediakan fungsi to_csv() untuk mengeksport data ke format CSV. Artikel ini meneroka penggunaan to_csv() untuk menambahkan data pada fail CSV sedia ada, memastikan keserasian dengan strukturnya.
Melampirkan pada Fail CSV Sedia Ada
to_csv( ) fungsi menawarkan parameter mod tulis, membolehkan pengguna menentukan cara data ditulis pada fail. Dengan menetapkan parameter ini kepada 'a', data dilampirkan pada fail sedia ada. Contohnya:
df.to_csv('my_csv.csv', mode='a', header=False)
Di sini, df bingkai data dilampirkan pada fail CSV bernama 'my_csv.csv'. Parameter header=False memastikan baris pengepala tidak ditulis berbilang kali.
Perlu ambil perhatian bahawa mod tulis lalai untuk to_csv() ialah 'w', yang menimpa fail sedia ada. Untuk memastikan mod tambah, nyatakan 'a' secara eksplisit.
Mengendalikan Ketiadaan Fail Awal
Jika fail CSV sasaran tidak wujud pada mulanya, baris pengepala mungkin tidak ditulis dengan betul jika menggunakan mod tambah. Untuk menangani perkara ini, anda boleh menggunakan variasi berikut:
import os output_path='my_csv.csv' df.to_csv(output_path, mode='a', header=not os.path.exists(output_path))
Kod ini menyemak sama ada fail wujud menggunakan os.path.exists(). Jika tidak, ia menulis baris pengepala dengan menetapkan header=True. Jika tidak, ia menambahkan data tanpa pengepala.
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Menggunakan Panda untuk Menambah Data pada Fail CSV Sedia Ada?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!