DataFrames: Panduan penting anda untuk mengeksport ke CSV di Python
DataFrames adalah asas manipulasi data dan analisis di Python, terutamanya dalam perpustakaan Pandas. Fleksibiliti mereka meliputi eksport data yang mudah, terutamanya kepada format CSV (nilai yang dipisahkan koma) secara meluas. Panduan ini memperincikan bagaimana untuk mengeksport data Pandas dengan lancar ke fail CSV dalam buku nota Jupyter, menonjolkan parameter utama dan amalan terbaik.
Jadual Kandungan
to_csv()
parameter fungsisep
na_rep
columns
header
index
index_label
mode
encoding
date_format
compression
chunksize
Mengeksport DataFrame ke CSV
Langkah 1: Membuat DataFrame Anda
Pandas menawarkan pelbagai cara untuk membuat dataFrame:
Kaedah 1: Penciptaan Data -Data Manual
Import Pandas sebagai PD data = { "Nama": ["Alice", "Bob", "Charlie"], "Umur": [25, 30, 35], "City": ["New York", "Los Angeles", "Chicago"] } df_manual = pd.dataFrame (data) Cetak (df_manual)
Kaedah 2: Mengimport dari sumber luaran
# Mengimport dari fail CSV df_csv = pd.read_csv ("sample.csv") Cetak ("\ ndataFrame dari CSV:") cetak (df_csv)
Kaedah 3: Menggunakan dataset Scikit-learn
dari sklearn.datasets import load_iris Import Pandas sebagai PD iris = load_iris () df_sklearn = pd.dataFrame (data = iris.data, lajur = iris.feature_names) df_sklearn ['sasaran'] = iris.target Cetak ("\ ndataFrame dari dataset iris:") cetak (df_sklearn.head ())
Langkah 2: Mengeksport ke fail CSV
Kaedah to_csv()
menyediakan kawalan berbutir ke atas proses eksport:
1. Menyimpan ke direktori semasa
Import OS cetak (os.getcwd ()) #Shows Direktori Kerja Semasa data = {"nama": ["Alice", "bob"], "umur": [25, 30]} df = pd.dataFrame (data) df.to_csv ("output.csv", index = false)
2. Penjimatan ke subdirektori
Import OS Jika tidak os.path.exists ("data"): os.makedirs ("data") df.to_csv ("data/output.csv", index = false)
3. Penjimatan ke jalan mutlak
df.to_csv (r "c: \ users \ yasha \ videos \ demo2 \ output.csv", index = false) #use raw rentetan (r "") untuk laluan windows
to_csv()
parameter fungsi
Mari kita meneroka parameter utama fungsi to_csv()
:
sep
(lalai ','): Menentukan pemisah medan (misalnya, ';', '\ t').na_rep
(lalai ""): Menggantikan nilai yang hilang (NAN).columns
: Memilih lajur khusus untuk eksport.header
(lalai benar): Termasuk tajuk lajur. Boleh ditetapkan ke senarai False
atau tersuai.index
(lalai benar): Termasuk Indeks DataFrame.index_label
: Menyediakan label tersuai untuk lajur Indeks.mode
(lalai 'w'): 'w' untuk menulis (overwrites), 'a' untuk tambahan.encoding
(lalai sistem lalai): Menentukan pengekodan (misalnya, 'UTF-8').date_format
: Format objek DateTime.compression
: Membolehkan pemampatan fail (misalnya, 'gzip', 'zip').chunksize
: Eksport dalam ketulan untuk dataset besar.Contoh yang menggambarkan beberapa parameter ditunjukkan dalam teks asal.
Kesimpulan
Kaedah to_csv()
menawarkan penyelesaian yang komprehensif dan fleksibel untuk mengeksport data PANDAS ke fail CSV. Parameternya yang pelbagai membolehkan kawalan yang tepat ke atas output, memastikan keserasian dan pengurusan data yang cekap.
Soalan yang sering ditanya
Soalan Lazim dari teks asal dikekalkan di sini.
Atas ialah kandungan terperinci Bagaimana cara mengeksport data data ke CSV dalam buku nota jupyter?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!