Kuasai kaedah operasi asas panda untuk membaca fail Excel
Dalam analisis dan pemprosesan data, fail Excel ialah sumber data biasa Pandas ialah pustaka analisis dan pemprosesan data yang berkuasa dalam Python, yang boleh membaca dengan cepat dan cekap. Ambil fail Excel dan lakukan pembersihan, pemprosesan dan analisis data. Artikel ini akan memperkenalkan kaedah operasi asas Panda untuk membaca fail Excel, dan menyediakan contoh kod khusus untuk memudahkan pembaca menguasainya dengan cepat.
Mula-mula anda perlu memasang perpustakaan Pandas. Ia boleh dipasang dalam baris arahan melalui arahan pip, seperti yang ditunjukkan di bawah:
pip install pandas
Alat teras untuk membaca fail Excel dalam Pandas ialah fungsi read_excel(), yang boleh membaca satu atau lebih Excel fail Jadual, menyokong fail dalam pelbagai format, seperti xls dan xlsx, dsb.
Berikut ialah contoh mudah membaca fail Excel:
import pandas as pd # 读取Excel文件 data = pd.read_excel('data.xlsx') # 打印数据 print(data)
Kod di atas akan membaca fail Excel bernama "data.xlsx" ke dalam objek DataFrame dan mencetak data.
Selepas membaca fail Excel, kami boleh memilih beberapa jadual dan lajur yang diperlukan untuk analisis dan pemprosesan selanjutnya. Panda menyediakan pelbagai kaedah untuk memilih data, seperti menggunakan nama jadual, nama lajur atau menggunakan indeks baris dan lajur.
Berikut ialah contoh pemilihan jadual dan lajur:
import pandas as pd # 读取Excel文件 data = pd.read_excel('data.xlsx', sheet_name='Sheet1') # 选择数据 selected_data = data[['Name', 'Age', 'Gender']] # 打印数据 print(selected_data)
Kod di atas akan memilih jadual bernama "Sheet1" dalam fail Excel, dan kemudian pilih tiga lajur "Nama", "Umur" dan "Jantina" dalam jadual, dan mencetak hasilnya.
Menapis data ialah operasi biasa dalam analisis data Pandas menyediakan pelbagai kaedah untuk menapis data, seperti menggunakan indeks Boolean atau menggunakan fungsi query().
Berikut ialah contoh penapisan data:
import pandas as pd # 读取Excel文件 data = pd.read_excel('data.xlsx', sheet_name='Sheet1') # 过滤数据 filtered_data = data[(data['Age'] > 18) & (data['Gender'] == 'Male')] # 打印数据 print(filtered_data)
Kod di atas akan memilih jadual bernama "Sheet1" dalam fail Excel, kemudian pilih data yang umurnya lebih daripada 18 tahun dan jantina lelaki, dan mencetaknya keputusannya.
Sebaik sahaja anda memilih data yang diperlukan, anda boleh melakukan pelbagai pengiraan dan operasi analisis, seperti jumlah, min, sisihan piawai, dsb. Panda menyediakan beberapa fungsi terbina dalam untuk melengkapkan operasi ini, seperti sum(), min(), std(), dsb.
Berikut ialah contoh pengiraan dan analisis data:
import pandas as pd # 读取Excel文件 data = pd.read_excel('data.xlsx', sheet_name='Sheet1') # 过滤数据 filtered_data = data[(data['Age'] > 18) & (data['Gender'] == 'Male')] # 计算数据 age_mean = filtered_data['Age'].mean() age_std = filtered_data['Age'].std() # 打印数据 print('Average Age:', age_mean) print('Standard Deviation of Age:', age_std)
Kod di atas akan memilih jadual bernama "Sheet1" dalam fail Excel, kemudian pilih data yang umurnya melebihi 18 tahun dan jantina adalah lelaki, dan hitung nilai umur purata dan sisihan piawai, dan cetak hasilnya.
Artikel ini memperkenalkan kaedah operasi asas Panda untuk membaca fail Excel dan menyediakan contoh kod khusus. Dengan mempelajari artikel ini, pembaca boleh menguasai operasi asas membaca fail Excel dengan Pandas dengan cepat dan melakukan pembersihan data, analisis dan pemprosesan dalam aplikasi praktikal.
Atas ialah kandungan terperinci Mudah dipelajari: kuasai kaedah operasi asas panda untuk membaca fail Excel. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!