Mudah membaca dan memproses sejumlah besar data Excel dengan panda

WBOY
Lepaskan: 2024-01-24 08:42:06
asal
650 orang telah melayarinya

Mudah membaca dan memproses sejumlah besar data Excel dengan panda

Tajuk: Gunakan Pandas untuk membaca fail Excel dan memproses sejumlah besar data dengan mudah

Pengenalan: Pandas ialah alat pemprosesan data Python yang berkuasa yang boleh membaca dan memproses sejumlah besar data dengan mudah. Artikel ini akan memperkenalkan cara menggunakan pustaka Pandas untuk membaca fail Excel dan memberikan contoh kod khusus.

1. Pasang perpustakaan Pandas

Sebelum kita mula, kita perlu memasang perpustakaan Pandas terlebih dahulu. Anda boleh menggunakan arahan berikut untuk memasang Pandas:

pip install pandas
Salin selepas log masuk

2. Import perpustakaan Pandas dan fail Excel

Sebelum mula menggunakan Pandas, kita perlu mengimport perpustakaan Pandas. Anda boleh menggunakan arahan berikut untuk mengimport:

import pandas as pd
Salin selepas log masuk

Seterusnya, kita boleh menggunakan fungsi read_excel Pandas untuk membaca fail Excel. Berikut ialah contoh kod khusus: read_excel函数来读取Excel文件。以下是具体的代码示例:

df = pd.read_excel('data.xlsx')
Salin selepas log masuk

其中,data.xlsx是我们要读取的Excel文件名。

三、数据处理示例

在成功读取Excel文件后,我们就可以使用Pandas提供的各种功能来处理数据了。以下是一些常用的数据处理示例:

  1. 查看数据:可以使用head方法来查看前几行的数据,默认显示前5行。
df.head()
Salin selepas log masuk
  1. 数据筛选:可以使用条件表达式来筛选数据。以下示例筛选出“年龄”大于等于18岁的数据。
adults = df[df['年龄'] >= 18]
Salin selepas log masuk
  1. 计算统计指标:可以使用describe方法来计算数据的统计指标,如均值、标准差、最小值、最大值等。
statistics = df.describe()
Salin selepas log masuk
  1. 排序数据:可以使用sort_values方法来对数据进行排序。以下示例按照“年龄”从小到大排序。
sorted_df = df.sort_values(by='年龄')
Salin selepas log masuk
  1. 数据分组:可以使用groupby方法来对数据进行分组,并进行聚合计算。以下示例按照“性别”分组,并计算每组的平均年龄。
grouped_data = df.groupby('性别')['年龄'].mean()
Salin selepas log masuk
  1. 数据可视化:Pandas可以结合Matplotlib或其他绘图库进行数据可视化。以下示例使用Matplotlib绘制柱状图。
import matplotlib.pyplot as plt

df['年龄'].plot(kind='hist')
plt.show()
Salin selepas log masuk

四、保存处理后的数据

在进行数据处理后,我们可以使用Pandas提供的方法将处理后的数据保存到Excel文件中。以下是具体的代码示例,将数据保存到output.xlsx文件中:

df.to_excel('output.xlsx', index=False)
Salin selepas log masuk

其中,index=Falserrreee

Antaranya, data.xlsx ialah nama fail Excel yang ingin kita baca.

3. Contoh pemprosesan data

Selepas berjaya membaca fail Excel, kita boleh menggunakan pelbagai fungsi yang disediakan oleh Pandas untuk memproses data. Berikut ialah beberapa contoh pemprosesan data yang biasa digunakan: 🎜
  1. Lihat data: Anda boleh menggunakan kaedah head untuk melihat beberapa baris pertama data 5 baris pertama dipaparkan secara lalai .
rrreee
  1. Penapisan data: Anda boleh menggunakan ungkapan bersyarat untuk menapis data. Contoh berikut menapis data dengan "umur" lebih daripada atau sama dengan 18 tahun.
rrreee
  1. Kira penunjuk statistik: Anda boleh menggunakan kaedah describe untuk mengira penunjuk statistik data, seperti min, standard sisihan, nilai minimum, nilai maksimum, dsb.
rrreee
  1. Isih data: Anda boleh menggunakan kaedah sort_values untuk mengisih data. Contoh berikut diisih mengikut "umur" daripada terkecil kepada terbesar.
rrreee
  1. Pengumpulan data: Anda boleh menggunakan kaedah groupby untuk mengumpulkan data dan melakukan pengiraan pengagregatan. Kumpulan contoh berikut mengikut Jantina dan mengira purata umur setiap kumpulan.
rrreee
  1. Penggambaran data: Panda boleh digabungkan dengan Matplotlib atau perpustakaan lukisan lain untuk visualisasi data. Contoh berikut menggunakan Matplotlib untuk melukis histogram.
rrreee🎜4 Simpan data yang diproses🎜🎜Selepas pemprosesan data, kita boleh menggunakan kaedah yang disediakan oleh Pandas untuk menyimpan data yang diproses ke fail Excel. Berikut ialah contoh kod khusus untuk menyimpan data ke fail output.xlsx: 🎜rrreee🎜 Antaranya, index=False bermaksud tidak menyimpan lajur indeks. 🎜🎜Kesimpulan: 🎜🎜Artikel ini memperkenalkan cara menggunakan pustaka Pandas untuk membaca fail Excel dan melaksanakan pemprosesan data, dan memberikan contoh kod khusus. Fungsi hebat Panda boleh membantu kami memproses sejumlah besar data dengan mudah dan meningkatkan kecekapan analisis dan pemprosesan data. Saya harap artikel ini akan membantu anda belajar dan menggunakan Panda. 🎜

Atas ialah kandungan terperinci Mudah membaca dan memproses sejumlah besar data Excel dengan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan