Panda ialah alat pemprosesan dan analisis data yang biasa digunakan dalam Python Ia menyediakan satu siri kaedah mudah untuk membaca dan memproses fail Excel. Artikel ini akan memperkenalkan beberapa kaedah biasa untuk Pandas membaca fail Excel, dan menyediakan contoh kod khusus untuk membantu pembaca memahami dan menerapkannya dengan lebih baik.
1. Gunakan fungsi read_excel() Pandas untuk membaca fail Excel
Pandas menyediakan fungsi read_excel(), yang boleh membaca terus fail Excel dan menukarnya menjadi objek DataFrame. Penggunaan asas fungsi ini adalah seperti berikut:
import pandas as pd # 读取Excel文件 df = pd.read_excel('filename.xlsx', sheetname='sheet1')
Di mana, 'filename.xlsx' ialah nama fail Excel untuk dibaca, yang boleh menjadi laluan relatif atau laluan mutlak. Parameter nama helaian digunakan untuk menentukan nama lembaran kerja untuk dibaca, yang boleh menjadi nama lembaran kerja atau indeks tertentu.
Untuk kemudahan demonstrasi, kami membuat contoh fail Excel bernama data.xlsx
dengan kandungan berikut:
Nama Umur Jantina
Zhang San 25 Lelaki
Li Si 30 Perempuan
Wang Wu 28 Lelaki
Seterusnya, kami menggunakan read_excel fungsi Baca dan cetak data:
import pandas as pd # 读取Excel文件 df = pd.read_excel('data.xlsx', sheetname='Sheet1') # 打印数据 print(df)
Keputusan larian adalah seperti berikut:
Nama Umur Jantina
0 Zhang San 25 Lelaki
1 Li Si 30 Perempuan
2 Wang Wu 28 Lelaki
Selepas membaca fail Excel, anda boleh melakukan pelbagai operasi pada pemprosesan dan analisis data objek DataFrame.
2 Baca data daripada berbilang lembaran kerja
Jika fail Excel mengandungi berbilang lembaran kerja, anda boleh membaca data lembaran kerja yang ditentukan dengan menyatakan parameter nama helaian. Pada masa ini, fungsi read_excel() akan mengembalikan kamus dengan nama lembaran kerja sebagai kunci dan objek DataFrame yang sepadan sebagai nilai. Contohnya adalah seperti berikut:
import pandas as pd # 读取Excel文件的所有工作表 dfs = pd.read_excel('filename.xlsx', sheetname=None) # 打印所有工作表的数据 for sheetname, df in dfs.items(): print(sheetname, ": ", df)
3 Tentukan julat lajur untuk membaca data
Kadangkala, kita mungkin hanya mahu membaca sebahagian daripada data lajur dalam fail Excel. Pada masa ini, anda boleh mengehadkan julat lajur untuk dibaca dengan menentukan parameter usecols. Contohnya adalah seperti berikut:
import pandas as pd # 读取Excel文件的指定列范围 df = pd.read_excel('filename.xlsx', usecols='A:C') # 打印数据 print(df)
4 Mengendalikan nilai nol
Apabila membaca fail Excel, anda sering menghadapi situasi yang mengandungi nilai nol. Pandas menyediakan fungsi fillna() untuk mengendalikan situasi ini dengan mudah. Contohnya adalah seperti berikut:
import pandas as pd # 读取Excel文件并处理空值 df = pd.read_excel('filename.xlsx') df.fillna(value=0, inplace=True) # 打印数据 print(df)
Dalam contoh di atas, fungsi fillna() digunakan untuk mengisi nilai nol dengan 0, dan inplace=True bermaksud mengubah suai terus pada objek DataFrame asal.
Di atas ialah beberapa kaedah biasa dan kod contoh untuk membaca fail Excel dengan Panda. Pembaca boleh memilih kaedah yang sesuai mengikut keperluan mereka sendiri untuk meneroka dan mengaplikasikan fungsi pemprosesan dan analisis data Pandas.
Atas ialah kandungan terperinci Cara membaca fail Excel menggunakan Pandas. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!