Pengenalan fungsi umum perpustakaan panda dan penggunaan terperinci
Pengenalan:
pandas ialah alat analisis dan operasi data sumber terbuka, fleksibel dan cekap, yang digunakan secara meluas dalam sains data, pembelajaran mesin, kewangan, statistik dan bidang lain . Artikel ini akan memperkenalkan fungsi yang biasa digunakan dan penggunaannya dalam perpustakaan panda, dengan harapan dapat membantu pembaca memahami dan menggunakan panda dengan lebih baik.
1. Pengenalan kepada struktur data
Siri ialah salah satu struktur data paling asas dalam panda Ia adalah jenis data satu dimensi yang boleh mengandungi sebarang jenis data (integer, nombor titik terapung , rentetan, dsb.). Kaedah penciptaan adalah seperti berikut:
import pandas as pd data = [1, 2, 3, 4, 5] s = pd.Series(data) print(s)
Hasil keluaran:
0 1 1 2 2 3 3 4 4 5 dtype: int64
DataFrame ialah struktur data yang paling biasa digunakan dalam panda Ia adalah struktur data jadual dua dimensi yang boleh dianggap sebagai struktur data jadual terdiri daripada beberapa Terdiri daripada Siri. Kaedah penciptaan adalah seperti berikut:
import pandas as pd data = {'name': ['Alice', 'Bob', 'Charlie'], 'age': [25, 30, 35], 'city': ['New York', 'London', 'Tokyo']} df = pd.DataFrame(data) print(df)
Hasil keluaran:
name age city 0 Alice 25 New York 1 Bob 30 London 2 Charlie 35 Tokyo
2. Pengenalan dan penggunaan terperinci fungsi biasa
head() fungsi digunakan untuk melihat beberapa baris pertama daripada DataFrame, dan paparan lalai adalah sebelum 5 baris fungsi tail() digunakan untuk melihat beberapa baris terakhir DataFrame, dan 5 baris terakhir dilihat secara lalai. Kod sampel adalah seperti berikut:
import pandas as pd df = pd.read_csv('data.csv') print(df.head()) print(df.tail())
atribut bentuk mengembalikan bentuk DataFrame, iaitu bilangan baris dan lajur. Kod sampel adalah seperti berikut: Fungsi
import pandas as pd df = pd.read_csv('data.csv') print(df.shape)
info() digunakan untuk melihat maklumat keseluruhan DataFrame, termasuk nama lajur, bilangan nilai bukan nol, jenis data, dsb. Kod sampel adalah seperti berikut:
import pandas as pd df = pd.read_csv('data.csv') print(df.info())
describe() fungsi digunakan untuk mengira maklumat statistik lajur berangka dalam DataFrame, seperti kiraan, min, sisihan piawai, nilai minimum, nilai maksimum, dsb. . Kod sampel adalah seperti berikut: Fungsi
import pandas as pd df = pd.read_csv('data.csv') print(df.describe())
sort_values() digunakan untuk mengisih DataFrame berdasarkan nilai lajur yang ditentukan. Kod sampel adalah seperti berikut: Fungsi
import pandas as pd df = pd.read_csv('data.csv') df_sorted = df.sort_values(by='age', ascending=False) # 按照age列的值进行降序排序 print(df_sorted)
groupby() digunakan untuk mengumpulkan mengikut lajur yang ditentukan dan mengagregatkan hasil terkumpul. Kod sampel adalah seperti berikut: Fungsi
import pandas as pd df = pd.read_csv('data.csv') grouped = df.groupby('city') mean_age = grouped['age'].mean() # 计算每个城市的平均年龄 print(mean_age)
fungsi merge() digunakan untuk menggabungkan dua DataFrames mengikut lajur yang ditentukan. Kod sampel adalah seperti berikut:
import pandas as pd df1 = pd.DataFrame({'A': [1, 2, 3], 'B': ['a', 'b', 'c']}) df2 = pd.DataFrame({'A': [2, 3, 4], 'C': ['x', 'y', 'z']}) merged = pd.merge(df1, df2, on='A') # 按照列A合并 print(merged)
apply() fungsi digunakan untuk menggunakan fungsi tersuai pada setiap elemen dalam DataFrame. Kod sampel adalah seperti berikut:
import pandas as pd df = pd.read_csv('data.csv') # 定义一个自定义函数:将年龄加上10 def add_ten(age): return age + 10 df['age'] = df['age'].apply(add_ten) # 对age列的每个元素应用add_ten函数 print(df)
Kesimpulan:
Artikel ini memperkenalkan secara ringkas fungsi pustaka panda yang biasa digunakan dan penggunaannya, termasuk operasi asas Siri dan DataFrame, statistik data, pengisihan, pengelompokan, penggabungan dan aplikasi fungsi tersuai , dsb. Kami berharap pengenalan artikel ini dapat membantu pembaca lebih memahami dan menggunakan perpustakaan panda serta memainkan peranan yang lebih besar dalam analisis dan pemprosesan data.
Atas ialah kandungan terperinci Penjelasan terperinci tentang pengenalan dan penggunaan fungsi yang biasa digunakan dalam perpustakaan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!