Penjelasan terperinci tentang pengenalan dan penggunaan fungsi yang biasa digunakan dalam perpustakaan panda

WBOY
Lepaskan: 2024-01-24 10:19:17
asal
1387 orang telah melayarinya

Penjelasan terperinci tentang pengenalan dan penggunaan fungsi yang biasa digunakan dalam perpustakaan panda

Pengenalan fungsi umum perpustakaan panda dan penggunaan terperinci

Pengenalan:

pandas ialah alat analisis dan operasi data sumber terbuka, fleksibel dan cekap, yang digunakan secara meluas dalam sains data, pembelajaran mesin, kewangan, statistik dan bidang lain . Artikel ini akan memperkenalkan fungsi yang biasa digunakan dan penggunaannya dalam perpustakaan panda, dengan harapan dapat membantu pembaca memahami dan menggunakan panda dengan lebih baik.

1. Pengenalan kepada struktur data

  1. Siri (jujukan)

Siri ialah salah satu struktur data paling asas dalam panda Ia adalah jenis data satu dimensi yang boleh mengandungi sebarang jenis data (integer, nombor titik terapung , rentetan, dsb.). Kaedah penciptaan adalah seperti berikut:

import pandas as pd

data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)
Salin selepas log masuk

Hasil keluaran:

0    1
1    2
2    3
3    4
4    5
dtype: int64
Salin selepas log masuk
  1. DataFrame (bingkai data)

DataFrame ialah struktur data yang paling biasa digunakan dalam panda Ia adalah struktur data jadual dua dimensi yang boleh dianggap sebagai struktur data jadual terdiri daripada beberapa Terdiri daripada Siri. Kaedah penciptaan adalah seperti berikut:

import pandas as pd

data = {'name': ['Alice', 'Bob', 'Charlie'],
        'age': [25, 30, 35],
        'city': ['New York', 'London', 'Tokyo']}
df = pd.DataFrame(data)
print(df)
Salin selepas log masuk

Hasil keluaran:

      name  age      city
0    Alice   25  New York
1      Bob   30    London
2  Charlie   35     Tokyo
Salin selepas log masuk

2. Pengenalan dan penggunaan terperinci fungsi biasa

  1. head() dan tail()

head() fungsi digunakan untuk melihat beberapa baris pertama daripada DataFrame, dan paparan lalai adalah sebelum 5 baris fungsi tail() digunakan untuk melihat beberapa baris terakhir DataFrame, dan 5 baris terakhir dilihat secara lalai. Kod sampel adalah seperti berikut:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.head())
print(df.tail())
Salin selepas log masuk
  1. atribut bentuk

atribut bentuk mengembalikan bentuk DataFrame, iaitu bilangan baris dan lajur. Kod sampel adalah seperti berikut: Fungsi

import pandas as pd

df = pd.read_csv('data.csv')
print(df.shape)
Salin selepas log masuk
  1. info()

info() digunakan untuk melihat maklumat keseluruhan DataFrame, termasuk nama lajur, bilangan nilai bukan nol, jenis data, dsb. Kod sampel adalah seperti berikut:

import pandas as pd

df = pd.read_csv('data.csv')
print(df.info())
Salin selepas log masuk
  1. describe() function

describe() fungsi digunakan untuk mengira maklumat statistik lajur berangka dalam DataFrame, seperti kiraan, min, sisihan piawai, nilai minimum, nilai maksimum, dsb. . Kod sampel adalah seperti berikut: Fungsi

import pandas as pd

df = pd.read_csv('data.csv')
print(df.describe())
Salin selepas log masuk
  1. sort_values()

sort_values() digunakan untuk mengisih DataFrame berdasarkan nilai lajur yang ditentukan. Kod sampel adalah seperti berikut: Fungsi

import pandas as pd

df = pd.read_csv('data.csv')
df_sorted = df.sort_values(by='age', ascending=False)  # 按照age列的值进行降序排序
print(df_sorted)
Salin selepas log masuk
  1. groupby()

groupby() digunakan untuk mengumpulkan mengikut lajur yang ditentukan dan mengagregatkan hasil terkumpul. Kod sampel adalah seperti berikut: Fungsi

import pandas as pd

df = pd.read_csv('data.csv')
grouped = df.groupby('city')
mean_age = grouped['age'].mean()  # 计算每个城市的平均年龄
print(mean_age)
Salin selepas log masuk
  1. merge()

fungsi merge() digunakan untuk menggabungkan dua DataFrames mengikut lajur yang ditentukan. Kod sampel adalah seperti berikut:

import pandas as pd

df1 = pd.DataFrame({'A': [1, 2, 3],
                    'B': ['a', 'b', 'c']})
df2 = pd.DataFrame({'A': [2, 3, 4],
                    'C': ['x', 'y', 'z']})
merged = pd.merge(df1, df2, on='A')  # 按照列A合并
print(merged)
Salin selepas log masuk
  1. apply() function

apply() fungsi digunakan untuk menggunakan fungsi tersuai pada setiap elemen dalam DataFrame. Kod sampel adalah seperti berikut:

import pandas as pd

df = pd.read_csv('data.csv')

# 定义一个自定义函数:将年龄加上10
def add_ten(age):
    return age + 10

df['age'] = df['age'].apply(add_ten)  # 对age列的每个元素应用add_ten函数
print(df)
Salin selepas log masuk

Kesimpulan:

Artikel ini memperkenalkan secara ringkas fungsi pustaka panda yang biasa digunakan dan penggunaannya, termasuk operasi asas Siri dan DataFrame, statistik data, pengisihan, pengelompokan, penggabungan dan aplikasi fungsi tersuai , dsb. Kami berharap pengenalan artikel ini dapat membantu pembaca lebih memahami dan menggunakan perpustakaan panda serta memainkan peranan yang lebih besar dalam analisis dan pemprosesan data.

Atas ialah kandungan terperinci Penjelasan terperinci tentang pengenalan dan penggunaan fungsi yang biasa digunakan dalam perpustakaan panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan