Pemahaman mendalam tentang teknik untuk memadam data baris dalam panda

WBOY
Lepaskan: 2024-01-09 11:21:55
asal
894 orang telah melayarinya

Pemahaman mendalam tentang teknik untuk memadam data baris dalam panda

Kemahiran pemprosesan data: Penjelasan terperinci tentang cara memadamkan baris dalam panda

Dalam pemprosesan data, selalunya perlu memadamkan baris data tertentu dalam DataFrame. Pandas ialah perpustakaan pemprosesan data yang berkuasa yang menyediakan pelbagai kaedah untuk melaksanakan operasi pemadaman data baris. Artikel ini akan memperkenalkan secara terperinci beberapa kaedah biasa untuk memadamkan baris dalam panda dan memberikan contoh kod khusus.

  1. Gunakan kaedah drop
    Objek DataFrame panda menyediakan kaedah drop, yang boleh memadamkan baris dengan menyatakan indeks baris atau label baris. Berikut ialah contoh mudah:
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除索引为2的行数据
df = df.drop(2)

print(df)
Salin selepas log masuk

Output adalah seperti berikut:

   Name  Age Gender
0   Tom   20      M
1  Nick   25      M
3  David  35      M
Salin selepas log masuk

Seperti yang anda lihat, kaedah drop mengembalikan DataFrame baharu dan memadamkan baris yang ditentukan dalam hasilnya.

  1. Menggunakan Pengindeksan Boolean
    Dalam sesetengah kes, kita mungkin perlu memadamkan baris berdasarkan syarat. Pengindeksan boolean Pandas menyediakan cara mudah untuk melakukan ini. Berikut ialah contoh:
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除所有年龄小于30的行数据
df = df[df['Age'] >= 30]

print(df)
Salin selepas log masuk

Outputnya adalah seperti berikut:

   Name  Age Gender
2  John  30      M
3  David 35      M
Salin selepas log masuk

Seperti yang anda lihat, dengan menetapkan indeks Boolean kepada Benar atau Salah, kami boleh menapis keluar data baris yang perlu dikekalkan.

  1. Gunakan operasi menghiris
    Jika anda ingin memadamkan berbilang baris data berturut-turut, anda boleh menggunakan operasi menghiris untuk mencapainya. Berikut ialah contoh:
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 删除索引为1到2的行数据
df = df.drop(df.index[1:3])

print(df)
Salin selepas log masuk

Output adalah seperti berikut:

   Name  Age Gender
0   Tom   20      M
3  David 35      M
Salin selepas log masuk

Seperti yang anda lihat, dengan menetapkan julat indeks operasi penghirisan, kami boleh memadamkan berbilang baris data berturut-turut.

  1. Gunakan kaedah set_index dan reset_index
    Jika indeks baris DataFrame ialah jenis angka dan terdapat baris yang hilang, anda boleh menggunakan kaedah set_index dan reset_index untuk memadamkan baris yang hilang. Berikut adalah contoh:
import pandas as pd

data = {'Name': ['Tom', 'Nick', 'John', 'David'],
        'Age': [20, 25, 30, 35],
        'Gender': ['M', 'M', 'M', 'M']}

df = pd.DataFrame(data)

# 设置第三行的索引为缺失
df.set_index(pd.Index(['0', '1', '3']), inplace=True)

# 重置索引并删除缺失的行
df.reset_index(drop=True, inplace=True)

print(df)
Salin selepas log masuk

Output adalah seperti berikut:

   Name  Age Gender
0   Tom   20      M
1  Nick  25      M
2  David 35      M
Salin selepas log masuk

Seperti yang anda lihat, dengan menetapkan indeks kepada baris yang hilang, dan menggunakan kaedah reset_index untuk menetapkan semula indeks dan memadam baris yang hilang, kita boleh memadam baris tertentu.

Ringkasnya, berikut ialah beberapa kaedah biasa untuk memadamkan data baris dalam DataFrame panda. Mengikut keperluan yang berbeza, kita boleh memilih kaedah yang sesuai untuk menyelesaikan tugas pemprosesan data. Dalam aplikasi praktikal, kaedah yang sesuai boleh dipilih untuk memadam data baris mengikut keadaan tertentu untuk meningkatkan kecekapan dan ketepatan pemprosesan data.

Atas ialah kandungan terperinci Pemahaman mendalam tentang teknik untuk memadam data baris dalam panda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan