Rumah > pembangunan bahagian belakang > Tutorial Python > Bagaimanakah Saya Boleh Melaksanakan Penapisan SQL IN dan NOT IN dengan Cekap dalam Pandas?

Bagaimanakah Saya Boleh Melaksanakan Penapisan SQL IN dan NOT IN dengan Cekap dalam Pandas?

Susan Sarandon
Lepaskan: 2024-12-20 20:05:17
asal
311 orang telah melayarinya

How Can I Efficiently Perform SQL's IN and NOT IN Filtering in Pandas?

Penapisan Seperti SQL Berorientasikan Objek dalam Panda

Menapis bingkai data Pandas ialah tugas penting dalam analisis data dan memahami cara menggunakan dengan berkesan Pengendali seperti SQL boleh memudahkan proses ini. Khususnya, operator IN dan NOT IN digunakan secara meluas untuk memilih baris berdasarkan kriteria keahlian.

Pandas Equivalent of SQL's IN and NOT IN

Untuk mencapai persamaan dengan Pengendali IN SQL dalam Pandas, anda boleh memanfaatkan kaedah isin() pada Siri. Kaedah ini menyemak sama ada setiap elemen dalam Siri terkandung dalam senarai atau set yang ditentukan. Sebagai contoh, untuk menapis bingkai data berdasarkan senarai negara untuk disertakan:

df = pd.DataFrame({'country': ['US', 'UK', 'Germany', 'China']})
countries_to_keep = ['UK', 'China']
df[df['country'].isin(countries_to_keep)]
Salin selepas log masuk

Ini akan mengembalikan bingkai data yang mengandungi hanya baris di mana nilai lajur negara terdapat dalam senarai negara_untuk_kekal.

Untuk melakukan persamaan SQL NOT IN, hanya menafikan kaedah isin() menggunakan ~ operator:

df[~df['country'].isin(countries_to_keep)]
Salin selepas log masuk

Ini akan menghasilkan bingkai data tidak termasuk baris yang nilai lajur negara sepadan dengan senarai yang ditentukan.

Contoh

Pertimbangkan bingkai data berikut:

df = pd.DataFrame({'country': ['US', 'UK', 'Germany', 'China']})
countries_to_keep = ['UK', 'China']
Salin selepas log masuk

Untuk memilih hanya baris dengan negara di countries_to_keep:

df_filtered_in = df[df['country'].isin(countries_to_keep)]
Salin selepas log masuk

Ini akan menghasilkan:

    country
1        UK
3     China
Salin selepas log masuk

Untuk memilih baris dengan negara yang bukan dalam country_to_keep:

df_filtered_not_in = df[~df['country'].isin(countries_to_keep)]
Salin selepas log masuk

Ini akan menghasilkan:

    country
0        US
2   Germany
Salin selepas log masuk

Kesimpulan

Kaedah isin() dalam Pandas menyediakan cara yang mudah dan cekap untuk melaksanakan penapisan gaya DALAM dan BUKAN DALAM, menawarkan penapisan yang berkuasa alat untuk memanipulasi bingkai data berdasarkan kriteria keahlian.

Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Melaksanakan Penapisan SQL IN dan NOT IN dengan Cekap dalam Pandas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php.cn
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan