Rumah pembangunan bahagian belakang Tutorial Python Bagaimana untuk Memisahkan Pandas DataFrame kepada Subset Berdasarkan Nilai Lajur?

Bagaimana untuk Memisahkan Pandas DataFrame kepada Subset Berdasarkan Nilai Lajur?

Oct 19, 2024 pm 10:33 PM

How to Split Pandas DataFrame into Subsets Based on Column Value?

Memisahkan DataFrame Panda Berdasarkan Nilai Lajur

Dalam Panda, senario yang biasa dihadapi ialah keperluan untuk membahagikan DataFrame kepada beberapa subset berdasarkan nilai yang terdapat dalam lajur tertentu. Ini membolehkan analisis dan manipulasi data yang disasarkan.

Untuk mencapai matlamat ini, kami boleh memanfaatkan kuasa pengindeksan boolean dalam Pandas. Mari kita pertimbangkan DataFrame dengan lajur bernama "Jualan" dan terokai cara kita boleh membahagikannya kepada dua berdasarkan sama ada nilai "Jualan" berada di bawah atau di atas nilai ambang 's'.

Penyelesaian:

<code class="python"># Create a DataFrame with a "Sales" column
df = pd.DataFrame({'Sales':[10,20,30,40,50], 'A':[3,4,7,6,1]})
print (df)</code>
Salin selepas log masuk
   A  Sales
0  3     10
1  4     20
2  7     30
3  6     40
4  1     50
Salin selepas log masuk
<code class="python"># Split the DataFrame based on "Sales" values
s = 30

df1 = df[df['Sales'] &gt;= s]
print (df1)</code>
Salin selepas log masuk
   A  Sales
2  7     30
3  6     40
4  1     50
Salin selepas log masuk
Salin selepas log masuk

Ini mencipta DataFrame baharu, df1, yang mengandungi baris yang nilai "Jualan" lebih besar daripada atau sama dengan 's'.

<code class="python">df2 = df[df['Sales'] &lt; s]
print (df2)
Salin selepas log masuk
   A  Sales
0  3     10
1  4     20
Salin selepas log masuk
Salin selepas log masuk

df2 terdiri daripada baris dengan nilai "Jualan" kurang daripada 's'.

Pendekatan Alternatif Menggunakan Penolakan Bitwise:

Daripada menggunakan lebih besar daripada atau sama dengan pengendali, kita juga boleh menggunakan penolakan bitwise (~) untuk menyongsangkan topeng:

<code class="python">mask = df['Sales'] &gt;= s
df1 = df[mask]
df2 = df[~mask]
print (df1)</code>
Salin selepas log masuk
   A  Sales
2  7     30
3  6     40
4  1     50
Salin selepas log masuk
Salin selepas log masuk
<code class="python">print (df2)</code>
Salin selepas log masuk
   A  Sales
0  3     10
1  4     20
Salin selepas log masuk
Salin selepas log masuk

Pendekatan ini mencapai pemisahan yang sama tetapi membolehkan gaya pengekodan yang lebih ringkas dan dioptimumkan.

Atas ialah kandungan terperinci Bagaimana untuk Memisahkan Pandas DataFrame kepada Subset Berdasarkan Nilai Lajur?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Tag artikel panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Bagaimana saya menggunakan sup yang indah untuk menghuraikan html? Bagaimana saya menggunakan sup yang indah untuk menghuraikan html? Mar 10, 2025 pm 06:54 PM

Bagaimana saya menggunakan sup yang indah untuk menghuraikan html?

Penapisan gambar di python Penapisan gambar di python Mar 03, 2025 am 09:44 AM

Penapisan gambar di python

Cara Menggunakan Python untuk Mencari Pengagihan Zipf Fail Teks Cara Menggunakan Python untuk Mencari Pengagihan Zipf Fail Teks Mar 05, 2025 am 09:58 AM

Cara Menggunakan Python untuk Mencari Pengagihan Zipf Fail Teks

Cara Bekerja Dengan Dokumen PDF Menggunakan Python Cara Bekerja Dengan Dokumen PDF Menggunakan Python Mar 02, 2025 am 09:54 AM

Cara Bekerja Dengan Dokumen PDF Menggunakan Python

Cara Cache Menggunakan Redis dalam Aplikasi Django Cara Cache Menggunakan Redis dalam Aplikasi Django Mar 02, 2025 am 10:10 AM

Cara Cache Menggunakan Redis dalam Aplikasi Django

Bagaimana untuk melakukan pembelajaran mendalam dengan Tensorflow atau Pytorch? Bagaimana untuk melakukan pembelajaran mendalam dengan Tensorflow atau Pytorch? Mar 10, 2025 pm 06:52 PM

Bagaimana untuk melakukan pembelajaran mendalam dengan Tensorflow atau Pytorch?

Serialization dan deserialisasi objek python: Bahagian 1 Serialization dan deserialisasi objek python: Bahagian 1 Mar 08, 2025 am 09:39 AM

Serialization dan deserialisasi objek python: Bahagian 1

Cara Melaksanakan Struktur Data Anda Sendiri di Python Cara Melaksanakan Struktur Data Anda Sendiri di Python Mar 03, 2025 am 09:28 AM

Cara Melaksanakan Struktur Data Anda Sendiri di Python

See all articles