Cara Membahagikan Pandas DataFrame dengan Nilai Lajur
Memisahkan Pandas DataFrame berdasarkan nilai lajur boleh berguna untuk mencipta subset berasingan daripada data. Katakan anda mempunyai DataFrame dengan lajur bernama 'Jualan' dan anda ingin membahagikannya kepada dua DataFrames: satu mengandungi baris dengan 'Jualan' kurang daripada nilai yang ditentukan dan satu lagi mengandungi baris yang 'Jualan' lebih besar daripada atau sama dengan nilai itu.
Untuk mencapai ini, anda boleh menggunakan pengindeksan boolean dengan langkah berikut:
Pisah DataFrame: Guna boolean mask kepada DataFrame asal untuk mencipta dua DataFrame baharu:
Sebagai alternatif, anda boleh terbalikkan topeng pertama menggunakan operator ~:
mask = df['Sales'] >= s df1 = df[mask] df2 = df[~mask]<p>Ini contoh untuk menggambarkan proses:</p> <pre class="brush:php;toolbar:false"><code class="python">df = pd.DataFrame({'Sales': [10, 20, 30, 40, 50], 'A': [3, 4, 7, 6, 1]}) print(df) s = 30 df1 = df[df['Sales'] >= s] print(df1) df2 = df[df['Sales'] < s] print(df2)</code>
Outputnya ialah:
A Sales 0 3 10 1 4 20 2 7 30 3 6 40 4 1 50 A Sales 2 7 30 3 6 40 4 1 50 A Sales 0 3 10 1 4 20
Ini menunjukkan cara membahagikan Pandas DataFrame kepada dua berdasarkan nilai lajur yang ditentukan menggunakan pengindeksan boolean.
Atas ialah kandungan terperinci Bagaimana untuk membahagikan Pandas DataFrame dengan Nilai Lajur?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!