Pertimbangkan situasi di mana anda mempunyai DataFrame dengan berbilang lajur dan anda mahu mengumpulkan baris mengikut dua lajur. Selepas mengumpulkan, anda mungkin perlu mengisih lagi hasil agregat dalam setiap kumpulan, seperti mengisih mengikut lajur kiraan dalam tertib menurun. Begini cara anda boleh mencapainya:
Untuk mengumpulkan data mengikut berbilang lajur dan kemudian mengisih dalam kumpulan, anda boleh menggabungkan fungsi groupby() dan sort_values(). Sebagai contoh, katakan anda mempunyai DataFrame dengan kiraan lajur, kerja dan sumber.
<code class="python">import pandas as pd df = pd.DataFrame({'count': [2, 4, 6, 3, 7, 5, 3, 2, 4, 1], 'job': ['sales','sales','sales','sales','sales', 'market','market','market','market','market'], 'source': ['A','B','C','D','E','A','B','C','D','E']})</code>
Untuk mendapatkan kiraan keseluruhan bagi setiap kerja dan gabungan sumber, anda boleh lakukan:
<code class="python">df.groupby(['job','source']).agg({'count':sum})</code>
Seterusnya, Untuk mengisih lajur kiraan dalam tertib menurun dalam setiap kumpulan dan mengambil hanya tiga baris teratas, anda boleh melakukan perkara berikut:
<code class="python">result = df.sort_values(['job','count'],ascending=False).groupby('job').head(3)</code>
Ini akan mengembalikan DataFrame dengan tiga baris teratas untuk setiap kumpulan kerja, diisih mengikut lajur kiraan dalam tertib menurun. DataFrame yang terhasil mungkin kelihatan seperti ini:
<code class="python">print(result) count job source 4 7 sales E 2 6 sales C 1 4 sales B 5 5 market A 8 4 market D 6 3 market B</code>
Atas ialah kandungan terperinci Bagaimana untuk Menghimpunkan Data dan Mengisih Dalam Kumpulan Menggunakan Pandas GroupBy?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!