Pandas Equivalent: Distinct Count by Group
Apabila menggunakan Pandas sebagai alternatif pangkalan data, selalunya perlu melakukan operasi yang kompleks seperti pengiraan berbeza mengikut kumpulan. Dalam kes ini, kami ingin mengira bilangan pelanggan yang berbeza setiap bulan.
Dalam SQL, ini boleh dicapai menggunakan fungsi agregat count(distinct). Walau bagaimanapun, Pandas menyediakan sintaks yang sedikit berbeza untuk operasi ini.
Untuk mengira pelanggan yang berbeza setiap tahun bulan dalam Pandas, kami boleh menggunakan kod berikut:
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
Fungsi groupby() membahagikan DataFrame kepada kumpulan berdasarkan lajur yang ditentukan (TAHUN dalam kes ini). Fungsi nunique() kemudian mengira bilangan nilai unik dalam setiap kumpulan.
Berikut ialah contoh untuk menggambarkan:
<code class="python">import pandas as pd # Create a DataFrame with sample data data = { 'YEARMONTH': ['201301', '201301', '201301', '201302', '201302', '201302', '201302'], 'CLIENTCODE': [1, 1, 2, 1, 2, 2, 3] } table = pd.DataFrame(data) # Count distinct clients per year month result = table.groupby('YEARMONTH').CLIENTCODE.nunique() print(result)</code>
Output:
YEARMONTH 201301 2 201302 3
Sambil anda boleh lihat, hasilnya sepadan dengan output yang dijangkakan daripada pertanyaan SQL.
Atas ialah kandungan terperinci Bagaimana Mengira Nilai Berbeza mengikut Kumpulan dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!