SQL Query Equivalent dalam Pandas menggunakan 'count(distinct)'
Dalam SQL, mengira nilai yang berbeza dalam lajur boleh dicapai menggunakan fungsi 'count(distinct)'. Contohnya, untuk mengira kod pelanggan unik setiap bulan:
<code class="sql">SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;</code>
Operasi yang serupa boleh dilakukan dalam Panda menggunakan kaedah 'nunique()' pada DataFrame berkumpulan. Dengan mengumpulkan data mengikut lajur 'YEARMONTH' dan kemudian memanggil 'nunique()' pada lajur 'CLIENTCODE', kami boleh mendapatkan bilangan pelanggan unik setiap tahun bulan.
<code class="python">table.groupby('YEARMONTH').CLIENTCODE.nunique()</code>
Contoh :
Pertimbangkan 'jadual' DataFrame yang mengandungi lajur berikut:
CLIENTCODE | YEARMONTH |
---|---|
1 | 201301 |
1 | 201301 |
2 | 201301 |
1 | 201302 |
2 | 201302 |
2 | 201302 |
3 | 201302 |
Menggunakan kod yang disebutkan di atas menghasilkan:
<code class="python">Out[3]: YEARMONTH 201301 2 201302 3</code>
Output ini sepadan dengan yang dijangkakan hasil, menunjukkan kiraan pelanggan unik untuk setiap bulan tahun.
Atas ialah kandungan terperinci Bagaimana untuk Melakukan SQL \'count(distinct)\' Setara dalam Pandas menggunakan \'nunique()\'?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!