Menterjemah COUNT(DISTINCT) SQL kepada Panda: Bagaimana Menggunakan Kaedah nunique()?

Barbara Streisand
Lepaskan: 2024-10-23 14:14:02
asal
459 orang telah melayarinya

Translating SQL's COUNT(DISTINCT) to Pandas: How to Use nunique() Method?

Menerjemahkan SQL's COUNT(DISTINCT) kepada Pandas Equivalents

Dalam bidang manipulasi data, Pandas telah muncul sebagai alat yang mujarab untuk mengurus jadual data. Apabila berurusan dengan sumber data yang pelbagai, seperti Oracle dan SQL Server, pengguna mungkin menghadapi cabaran untuk menterjemah pertanyaan SQL ke dalam operasi Pandas yang cekap. Satu tugas biasa melibatkan mengira bilangan nilai yang berbeza—tugas yang memerlukan "bersamaan" dengan fungsi COUNT(DISTINCT) SQL.

Untuk mencapai ini dalam Pandas, mari kita mulakan penerokaan jadual dengan lajur mewakili YEARMONTH, CLIENTCODE dan pelbagai atribut lain. Dalam SQL, mengira pelanggan yang berbeza setiap tahun boleh dicapai dengan pertanyaan berikut:

SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
Salin selepas log masuk

Pertanyaan ini menghasilkan hasil yang memaparkan kiraan pelanggan yang berbeza untuk setiap tahun. Bagaimanakah kita boleh meniru fungsi ini dalam Pandas?

Penyelesaian terletak pada penggunaan kaedah nunique():

table.groupby('YEARMONTH').CLIENTCODE.nunique()
Salin selepas log masuk

Ungkapan ini mengumpulkan data mengikut lajur YEARMONTH dan menggunakan nunique() kaedah kepada siri CLIENTCODE dalam setiap kumpulan. Hasilnya ialah DataFrame yang menyenaraikan nilai YEARMONTH bersama-sama dengan kiraan pelanggan yang berbeza untuk setiap tahun.

Untuk menggambarkan, pertimbangkan contoh jadual DataFrame bernama:

   CLIENTCODE  YEARMONTH
0           1     201301
1           1     201301
2           2     201301
3           1     201302
4           2     201302
5           2     201302
6           3     201302
Salin selepas log masuk

Menggunakan nunique( ) kaedah menghasilkan:

YEARMONTH
201301       2
201302       3
Salin selepas log masuk

Oleh itu, kaedah nunique() Pandas menyediakan kefungsian yang setara dengan COUNT(DISTINCT) SQL untuk mengira nilai yang berbeza dengan cekap dalam lajur yang ditentukan.

Atas ialah kandungan terperinci Menterjemah COUNT(DISTINCT) SQL kepada Panda: Bagaimana Menggunakan Kaedah nunique()?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!