Bagaimana Mengira Nilai Berbeza Dikumpulkan Mengikut Domain dalam Panda?

DDD
Lepaskan: 2024-10-18 15:51:03
asal
519 orang telah melayarinya

How to Count Distinct Values Grouped by Domain in Pandas?

Mengira Nilai Berbeza Dikumpulkan Mengikut Domain dalam Panda

Untuk menentukan ID pengguna unik dalam setiap domain, anda boleh menggunakan nunique() Pandas fungsi. Fungsi ini mengira bilangan nilai berbeza dalam lajur tertentu yang dikumpulkan oleh satu atau lebih lajur lain.

Dalam kes anda, anda boleh mengumpulkan data mengikut domain dan menggunakan nunique() untuk mengira nilai unik dalam ID lajur:

<code class="python">df.groupby('domain')['ID'].nunique()</code>
Salin selepas log masuk

Ini akan menghasilkan DataFrame dengan domain sebagai indeks dan kiraan ID unik untuk setiap domain sebagai nilai:

domain count
vk.com 3
twitter.com 2
facebook.com 1
google.com 1

Jika nilai domain anda mendahului atau mengekori petikan tunggal ('), anda boleh mengalih keluarnya sebelum mengumpulkan menggunakan kaedah str.strip("'"):

<code class="python">df.groupby(df.domain.str.strip("'"))['ID'].nunique()</code>
Salin selepas log masuk

Sebagai alternatif, anda boleh mengekalkan nama lajur domain dalam DataFrame output dengan menggunakan fungsi agg() dengan as_index=False:

<code class="python">df.groupby(by='domain', as_index=False).agg({'ID': pd.Series.nunique})</code>
Salin selepas log masuk

Pendekatan ini mengembalikan DataFrame dengan lajur domain dan lajur baharu bernama ID yang mengandungi kiraan ID unik untuk setiap domain.

Atas ialah kandungan terperinci Bagaimana Mengira Nilai Berbeza Dikumpulkan Mengikut Domain dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:php
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan