Traduction de COUNT(DISTINCT) de SQL en Pandas : comment utiliser la méthode nunique() ?

Barbara Streisand
Libérer: 2024-10-23 14:14:02
original
460 Les gens l'ont consulté

Translating SQL's COUNT(DISTINCT) to Pandas: How to Use nunique() Method?

Traduction de COUNT(DISTINCT) de SQL en équivalents Pandas

Dans le domaine de la manipulation de données, Pandas est devenu un outil puissant pour gérer les tableaux données. Lorsqu'ils traitent diverses sources de données, telles qu'Oracle et SQL Server, les utilisateurs peuvent rencontrer des difficultés à traduire les requêtes SQL en opérations Pandas efficaces. Une tâche courante consiste à compter le nombre de valeurs distinctes, une tâche qui nécessite un « équivalent » à la fonction COUNT(DISTINCT) de SQL.

Pour y parvenir dans Pandas, lançons l'exploration d'une table avec des colonnes. représentant YEARMONTH, CLIENTCODE et divers autres attributs. En SQL, le comptage des clients distincts par an peut être effectué avec la requête suivante :

SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
Copier après la connexion

Cette requête donne un résultat qui affiche le nombre de clients distincts pour chaque année. Comment pouvons-nous reproduire cette fonctionnalité dans Pandas ?

La solution réside dans l'utilisation de la méthode nunique() :

table.groupby('YEARMONTH').CLIENTCODE.nunique()
Copier après la connexion

Cette expression regroupe les données par colonne YEARMONTH et applique la nunique() méthode à la série CLIENTCODE au sein de chaque groupe. Le résultat est un DataFrame qui répertorie les valeurs YEARMONTH ainsi que le nombre de clients distincts pour chaque année.

Pour illustrer, considérons un exemple de DataFrame nommé table :

   CLIENTCODE  YEARMONTH
0           1     201301
1           1     201301
2           2     201301
3           1     201302
4           2     201302
5           2     201302
6           3     201302
Copier après la connexion

Application du nunique( ) donne :

YEARMONTH
201301       2
201302       3
Copier après la connexion

Par conséquent, la méthode nunique() de Pandas fournit la fonctionnalité équivalente à COUNT(DISTINCT) de SQL pour compter efficacement les valeurs distinctes dans une colonne spécifiée.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!