Comment trier les données au sein des groupes dans les Pandas DataFrames ?

Susan Sarandon
Libérer: 2024-10-20 17:27:02
original
246 Les gens l'ont consulté

How to Sort Data Within Groups in Pandas DataFrames?

Tri au sein des groupes dans pandas

Lorsque vous travaillez avec des dataframes pandas, il est souvent nécessaire de regrouper les données par colonnes spécifiques, puis d'effectuer des opérations supplémentaires au sein de ces groupes. Une exigence courante est de trier les données groupées en fonction d'un certain critère.

Pour y parvenir, la fonction groupby peut être chaînée avec la fonction sort_values. À titre d'exemple, considérons un dataframe df qui comporte un nombre de colonnes, un travail et une source.

In [167]: df

Out[167]:
   count     job source
0      2   sales      A
1      4   sales      B
2      6   sales      C
3      3   sales      D
4      7   sales      E
5      5  market      A
6      3  market      B
7      2  market      C
8      4  market      D
9      1  market      E
Copier après la connexion

Si vous souhaitez regrouper les données par travail et par source, puis trier les résultats agrégés par nombre par ordre décroissant, vous pouvez faire ce qui suit :

In [168]: df.groupby(['job','source']).agg({'count':sum})
Copier après la connexion

Cela créera un nouveau cadre de données contenant les valeurs de comptage agrégées pour chaque groupe. Cependant, la trame de données résultante ne sera pas triée par nombre. Pour trier le dataframe, vous pouvez utiliser la fonction sort_values :

In [34]: df.sort_values(['job','count'],ascending=False)
Copier après la connexion

Cela triera le dataframe par tâche d'abord, puis par nombre par ordre décroissant. Le dataframe résultant ressemblera à ceci :

Out[35]: 
   count     job source
4      7   sales      E
2      6   sales      C
1      4   sales      B
5      5  market      A
8      4  market      D
6      3  market      B
Copier après la connexion
Copier après la connexion

Pour prendre les trois premières lignes de chaque groupe, vous pouvez utiliser la fonction head :

In [34]: df.sort_values(['job','count'],ascending=False).groupby('job').head(3)
Copier après la connexion

Cela entraînera un nouveau dataframe qui contient les trois premières lignes de chaque groupe, triées par nombre par ordre décroissant.

Out[35]: 
   count     job source
4      7   sales      E
2      6   sales      C
1      4   sales      B
5      5  market      A
8      4  market      D
6      3  market      B
Copier après la connexion
Copier après la connexion

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!