Comment regrouper et trier des données dans des colonnes spécifiques dans un DataFrame ?

Barbara Streisand
Libérer: 2024-10-20 17:20:02
original
126 Les gens l'ont consulté

How to Group and Sort Data within Specific Columns in a DataFrame?

Pandas Groupby et tri au sein des groupes

Le regroupement d'un DataFrame par plusieurs colonnes est une tâche courante dans la manipulation de données. Cela nous permet d'agréger les données par ces colonnes et d'effectuer d'autres opérations sur les résultats agrégés. Cependant, il est souvent nécessaire de trier les résultats agrégés au sein de chaque groupe pour obtenir les lignes du haut ou du bas.

Considérez le DataFrame df fourni dans la question :

   count     job source
0      2   sales      A
1      4   sales      B
2      6   sales      C
3      3   sales      D
4      7   sales      E
5      5  market      A
6      3  market      B
7      2  market      C
8      4  market      D
9      1  market      E
Copier après la connexion

Le but est de regroupez df par colonnes de travail et de source, puis triez la colonne « nombre » par ordre décroissant dans chacun des groupes. Pour y parvenir, nous pouvons utiliser les fonctions groupby() et sort_values() comme suit :

<code class="python">df.groupby(['job', 'source'])['count'].sum().sort_values(ascending=False)</code>
Copier après la connexion

Cela triera la colonne « count » par ordre décroissant au sein de chaque groupe, fournissant le résultat suivant :

job    source       
sales  E           7
       C           6
       B           4
       D           3
       A           2
market A           5
       D           4
       B           3
       C           2
       E           1
Copier après la connexion

Cependant, si nous voulons obtenir uniquement les trois premières lignes de chaque groupe, nous pouvons utiliser la fonction head() :

<code class="python">df.groupby(['job', 'source'])['count'].sum().sort_values(ascending=False).groupby('job').head(3)</code>
Copier après la connexion

Cela nous donnera le résultat suivant :

   count     job source
4      7   sales      E
2      6   sales      C
1      4   sales      B
5      5  market      A
8      4  market      D
6      3  market      B
Copier après la connexion

En combinant les fonctions groupby(), sort_values() et head(), nous pouvons efficacement regrouper, trier et sélectionner les lignes du haut ou du bas de chaque groupe dans les pandas.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

source:php
Déclaration de ce site Web
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Derniers articles par auteur
Tutoriels populaires
Plus>
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal
À propos de nous Clause de non-responsabilité Sitemap
Site Web PHP chinois:Formation PHP en ligne sur le bien-être public,Aidez les apprenants PHP à grandir rapidement!