Agrégations multiples de la même colonne à l'aide de pandas GroupBy.agg()
Problème :
Comment appliquer plusieurs fonctions d'agrégation (f1, f2) à la même colonne ("returns") dans un pandas DataFrame utilisant GroupBy.agg() sans appeler agg() plusieurs fois ?
Intuition :
Il serait pratique d'avoir une syntaxe comme :
df.groupby("dummy").agg({"returns": [f1, f2]})
Solution :
À partir de 20/06/2022, la syntaxe suivante est la pratique acceptée :
df.groupby('dummy').agg( Mean=('returns', np.mean), Sum=('returns', np.sum), )
Cette syntaxe utilise des tuples pour spécifier les paires (colonne, fonction) pour l'agrégation.
Solutions historiques :
Dans les versions antérieures de pandas, vous pouviez utiliser l'un des éléments suivants solutions :
Liste des fonctions :
df.groupby("dummy").agg({"returns": [np.mean, np.sum]})
Dictionnaire avec liste de fonctions :
df.groupby('dummy').agg({'returns': {'Mean': np.mean, 'Sum': np.sum}})
Ces solutions antérieures sont toujours valables, mais la première L'option utilisant des tuples est désormais considérée comme une bonne pratique.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!