Ajouter une colonne au DataFrame groupé dans les pandas
Lorsque vous travaillez avec des opérations GroupBy dans les pandas, il peut être avantageux d'ajouter des informations supplémentaires au résultat trame de données. Cet article explore une question concernant la manière d'ajouter efficacement une colonne à un dataframe groupé après avoir effectué des agrégations groupby.
Considérez le dataframe suivant :
df = pd.DataFrame({'c':[1,1,1,2,2,2,2],'type':['m','n','o','m','m','n','n']})
L'objectif est de compter les valeurs du colonne 'type' pour chaque valeur de 'c' et ajoutez une nouvelle colonne au dataframe groupé représentant la 'taille' de chaque groupe 'c'. Après avoir effectué l'agrégation groupby :
g = df.groupby('c')['type'].value_counts().reset_index(name='t')
la trame de données 'g' contient désormais le nombre de 'type' pour chaque 'c' :
c type t 0 1 m 1 1 1 n 1 2 1 o 1 3 2 m 2 4 2 n 2
Pour ajouter la colonne 'taille' , une option consiste à utiliser la fonction map :
a.index = a['c'] g['size'] = g['c'].map(a['size'])
Cependant, il existe une approche plus simple en utilisant la fonction de transformation :
g['size'] = df.groupby('c')['type'].transform('size')
En utilisant la transformation, la colonne de taille peut être ajoutée directement à la trame de données 'g', en alignant l'index sur la trame de données d'origine. Le dataframe résultant :
c type t size 0 1 m 1 3 1 1 n 1 3 2 1 o 1 3 3 2 m 2 4 4 2 n 2 4
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!